RaptureXML Problems parsing a certain rss feed

NupsNishKib · Mar 20, 2013

I'm trying to parse a certain rss feed of a popular german news site (taz.de). Unfortunately, their description tag doesn't only contain plain text but a mixture of anything, including pictures, links etc.\[code\]<description> <![CDATA[<a href="http://www.taz.de/10-Jahre-nach-dem-Irakkrieg/!113046/"><img align="left" style="margin-right:5px;" src="http://stackoverflow.com/uploads/images/152x76/18032013_Bush_Irakkrieg_rtr.jpg" border="0" width="152" height="76" /></a>Das Land ist von einem funktionierenden Rechtsstaat weit entfernt. Zehn Jahre nach dem Irakkrieg zeigt sich eine niederschmetternde Bilanz. <a href="http://www.taz.de/10-Jahre-nach-dem-Irakkrieg/!113046/">mehr...</a>]]></description>\[/code\]The only thing I'm interested in is the text "Das Land ist von einem funktionierenden Rechtsstaat weit entfernt. Zehn Jahre nach dem Irakkrieg zeigt sich eine niederschmetternde Bilanz." How would I do that in an efficient way (without terrible string operations)? Since there is no attribute name, I guess I'm screwed? I'm using RaptureXML but if there's a better library for this problem, I'd switch the xml parser.Thanks!

RaptureXML Problems parsing a certain rss feed

NupsNishKib

New Member