[python] SAX

Petr Hlávka petrhlavka na gmail.com
Sobota Listopad 5 09:51:50 CET 2005


Dobrý den,

2005/11/4, Martin Blazik <martin.blazik na premiumsms.cz>:
> Cusik,
> nevite nahodou nekdo jak dotlacit xml.sax parser k tomu, aby zvladal i
> "mismatched tag"?
> Konkretne to znamena:
>
> <html>
> <body>
> </html>
> </body>
>
> nebo:
>
> <html>
> </body>
> </html>
>
> Realne XML dokumenty vypadaji jinak, jde o to, ze jsou rozlozeny v
> nekolika souborech a skladaji se az za behu. Proto samostatne nemusi byt
> XML fragmenty validni.
>

myslím si, že donutit xml parser zpracovávat dokument, který není
well-formed bude docela problém (nevidím důvod proč by to měl
zvládat). Pokud se soubory skládají za běhu, pustil bych parser až na
výslednou složeninu. Pokud se nejedná o xml dokumenty, vyzkoušel bych
jiné parsery - HTMLParser, sgmllib.

  S pozdravem Petr Hlávka.


Další informace o konferenci Python