[python] xml a utf8
Martin Hassman
martin.hassman na vscht.cz
Pátek Duben 25 16:51:34 CEST 2003
On 25 Apr 2003 at 15:24, Petr Vaněk wrote:
> parsuji jednoduchy xml soubor pres xml.parser.expat.
> je-li v zahlavi xml uvedena znakova sada iso8859-2 a
> znaky jsou taktez stejne kodovany, probehne parsing
> v poradku. je-li ale vse v utf8 ->
> xml.parsers.expat.ExpatError: not well-formed (invalid token): line 3, column
> 19
> kterezto koordinaty ukazuji na prvni vyskyt nonASCII znaku.
>
> co prehlizim?
>
Tak ja s timhle problemy nemam.
Viz prikladek, kde dokument vlastne ani poradne neparsuji, jen kontroluji
expatem, zda je well formed, tomu uft-8 a ceske znaky nevadi.
Pro otestovani na:
http://biomikro.vscht.cz/maldiman/hassmanm/tmp/RSSreader.py
(nacte rss z http://biomikro.vscht.cz/maldiman/hassmanm/tmp/czilla.html)
otestuje, zda je well-formed a pokud ano, tak ho ulozi.
Ale jak na to koukam, zkusil bych misto utf8 napsat utf-8, v tom by mohl
byt zakopany kanon.
martin
--
Martin Hassman
Institute of Chemical Technology in Prague
Department of Biochemistry and Microbiology
Jaky Internetovy prohlizec pouzivat? Zkuste Mozillu http://czilla.cz
Jabber: hassmanm na njs.netlab.cz, ICQ: #295399122
Další informace o konferenci Python