[python] xml parsování

Petr Messner petr.messner na gmail.com
Úterý Srpen 13 13:05:45 CEST 2019


Jak jako vadný tag? Potom to není XML.

Na HTML použij HTML parser. 

Petr Messner

13. 8. 2019 v 11:30, Ondrej Beranek <rainbof na gmail.com>:

> Ahoj,
> 
> když jste to tu tak nakousli, když bych chtěl zpracovávat xml streamy
> předem neznámého obsahu, co na to použít ? Potřebuju aby se to
> nesložilo když přijde nějaký vadný tag abych měl šanci si to ošetřit.
> Tak než začnu psát kolo...
> 
> rainbof
> 
> 13.08.19, Petr Messner <petr.messner na gmail.com>:
>> V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.
>> 
>> PM
>> 
>> út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek <Ctibor.Plasek na seznam.cz>
>> napsal:
>> 
>>> Ahoj.
>>> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
>>> Pro ty hodnoty, které jsou u <stream používám toto:
>>> 
>>> from xml.dom import minidom
>>> xmldoc = minidom.parse('RainS02E06.mkv.xml')
>>> streamlist = xmldoc.getElementsByTagName('stream')
>>> for s in streamlist:
>>>    print(s.attributes['index'].value)
>>>    print(s.attributes['codec_name'].value)
>>>    try:
>>>        print(s.attributes['sample_rate'].value)
>>>    except:
>>>        print('none')
>>> 
>>> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
>>> <tag key="DURATION-eng" - jaká je např.hodnota value u stream index="1"
>>> 
>>> Mohli byste mi, prosím, poradit?
>>> 
>>> Děkuji Ctibor
>>> 
>>> 
>>> 
>>> 
>>> _______________________________________________
>>> Python mailing list
>>> python na py.cz
>>> http://www.py.cz/mailman/listinfo/python
>>> 
>>> Visit: http://www.py.cz
>>> 
>> 
> _______________________________________________
> Python mailing list
> python na py.cz
> http://www.py.cz/mailman/listinfo/python
> 
> Visit: http://www.py.cz


Další informace o konferenci Python