<div dir="ltr">tak spatny xml se obcas prihodi, kdyz to nejakej jouda generuje nejak obskurne, nebo se ti usekne stream nebo nevimcoeste.... lxml ucrite umi podoktorovat html, mozna i xml....<br clear="all"><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature">---<br><font color="#c0c0c0"><font size="1">In Perl you shoot yourself in the foot, but nobody can understand how you did it. Six months later, neither can you.</font></font> | print 'aknerats'[::-1]</div></div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Aug 13, 2019 at 1:06 PM Petr Messner <<a href="mailto:petr.messner@gmail.com">petr.messner@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Jak jako vadný tag? Potom to není XML.<br>
<br>
Na HTML použij HTML parser. <br>
<br>
Petr Messner<br>
<br>
13. 8. 2019 v 11:30, Ondrej Beranek <<a href="mailto:rainbof@gmail.com" target="_blank">rainbof@gmail.com</a>>:<br>
<br>
> Ahoj,<br>
> <br>
> když jste to tu tak nakousli, když bych chtěl zpracovávat xml streamy<br>
> předem neznámého obsahu, co na to použít ? Potřebuju aby se to<br>
> nesložilo když přijde nějaký vadný tag abych měl šanci si to ošetřit.<br>
> Tak než začnu psát kolo...<br>
> <br>
> rainbof<br>
> <br>
> 13.08.19, Petr Messner <<a href="mailto:petr.messner@gmail.com" target="_blank">petr.messner@gmail.com</a>>:<br>
>> V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.<br>
>> <br>
>> PM<br>
>> <br>
>> út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek <<a href="mailto:Ctibor.Plasek@seznam.cz" target="_blank">Ctibor.Plasek@seznam.cz</a>><br>
>> napsal:<br>
>> <br>
>>> Ahoj.<br>
>>> Mám takovýto xml soubor (viz.přiložený soubor) - export z ffprobe.<br>
>>> Pro ty hodnoty, které jsou u <stream používám toto:<br>
>>> <br>
>>> from xml.dom import minidom<br>
>>> xmldoc = minidom.parse('RainS02E06.mkv.xml')<br>
>>> streamlist = xmldoc.getElementsByTagName('stream')<br>
>>> for s in streamlist:<br>
>>> print(s.attributes['index'].value)<br>
>>> print(s.attributes['codec_name'].value)<br>
>>> try:<br>
>>> print(s.attributes['sample_rate'].value)<br>
>>> except:<br>
>>> print('none')<br>
>>> <br>
>>> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.<br>
>>> <tag key="DURATION-eng" - jaká je např.hodnota value u stream index="1"<br>
>>> <br>
>>> Mohli byste mi, prosím, poradit?<br>
>>> <br>
>>> Děkuji Ctibor<br>
>>> <br>
>>> <br>
>>> <br>
>>> <br>
>>> _______________________________________________<br>
>>> Python mailing list<br>
>>> <a href="mailto:python@py.cz" target="_blank">python@py.cz</a><br>
>>> <a href="http://www.py.cz/mailman/listinfo/python" rel="noreferrer" target="_blank">http://www.py.cz/mailman/listinfo/python</a><br>
>>> <br>
>>> Visit: <a href="http://www.py.cz" rel="noreferrer" target="_blank">http://www.py.cz</a><br>
>>> <br>
>> <br>
> _______________________________________________<br>
> Python mailing list<br>
> <a href="mailto:python@py.cz" target="_blank">python@py.cz</a><br>
> <a href="http://www.py.cz/mailman/listinfo/python" rel="noreferrer" target="_blank">http://www.py.cz/mailman/listinfo/python</a><br>
> <br>
> Visit: <a href="http://www.py.cz" rel="noreferrer" target="_blank">http://www.py.cz</a><br>
_______________________________________________<br>
Python mailing list<br>
<a href="mailto:python@py.cz" target="_blank">python@py.cz</a><br>
<a href="http://www.py.cz/mailman/listinfo/python" rel="noreferrer" target="_blank">http://www.py.cz/mailman/listinfo/python</a><br>
<br>
Visit: <a href="http://www.py.cz" rel="noreferrer" target="_blank">http://www.py.cz</a><br>
</blockquote></div>