[python] Pomoc s pythonním RE

Bystroushaak bystrousak na kitakitsune.org
Pátek Březen 31 13:33:02 CEST 2017


> Takze pokud chces smysluplny reseni, bylo by lepsi napsat jakej 
> problem skutecne resis

No, to je právě to. Mám vlastní HTML parser
(https://github.com/Bystroushaak/pyDHTMLParser), u kterého jsem nedávno
zjistil podstatný bug - pokud je v javascript stringu na stránce vložené
html, parser se úžasným stylem rozbije.

Zatím jsem nepřišel na to jak to opravit, jediné co mě napadlo je že
obsah <script></script> nahradím nějakým dostatečně náhodným stringem,
přičemž si ho někam odložím.

Až pak parser zpracuje zbytek DOMu, vrátím to do prázdného <script> tagu
v postprocessingu.




Další informace o konferenci Python