[python] Pomoc s pythonním RE
Bystroushaak
bystrousak na kitakitsune.org
Pátek Březen 31 13:33:02 CEST 2017
> Takze pokud chces smysluplny reseni, bylo by lepsi napsat jakej
> problem skutecne resis
No, to je právě to. Mám vlastní HTML parser
(https://github.com/Bystroushaak/pyDHTMLParser), u kterého jsem nedávno
zjistil podstatný bug - pokud je v javascript stringu na stránce vložené
html, parser se úžasným stylem rozbije.
Zatím jsem nepřišel na to jak to opravit, jediné co mě napadlo je že
obsah <script></script> nahradím nějakým dostatečně náhodným stringem,
přičemž si ho někam odložím.
Až pak parser zpracuje zbytek DOMu, vrátím to do prázdného <script> tagu
v postprocessingu.
Další informace o konferenci Python