> Chtěl bych to udělat systémově, než na ten vstup poštvat 50x replace.
Jestli tím replace myslíš decode :-), tak to jde, v modulu codecs je
wrapper nad voláním open() který provádí transparentní překódování:
In [21]: codecs.open("test","r", "utf8").read()
Out[21]: u'\u0161\u010d\u0159\u017e\n'