[python] [:lower:] apod.?
Alexandr Rosen
alexandr.rosen na ff.cuni.cz
Středa Leden 30 18:38:39 CET 2008
> re.sub(r'\n(%s)' % re_lower, r'\1', x)
Diky!
> re_lower = ur'[%s]' % string.lowercase.decode('cp1250')
Taky dik!
Ale jestli muzu, mel bych jeste dva dotazy:
1. Jak udelat, aby v tom re_lower byly vsecky lowercase znaky z
UTF-8? Tedy nejen ty z cp1250 nebo iso-8859-2, ale i iso-8859-1,
iso-8859-5 (cyrilice), rectina, to by mozna uz stacilo... Spojit ty
stringy a vyhodit duplicity? Nebo by to slo nejak jednodusejs?
2. Jak udelat, abych vstupni soubor v utf-8 nacet opravdu jako utf8 string?
Další informace o konferenci Python