[python] detektor znakove sady
Martin Blazik
martin.blazik na premiumsms.cz
Středa Srpen 1 16:35:20 CEST 2007
Ahoj,
hledam knihovnu, ktera by dokazala rozpoznat kodovani retezce. Podarilo
se mi najit akorat
http://chardet.feedparser.org/
ale to na muj vkus nevykazuje dostatecne vysledky:
# psano v konozli v ISO-8859-2
>>> s = 'příąerně ľlu»oučký kůň úpěl ďábelské ódy PŘÍ©ERĚ ®LU«OUČKÝ KŮŇ
ÚPĚL ĎÁBELSKÉ ÓDY'
>>> chardet.detect(s)
{'confidence': 0.40226801246065391, 'encoding': 'ISO-8859-8'}
Nemate nekdo nejaky tip?
lachtan
Daląí informace o konferenci Python