Re: [python] Unicode řetězce

Radim Novotny r.novotny na elektrika.cz
Pondělí Únor 6 17:52:08 CET 2006


Zkuste se kouknout sem (to je to Wiki):

http://www.py.cz/UnicodeEncodeCestina
http://www.py.cz/VJakemKodovaniJeSouborUlozen

Zakladem je vedet, v jakem kodovani je vstup - to se da zjistit velmi
tezko. Pak je vhodne prevest vstup do unicode a v programu pracovat
pouze s unicode, protoze v unicode ma kazdy znak stejnou delku. Takze
treba
>>> s = u"ěščřž"
>>> len(s)
5
>>> s = "ěščřž" (vstup je v utf-8)
>>> len(s)
10

Pri vystupu na uzivatele uz zase musite znaku zakodovat do
pozadovaneho kodovani.

On 2/6/06, Radek Kubicek <xkubic23 na stud.fit.vutbr.cz> wrote:
> A hlavne co potrebuji, aby tak sel parsovat jakykoliv vstup. Ty retezce
> totiz vetsinou nebudou do programu zadavany pomoci u"retezec", ale
> pomoci nejakych dialogu a okynek. Cili potrebuji nejaky jednoduchy
> prevod do unicode kodovani a potom zpet vypis spravnym kodovanim na
> konzoli i do gui.
>
> Ve vetsine pripadu jsem totiz narazil jen na to, ze byly retezce
> predavany pomoci u"". BTW, lze nejak prevest retezec predany do fce
> pomoco parametru na unicode? zkousel jsem u""+string, ale nejak to
> nefunguje :-(
>
> Doufam, ze jsem to napsal alespon trosku pochopitelne.
> _______________________________________________
> Python mailing list
> Python na py.cz
> http://www.py.cz/mailman/listinfo/python
>


--
Radim Novotny
+420 776 122 997


Další informace o konferenci Python