[python] Problem s unicode.
Vaclav Hula
ax na natur.cuni.cz
Pondělí Duben 14 11:18:08 CEST 2008
Jan Vrana napsal(a):
>> "šetření bajtíků stylem po nás potopa", jaká způsobilo problém třeba >
>> roku 2000, a tatáž pitomost zamotala Unicode natolik, že ten bordel >
>> je teď dost veliký. Takže pro asijské jazyky se převádějí znaky do
>> Unicode přes proces zvaný "han unification"
> [Honza Vrana]
> Pokud tomu dobre rozumim tak neslo ani o setreni bajtiku tech by snad
> pri 31 bitech na znak mohlo byt dost ale o to ze nejaky "chytrak" v
> ramci uklidu sjednotil znaky ktere se mu jevily podobne jako kdyby nam
> nekdo sjednotil treba nase i s teckou a carkou.
No to trochu prehanis, sjednoceny byly graficky odlisne znaky se shodnym
vyznamem. Lepsi priklad mi prijde jako kdyby Nemci psali porad
svabachem, ale v unicode nebyl odlisny znak pro "A" a "svabachove A" -
protoze je to hlaska "a" a rozliseni se da delat fontem. Plus teda
spousta mene pouzivanych znaku v unicode chybi, zejmena starsi
nabozenske a poeticke texy maji v unicode smulu - ale i nektere stale
(byt mene) pouzivane znaky.
Navic maji mnozi z CJK pocit, ze na ne byla unifikace v unicode uvalena
systemem "o nas bez nas", ackoliv byli jejich zastupci v unicode
kosorciu aktivni od zacatku. Japonsky zastupce (zamestnanec tusim DECu,
tedy americke fimy a vyrazneho zastance unifikace) hlasoval pro
unifikaci, korejci a cinani proti. Cela politicka stranka tehle
zalezitosti je neprehledna a alespon trochu masla na hlave maji vsichni.
S pozdravem,
Ax
Další informace o konferenci Python