[python] Problem s unicode.
superman
feed na centrum.cz
Čtvrtek Duben 10 19:03:49 CEST 2008
>Pri cteni mne napada otazka jak tedy psat programy?
Prostě Unicode nevyřešilo co mělo řešit. Ale alespoň udělalo jednu věc,
že osekalo počet nutných znakových sad, které potřebujete k tomu plně
vyjádřit pro všechny znaky - když jako jednu vezmete Unicode, pak pár
asijských znakových sad a plus pár drobotin, tak de facto s pěti až
deseti znakovými sadami vystačíte.
Já osobně to řeším tak, že Unicode znaky mám 31 bitového a do horního
prostoru si namapuji ty znaky, které se nevejdou do Unicode - ale
předpokládá to svoje Unicode řešení. Pak mi můj "extended Unicode"
string opravdu přenese vše.
Jinak UTF-8 technicky dokáže zobrazit myslím až 36 bitové znaky (pouze
normou je to omezené dříve na 32, později na 21 bitů, ale to je jen
papírové omezení, nikoli omezení UTF-8 algoritmu), takže UTF-8 uloží i
mojí "extended Unicode" sadu a ještě má velké rezervy.
Miloslav Ponkrác
Další informace o konferenci Python