[python] unicode
ViNiL
vinil na zagamma.cz
Pondělí Říjen 31 15:23:08 CET 2005
Petr Prikryl píše v Po 31. 10. 2005 v 14:31 +0100:
> Parametr sys.maxunicode uvádí maximální hodnotu
> kódu znaku, jakou umí Python vnitřně uložit. Neříká
> asi nic o kódování ve vnějším souboru.
Vzhledem k tomu, ze to byla reakce na poznamku o tom, jak jsou kde
zkompilovane Pythony, tak je to v poradku ;-)
> Dvoubajtové znaky budou v drtivé většině případů asi
> stačit -- viz dříve zmíněný odkaz:
Proc to stale opakovat do kola?
Ano, vetsine evropanu staci 2 bajty. Vetsine americanu staci 7 bitu.
Vetsine webovych surfaru staci stranky "optimalizovane" pro Internet
Explorer. A vetsine lidi staci heterosexualni manzelstvi.
Je to otazka jednoho kazdeho autora, kolik je do sveho dila
ochoten/schopen investovat prace "navic" a neomezovat okruh
(potencialnich) uzivatelu.
> Implementační problém s "čínštinou" nastane tedy jen v případě,
> kdy fyzicky spoléháme na to, že jeden znak zabírá v souboru
> přesně dva bajty. Bude to problém chybného předpokladu o počtu
> bajtů na znak v souboru, nikoliv problém samotného kódování
> Unicode.
Coz je u dotazu na zaruceni pevne sirky znaku vada dosti podstatna.
Taky bych opatrneji zachazel s terminem "kodovani Unicode."
Uf, tak si nejsem jist, jestli to melo byt zaverecne shrnuti nebo
zmateni ;-)))
--
ViNiL, ultimativní opravář komínů
Další informace o konferenci Python