home contents changes index options help subscribe

Python, Čeština a Unicode

Každý národ má menší nebo větší starosti se správným fungováním svého jazyka na klávesnici i obrazovce. U nás jsou to nabodeníčka, tedy háčky, čárky. Python klade důraz na to, aby pythonovské programy s češtinou fungovaly správně ve všech prostředích a platformách.

Různé druhy kódování

Historicky zde máme několik druhů kódování (výběr):

ASCII
Windows (cp1250)
Latin2 (cp852)
ISO 8859-2 (iso-8859-2)
UTF8 (utf-8)

Neexistuje "čistý" text

V počítači neexistuje "čistý" text; text, který by nebyl v žádném kódování, který by nebyl nějak zakódován. I tento cisty text bez hacku a carek, ulozeny nekde na disku, je v nejakem kodovani, nejcasteji ASCII. To že se vám správně zobrazuje vždy a všude, tak to je tím, že používá jen 127 bytů znakové tabulky (ASCII), která byla první a všechny další nové kódování ji většinou zachovávají, používají a přidávají si k ní další své znaky.

PythonUnicodeCestina

Python, Čeština a Unicode

Různé druhy kódování

Neexistuje "čistý" text

Srovnání práce s češtinou ve verzích Python 2.x a 3.x

subtopics: