Python, Čeština a Unicode

cz.png

Každý národ má menší nebo větší starosti se správným fungováním svého jazyka na klávesnici i obrazovce. U nás jsou to nabodeníčka, tedy háčky, čárky. Python klade důraz na to, aby pythonovské programy s češtinou fungovaly správně ve všech prostředích a platformách.

Různé druhy kódování

py30.png py25.png

Historicky zde máme několik druhů kódování (výběr):

  • ASCII
  • Windows (cp1250)
  • Latin2 (cp852)
  • ISO 8859-2 (iso-8859-2)
  • UTF8 (utf-8)

Neexistuje "čistý" text

V počítači neexistuje "čistý" text; text, který by nebyl v žádném kódování, který by nebyl nějak zakódován. I tento cisty text bez hacku a carek, ulozeny nekde na disku, je v nejakem kodovani, nejcasteji ASCII. To že se vám správně zobrazuje vždy a všude, tak to je tím, že používá jen 127 bytů znakové tabulky (ASCII), která byla první a všechny další nové kódování ji většinou zachovávají, používají a přidávají si k ní další své znaky.

Srovnání práce s češtinou ve verzích Python 2.x a 3.x

subtopics: