Python, Čeština a Unicode
Každý národ má menší nebo větší starosti se správným fungováním svého jazyka na klávesnici i obrazovce. U nás jsou to nabodeníčka, tedy háčky, čárky. Python klade důraz na to, aby pythonovské programy s češtinou fungovaly správně ve všech prostředích a platformách.
Různé druhy kódování
Historicky zde máme několik druhů kódování (výběr):
- ASCII
- Windows (cp1250)
- Latin2 (cp852)
- ISO 8859-2 (iso-8859-2)
- UTF8 (utf-8)
Neexistuje "čistý" text
V počítači neexistuje "čistý" text; text, který by nebyl v žádném kódování, který by nebyl nějak zakódován. I tento cisty text bez hacku a carek, ulozeny nekde na disku, je v nejakem kodovani, nejcasteji ASCII. To že se vám správně zobrazuje vždy a všude, tak to je tím, že používá jen 127 bytů znakové tabulky (ASCII), která byla první a všechny další nové kódování ji většinou zachovávají, používají a přidávají si k ní další své znaky.