[python] unicode

Martin Blazik martin.blazik na premiumsms.cz
Čtvrtek Říjen 27 15:23:22 CEST 2005


No neni, UTF-8 uklada kazdy znak do promenne delky (1 az 3 znaky 
myslim). Ja chci aby se kazdy znak prelozil presne na dva bajty 
(potrebuju aby z dat sla primo poznat delka retezce).
Takze u'\uFEFFAhoj' => '\xff\xfe\x41\x00\x68\x00\x6f\x00\x6a\x00'

lachtan

geon napsal(a):

> Martin Blazik napsal(a):
>
>> Cau,
>> jakym zpusobem muzu prevest unicode string do bytove reprezentace 
>> (retezcove podoby) tak, abych data mohl ulozit do souboru (rekneme v 
>> notaci little endian)?
>> Tu prevodni funkci si dokazu napsat sam na par radek, spis by me 
>> zajimalo, jestli uz neexistuje v pythonu nejaky standartni nastroj. 
>> Zkousel jsem najit nejaky default konvertor 
>> (http://python.org/doc/2.4.2/lib/standard-encodings.html#standard-encodings), 
>> ale taky nic nebo ho jen nevidim :)
>>
>>  
>>
> tutorial:
>
> To convert a Unicode string into an 8-bit string using a specific 
> encoding, Unicode objects provide an encode() method that takes one 
> argument, the name of the encoding. Lowercase names for encodings are 
> preferred.
>
>>>> u"äöü".encode('utf-8')
>>>
> '\xc3\xa4\xc3\xb6\xc3\xbc'
>
>
> je to ono?
>



Další informace o konferenci Python