Difference between revisions of "Unicode"
m |
m (→UTF-7: AFAIK) |
||
Line 19: | Line 19: | ||
=== UTF-7 === | === UTF-7 === | ||
− | + | Аналогично UTF-8, но все байты в строке имеют 0 в старшем разряде, что позволяет передавать текст по очень старым каналам связи, не поддерживающим передачу октетов. | |
+ | {{fixme|надеюсь, правильно}} | ||
== Юникод в Жабере == | == Юникод в Жабере == |
Revision as of 10:40, 24 August 2009
Информации мало или она отсутствует Пока в данной статье мало информации. Приносим извинения. Если вы хотите написать по теме, — . |
Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй — на номер символа на странице.
Аббревиатура UTF рашифровывается как Unicode Transformation Format — формат Юникодного преобразования.
Contents
Модификации
Unicode
Собственно Юникод. Строго 2 байта на символ (для программной обработки текстов).
UTF-8
От 1 до 4 байт на символ. Для символов латиницы получается по одному байту на символ, для русских и "европейских" (расширенная латиница) — по два. 3 и 4 байта — для языков народов Азиатско-Тихоокеанского региона. Применяется, в основном, для хранения передачи текста по каналам связи.
UTF-16
от 2 до ? байт.
UTF-32
?
UTF-7
Аналогично UTF-8, но все байты в строке имеют 0 в старшем разряде, что позволяет передавать текст по очень старым каналам связи, не поддерживающим передачу октетов.Проверить: надеюсь, правильно
Юникод в Жабере
В Жабере для передачи любой текстовой информации должен применяться UTF-8.