Unicode
Информации мало или она отсутствует Пока в данной статье мало информации. Приносим извинения. Если вы хотите написать по теме, — . |
Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй — на номер символа на странице.
Аббревиатура UTF рашифровывается как Unicode Transformation Format — формат Юникодного преобразования.
Contents
Модификации
Unicode
Собственно Юникод. Строго 2 байта на символ (для программной обработки текстов).
UTF-8
От 1 до 4 байт на символ. Для символов латиницы получается по одному байту на символ, для русских и "европейских" (расширенная латиница) — по два. 3 и 4 байта — для языков народов Азиатско-Тихоокеанского региона. Применяется, в основном, для хранения передачи текста по каналам связи.
UTF-16
от 2 до ? байт.
UTF-32
?
UTF-7
?
Юникод в Жабере
В Жабере для передачи любой текстовой информации должен применяться UTF-8.