Unicode

From JaWiki (Jabber/XMPP wiki)
Revision as of 10:40, 24 August 2009 by Vindicar (Talk | contribs) (UTF-7: AFAIK)

Jump to: navigation, search

Информации мало или она отсутствует

Пока в данной статье мало информации. Приносим извинения.

Если вы хотите написать по теме, — сделайте это.

Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй — на номер символа на странице.

Аббревиатура UTF рашифровывается как Unicode Transformation Format — формат Юникодного преобразования.

Модификации

Unicode

Собственно Юникод. Строго 2 байта на символ (для программной обработки текстов).

UTF-8

От 1 до 4 байт на символ. Для символов латиницы получается по одному байту на символ, для русских и "европейских" (расширенная латиница) — по два. 3 и 4 байта — для языков народов Азиатско-Тихоокеанского региона. Применяется, в основном, для хранения передачи текста по каналам связи.

UTF-16

от 2 до ? байт.

UTF-32

?

UTF-7

Аналогично UTF-8, но все байты в строке имеют 0 в старшем разряде, что позволяет передавать текст по очень старым каналам связи, не поддерживающим передачу октетов.Question.gifПроверить: надеюсь, правильно

Юникод в Жабере

В Жабере для передачи любой текстовой информации должен применяться UTF-8.

Ссылки