Навигация
Главная
Поиск
Форум
FAQ's
Ссылки
Карта сайта
Чат программистов

Статьи
-Delphi
-C/C++
-Turbo Pascal
-Assembler
-Java/JS
-PHP
-Perl
-DHTML
-Prolog
-GPSS
-Сайтостроительство
-CMS: PHP Fusion
-Инвестирование

Файлы
-Для программистов
-Компонеты для Delphi
-Исходники на Delphi
-Исходники на C/C++
-Книги по Delphi
-Книги по С/С++
-Книги по JAVA/JS
-Книги по Basic/VB/.NET
-Книги по PHP/MySQL
-Книги по Assembler
-PHP Fusion MOD'ы
-by Kest
Professional Download System
Реклама
Услуги

Автоматическое добавление статей на сайты на Wordpress, Joomla, DLE
Заказать продвижение сайта
Программа для рисования блок-схем
Инженерный калькулятор онлайн
Таблица сложения онлайн
Популярные статьи
OpenGL и Delphi... 65535
Форум на вашем ... 65535
HACK F.A.Q 65535
Бип из системно... 65535
Гостевая книга ... 65535
Invision Power ... 65535
Содержание сайт... 65535
Организация зап... 65535
Вызов хранимых ... 65535
Программируемая... 65535
Эмулятор микроп... 65535
Подключение Mic... 65535
Создание потоко... 65535
Приложение «Про... 65535
Оператор выбора... 65535
Создание отчето... 65105
Модуль Forms 64887
Пример работы с... 63356
ТЕХНОЛОГИИ ДОСТ... 61584
Имитационное мо... 57448
Реклама
Сейчас на сайте
Гостей: 4
На сайте нет зарегистрированных пользователей

Пользователей: 13,081
новичок: Abdukarimov A
Новости
Реклама
Выполняем курсовые и лабораторные по разным языкам программирования
Подробнее - курсовые и лабораторные на заказ
Delphi, Turbo Pascal, Assembler, C, C++, C#, Visual Basic, Java, GPSS, Prolog, 3D MAX, Компас 3D
Заказать программу для Windows Mobile, Symbian

Моделирование работы узла коммутации сообщений на GPSS + Пояснительная з...
Обучающая и тестирующая программа по здаче экзамена ПДД на Turbo Pascal ...
Моделирование литейного цеха на GPSS + Пояснительная записка

Реклама



Подписывайся на YouTube канал о программировании, что бы не пропустить новые видео!

ПОДПИСЫВАЙСЯ на канал о программировании
Тип данных char
Тип данных char служит для представления отдельных символов. Чаще всего это символьные константы. Например, символьной константой является !А', которой соответствует числовое значение 65. Не следует путать символ 'А1 со строкой "А", состоящей из одного символа. Кодовые единицы уникода (Unicode) могут быть представлены шестнадцатеричными числами в пределах от \u0000 до \uFFFF. Например, значение \u2122 соответствует символу торговой марки (™), а значение \u03C0 — греческой букве п.
Кроме префикса \и, который предваряет кодовую единицу в уникоде, существует также несколько специальных управляющих последовательностей символов, приведенных табл. 3.3. Эти управляющие последовательности можно вводить в символьные константы или строки, например f\u2122f или "Не11о\п". Управляющие последовательности, начинающиеся с префикса \и (и никакие другие), можно даже указывать за пределами символьных констант или строк, заключаемых в кавычки. Приведенная ниже строка кода вполне допустима, потому что последовательности \u005B и \u005D соответствуют кодировке символов [ и ].
public static void main(String\u005B\u005D args)

Таблица 3.3. Управляющие последовательности специальных символов
















































Управляющая



Назначение



Значение в
уникоде



последовательность


 


 







Возврат на
одну позицию





\u0008



\t



Табуляция





\u0009



\п



Переход на
новую строку





\u000a





Возврат
каретки





\u000d



\"



Двойная
кавычка





\u0022



V



Одинарная
кавычка





\u0027



\\



Обратная косая
черта





\u005c



 


Для того чтобы полностью уяснить тип char, нужно иметь ясное представление о принципах кодировки уникода. Кодировка уникода была изобретена для преодоления ограничений традиционных кодировок символов. До появления уникода существовало несколько различных стандартных кодировок: ASCII, ISO 8859-1, KOI-8, GB18030, BIG-5 и т.д. При этом возникали два затруднения. Во-первых, один и тот же код в различных кодировках соответствовал разным символам. Во-вторых, в языках с большим набором символов использовался код различной длины: часто употребляющиеся символы представлялись одним байтом, а остальные символы — двумя, тремя и большим количеством байтов.
Для разрешения этих затруднений была разработана кодировка уникода. В результате исследований, начавшихся в 1980-х годах, выяснилось, что двухбайтового кода более чем достаточно для представления всех символов, использующихся во всех языках мира. И еще оставался достаточный резерв для любых мыслимых расширений. В 1991 году была выпущена спецификация Unicode 1.0, в которой использовалось меньше половины из возможных 65536 кодов. В Java изначально были приняты 16-разрядные символы уникода, что дало ему еще одно преимущество над другими языками программирования, где используются 8-разрядные символы.
Но впоследствии случилось непредвиденное: количество символов превысило допустимый для кодировки предел 65536. Причиной тому стали чрезвычайно большие наборы иероглифов китайского, японского и корейского языков. Поэтому в настоящее время 16-разрядного типа char недостаточно для описания всех символов уникода.
Для того чтобы стало понятнее, каким образом данное затруднение разрешается в Java, начиная с версии Java SE 5.0, необходимо ввести ряд терминов. В частности, кодовой точкой называется значение, связанное с символом в кодировке. Согласно стандарту на уникод, кодовые точки записываются в шестнадцатеричной форме и предваряются символами и+. Например, кодовая точка латинской буквы А равна
U+0041


. В уникоде кодовые точки объединяются в 17 кодовых плоскостей. Первая кодовая плоскость, называемая основной многоязыковой плоскостью, состоит из "классических" символов уникода с кодовыми точками от U+0000 до U+FFFF. Шестнадцать дополнительных плоскостей с кодовыми точками от U+10000 до U+10FFFF содержат дополнительные символы.
Кодировка UTF-16это способ представления в уникоде всех кодовых точек кодом переменной длины. Символы из основной многоязыковой плоскости представляются 16-битовыми значениями, называемыми кодовыми единицами. Дополнительные символы обозначаются последовательными парами кодовых единиц. Каждое из значений кодируемой подобным образом пары попадает в область 2048 неиспользуемых значений из основной многоязыковой плоскости. Эта так называемая область подстановки простирается в пределах от U+D800 до U+DBFF для первой кодовой единицы и от U+DC00 до U+DFFF для второй кодовой единицы. Такой подход позволяет сразу определить, соответствует ли значение коду конкретного символа или является частью кода дополнительного символа. Например, математическому коду символа О, обозначающего множество октонионов, соответствует кодовая точка U+1D546 и две кодовые единицы — U+D835 и U+DD46 (с описание алгоритма кодировки UTF-16 можно ознакомиться, обратившись по адресу http://ru.wikipedia.org/wiki/UTF-16).
В Java тип char описывает кодовую единицу в кодировке UTF-16. Начинающим программировать на Java рекомендуется пользоваться кодировкой UTF-16 лишь в случае крайней необходимости. Старайтесь чаще пользоваться символьными строками как абстрактными типами данных (подробнее о них речь пойдет ниже, в разделе "Символьные строки").
Опубликовал Kest November 18 2014 03:36:02 · 0 Комментариев · 2244 Прочтений · Для печати

• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •


Комментарии
Нет комментариев.
Добавить комментарий
Имя:



smiley smiley smiley smiley smiley smiley smiley smiley smiley
Запретить смайлики в комментариях

Введите проверочный код:* =
Рейтинги
Рейтинг доступен только для пользователей.

Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.

Нет данных для оценки.
Гость
Имя

Пароль



Вы не зарегистрированны?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.
Поделиться ссылкой
Фолловь меня в Твиттере! • Смотрите канал о путешествияхКак приготовить мидии в тайланде?
Загрузки
Новые загрузки
iChat v.7.0 Final...
iComm v.6.1 - выв...
Visual Studio 200...
CodeGear RAD Stud...
Шаблон для новост...

Случайные загрузки
База англоязычных...
Animated Menus
Библия хакера 2. ...
Архив Апгрейтов с...
Правила программи...
Пятнашки и крести...
С/C++ Программиро...
Добавление басса ...
PHP 5 для "чайников"
Indy in Depth Глу...
Zoom [Исходник на...
SMLPack v1.0
Delphi World 6.0
Иллюстрированный ...
Дарахвелидзе П., ...
CoolHints2k v1.03
Отключение и вклю...
ZipTV
Игра PackMan
DelphiX

Топ загрузок
Приложение Клие... 100466
Delphi 7 Enterp... 86653
Converter AMR<-... 20077
GPSS World Stud... 12670
Borland C++Buil... 11760
Borland Delphi ... 8560
Turbo Pascal fo... 7037
Visual Studio 2... 4998
Калькулятор [Ис... 4763
FreeSMS v1.3.1 3541
Случайные статьи
Панель управления ...
Выделение текста
Службы ISDN
Режимы экспозиции ...
«Вычитание» подстр...
Шаг к реализации с...
Экспертная система
Способен ли сервер...
Использование стра...
Предварительная по...
Сетевые эмуляторы
9x/NT не установле...
Установка CMS Word...
Подготовка файла A...
Использование XHTM...
AVL-деревья
Элементы управлени...
WDTABLE (РАЗНОСТНА...
Они могли произойт...
Задачи, стоящие пе...
Опции публикации
Как решить проблем...
Принцип подстановки
Бинарный поиск и п...
Как правильно выбр...
Статистика



Друзья сайта
Программы, игры


Полезно
В какую объединенную сеть входит классовая сеть? Суммирование маршрутов Занимают ли таблицы память маршрутизатора?