Навигация
Главная
Поиск
Форум
FAQ's
Ссылки
Карта сайта
Чат программистов

Статьи
-Delphi
-C/C++
-Turbo Pascal
-Assembler
-Java/JS
-PHP
-Perl
-DHTML
-Prolog
-GPSS
-Сайтостроительство
-CMS: PHP Fusion
-Инвестирование

Файлы
-Для программистов
-Компонеты для Delphi
-Исходники на Delphi
-Исходники на C/C++
-Книги по Delphi
-Книги по С/С++
-Книги по JAVA/JS
-Книги по Basic/VB/.NET
-Книги по PHP/MySQL
-Книги по Assembler
-PHP Fusion MOD'ы
-by Kest
Professional Download System
Реклама
Услуги

Автоматическое добавление статей на сайты на Wordpress, Joomla, DLE
Заказать продвижение сайта
Программа для рисования блок-схем
Инженерный калькулятор онлайн
Таблица сложения онлайн
Популярные статьи
OpenGL и Delphi... 65535
Форум на вашем ... 65535
HACK F.A.Q 65535
Бип из системно... 65535
Гостевая книга ... 65535
Invision Power ... 65535
Пример работы с... 65535
Содержание сайт... 65535
Организация зап... 65535
Вызов хранимых ... 65535
Создание отчето... 65535
Программируемая... 65535
Эмулятор микроп... 65535
Подключение Mic... 65535
Создание потоко... 65535
Приложение «Про... 65535
Оператор выбора... 65535
Модуль Forms 65535
ТЕХНОЛОГИИ ДОСТ... 62971
Имитационное мо... 58317
Реклама
Сейчас на сайте
Гостей: 4
На сайте нет зарегистрированных пользователей

Пользователей: 13,091
новичок: avegraf
Новости
Реклама
Выполняем курсовые и лабораторные по разным языкам программирования
Подробнее - курсовые и лабораторные на заказ
Delphi, Turbo Pascal, Assembler, C, C++, C#, Visual Basic, Java, GPSS, Prolog, 3D MAX, Компас 3D
Заказать программу для Windows Mobile, Symbian

Моделирование процесса обработки заданий пакетным режимом работы с квант...
Двунаправленный динамический список на Delphi + Блок схемы
База данных междугородних телефонных разговоров на Delphi

Реклама



Подписывайся на YouTube канал о программировании, что бы не пропустить новые видео!

ПОДПИСЫВАЙСЯ на канал о программировании
Тип данных char
Тип данных char служит для представления отдельных символов. Чаще всего это символьные константы. Например, символьной константой является !А', которой соответствует числовое значение 65. Не следует путать символ 'А1 со строкой "А", состоящей из одного символа. Кодовые единицы уникода (Unicode) могут быть представлены шестнадцатеричными числами в пределах от \u0000 до \uFFFF. Например, значение \u2122 соответствует символу торговой марки (™), а значение \u03C0 — греческой букве п.
Кроме префикса \и, который предваряет кодовую единицу в уникоде, существует также несколько специальных управляющих последовательностей символов, приведенных табл. 3.3. Эти управляющие последовательности можно вводить в символьные константы или строки, например f\u2122f или "Не11о\п". Управляющие последовательности, начинающиеся с префикса \и (и никакие другие), можно даже указывать за пределами символьных констант или строк, заключаемых в кавычки. Приведенная ниже строка кода вполне допустима, потому что последовательности \u005B и \u005D соответствуют кодировке символов [ и ].
public static void main(String\u005B\u005D args)

Таблица 3.3. Управляющие последовательности специальных символов
















































Управляющая



Назначение



Значение в
уникоде



последовательность


 


 







Возврат на
одну позицию





\u0008



\t



Табуляция





\u0009



\п



Переход на
новую строку





\u000a





Возврат
каретки





\u000d



\"



Двойная
кавычка





\u0022



V



Одинарная
кавычка





\u0027



\\



Обратная косая
черта





\u005c



 


Для того чтобы полностью уяснить тип char, нужно иметь ясное представление о принципах кодировки уникода. Кодировка уникода была изобретена для преодоления ограничений традиционных кодировок символов. До появления уникода существовало несколько различных стандартных кодировок: ASCII, ISO 8859-1, KOI-8, GB18030, BIG-5 и т.д. При этом возникали два затруднения. Во-первых, один и тот же код в различных кодировках соответствовал разным символам. Во-вторых, в языках с большим набором символов использовался код различной длины: часто употребляющиеся символы представлялись одним байтом, а остальные символы — двумя, тремя и большим количеством байтов.
Для разрешения этих затруднений была разработана кодировка уникода. В результате исследований, начавшихся в 1980-х годах, выяснилось, что двухбайтового кода более чем достаточно для представления всех символов, использующихся во всех языках мира. И еще оставался достаточный резерв для любых мыслимых расширений. В 1991 году была выпущена спецификация Unicode 1.0, в которой использовалось меньше половины из возможных 65536 кодов. В Java изначально были приняты 16-разрядные символы уникода, что дало ему еще одно преимущество над другими языками программирования, где используются 8-разрядные символы.
Но впоследствии случилось непредвиденное: количество символов превысило допустимый для кодировки предел 65536. Причиной тому стали чрезвычайно большие наборы иероглифов китайского, японского и корейского языков. Поэтому в настоящее время 16-разрядного типа char недостаточно для описания всех символов уникода.
Для того чтобы стало понятнее, каким образом данное затруднение разрешается в Java, начиная с версии Java SE 5.0, необходимо ввести ряд терминов. В частности, кодовой точкой называется значение, связанное с символом в кодировке. Согласно стандарту на уникод, кодовые точки записываются в шестнадцатеричной форме и предваряются символами и+. Например, кодовая точка латинской буквы А равна
U+0041


. В уникоде кодовые точки объединяются в 17 кодовых плоскостей. Первая кодовая плоскость, называемая основной многоязыковой плоскостью, состоит из "классических" символов уникода с кодовыми точками от U+0000 до U+FFFF. Шестнадцать дополнительных плоскостей с кодовыми точками от U+10000 до U+10FFFF содержат дополнительные символы.
Кодировка UTF-16это способ представления в уникоде всех кодовых точек кодом переменной длины. Символы из основной многоязыковой плоскости представляются 16-битовыми значениями, называемыми кодовыми единицами. Дополнительные символы обозначаются последовательными парами кодовых единиц. Каждое из значений кодируемой подобным образом пары попадает в область 2048 неиспользуемых значений из основной многоязыковой плоскости. Эта так называемая область подстановки простирается в пределах от U+D800 до U+DBFF для первой кодовой единицы и от U+DC00 до U+DFFF для второй кодовой единицы. Такой подход позволяет сразу определить, соответствует ли значение коду конкретного символа или является частью кода дополнительного символа. Например, математическому коду символа О, обозначающего множество октонионов, соответствует кодовая точка U+1D546 и две кодовые единицы — U+D835 и U+DD46 (с описание алгоритма кодировки UTF-16 можно ознакомиться, обратившись по адресу http://ru.wikipedia.org/wiki/UTF-16).
В Java тип char описывает кодовую единицу в кодировке UTF-16. Начинающим программировать на Java рекомендуется пользоваться кодировкой UTF-16 лишь в случае крайней необходимости. Старайтесь чаще пользоваться символьными строками как абстрактными типами данных (подробнее о них речь пойдет ниже, в разделе "Символьные строки").
Опубликовал Kest November 18 2014 03:36:02 · 0 Комментариев · 2312 Прочтений · Для печати

• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •


Комментарии
Нет комментариев.
Добавить комментарий
Имя:



smiley smiley smiley smiley smiley smiley smiley smiley smiley
Запретить смайлики в комментариях

Введите проверочный код:* =
Рейтинги
Рейтинг доступен только для пользователей.

Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.

Нет данных для оценки.
Гость
Имя

Пароль



Вы не зарегистрированны?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.
Поделиться ссылкой
Фолловь меня в Твиттере! • Смотрите канал о путешествияхКак приготовить мидии в тайланде?
Загрузки
Новые загрузки
iChat v.7.0 Final...
iComm v.6.1 - выв...
Visual Studio 200...
CodeGear RAD Stud...
Шаблон для новост...

Случайные загрузки
Delphi 2005. Разр...
AdBlaster v2.5 - ...
TrayComp
EMS QuickExport S...
Защита от спама ...
Форма в форме
БД сеть компьютер...
Шкрыль А. - Разра...
PDJ_Anima
ShadelLabel
«Философия» прогр...
Измерение тактово...
SynEdit
Battle.Net - мони...
RxLIB
DateEdit
Abbrevia
Delphi 6/7 базы д...
Панель случайной ...
Применение жадног...

Топ загрузок
Приложение Клие... 100477
Delphi 7 Enterp... 87851
Converter AMR<-... 20082
GPSS World Stud... 13471
Borland C++Buil... 12053
Borland Delphi ... 8667
Turbo Pascal fo... 7048
Visual Studio 2... 5005
Калькулятор [Ис... 4906
FreeSMS v1.3.1 3545
Случайные статьи
5.2.2. Ввод литер
В современных сист...
Интернет-ресурсы, ...
Выборка и сортиров...
Обновление набора ...
Раскрутка Вконтакте
Скрипт показа банн...
В меню DVD выберит...
Межмодульные перем...
формате открытого ...
ВВОД, ВЫВОД СПИСКА...
ДОСТОИНСТВА И НЕДО...
Схема типичной инф...
Конструкторское бюро
Где мы находимся?
(Terminal Services...
Технология Android...
Особенности MediaP...
Как идентифицирова...
Рабочий стол
Драйвер seg_map
Стандартные матем...
РЕЖИМ "ПОПОЛНЕНИЕ ...
Сортировка простым...
Фреймы
Статистика



Друзья сайта
Программы, игры


Полезно
В какую объединенную сеть входит классовая сеть? Суммирование маршрутов Занимают ли таблицы память маршрутизатора?