Навигация
Главная
Поиск
Форум
FAQ's
Ссылки
Карта сайта
Чат программистов

Статьи
-Delphi
-C/C++
-Turbo Pascal
-Assembler
-Java/JS
-PHP
-Perl
-DHTML
-Prolog
-GPSS
-Сайтостроительство
-CMS: PHP Fusion
-Инвестирование

Файлы
-Для программистов
-Компонеты для Delphi
-Исходники на Delphi
-Исходники на C/C++
-Книги по Delphi
-Книги по С/С++
-Книги по JAVA/JS
-Книги по Basic/VB/.NET
-Книги по PHP/MySQL
-Книги по Assembler
-PHP Fusion MOD'ы
-by Kest
Professional Download System
Реклама
Услуги

Автоматическое добавление статей на сайты на Wordpress, Joomla, DLE
Заказать продвижение сайта
Программа для рисования блок-схем
Инженерный калькулятор онлайн
Таблица сложения онлайн
Популярные статьи
OpenGL и Delphi... 65535
Форум на вашем ... 65535
HACK F.A.Q 65535
Бип из системно... 65535
Гостевая книга ... 65535
Invision Power ... 65535
Пример работы с... 65535
Содержание сайт... 65535
Организация зап... 65535
Вызов хранимых ... 65535
Создание отчето... 65535
Программируемая... 65535
Эмулятор микроп... 65535
Подключение Mic... 65535
Создание потоко... 65535
Приложение «Про... 65535
Оператор выбора... 65535
Модуль Forms 65535
ТЕХНОЛОГИИ ДОСТ... 64790
Имитационное мо... 58954
Реклама
Сейчас на сайте
Гостей: 6
На сайте нет зарегистрированных пользователей

Пользователей: 13,101
новичок: Limbo67
Новости
Реклама
Выполняем курсовые и лабораторные по разным языкам программирования
Подробнее - курсовые и лабораторные на заказ
Delphi, Turbo Pascal, Assembler, C, C++, C#, Visual Basic, Java, GPSS, Prolog, 3D MAX, Компас 3D
Заказать программу для Windows Mobile, Symbian

База данных - рабочее место кассира на Delphi + бд Access
Создание последовательности окон и передвижение окон по экрану на Turbo ...
Обратное размещение элементов ЭВС на Delphi + Пояснительная записка

Реклама



Подписывайся на YouTube канал о программировании, что бы не пропустить новые видео!

ПОДПИСЫВАЙСЯ на канал о программировании
Тип данных char
Тип данных char служит для представления отдельных символов. Чаще всего это символьные константы. Например, символьной константой является !А', которой соответствует числовое значение 65. Не следует путать символ 'А1 со строкой "А", состоящей из одного символа. Кодовые единицы уникода (Unicode) могут быть представлены шестнадцатеричными числами в пределах от \u0000 до \uFFFF. Например, значение \u2122 соответствует символу торговой марки (™), а значение \u03C0 — греческой букве п.
Кроме префикса \и, который предваряет кодовую единицу в уникоде, существует также несколько специальных управляющих последовательностей символов, приведенных табл. 3.3. Эти управляющие последовательности можно вводить в символьные константы или строки, например f\u2122f или "Не11о\п". Управляющие последовательности, начинающиеся с префикса \и (и никакие другие), можно даже указывать за пределами символьных констант или строк, заключаемых в кавычки. Приведенная ниже строка кода вполне допустима, потому что последовательности \u005B и \u005D соответствуют кодировке символов [ и ].
public static void main(String\u005B\u005D args)

Таблица 3.3. Управляющие последовательности специальных символов
















































Управляющая



Назначение



Значение в
уникоде



последовательность


 


 







Возврат на
одну позицию





\u0008



\t



Табуляция





\u0009



\п



Переход на
новую строку





\u000a





Возврат
каретки





\u000d



\"



Двойная
кавычка





\u0022



V



Одинарная
кавычка





\u0027



\\



Обратная косая
черта





\u005c



 


Для того чтобы полностью уяснить тип char, нужно иметь ясное представление о принципах кодировки уникода. Кодировка уникода была изобретена для преодоления ограничений традиционных кодировок символов. До появления уникода существовало несколько различных стандартных кодировок: ASCII, ISO 8859-1, KOI-8, GB18030, BIG-5 и т.д. При этом возникали два затруднения. Во-первых, один и тот же код в различных кодировках соответствовал разным символам. Во-вторых, в языках с большим набором символов использовался код различной длины: часто употребляющиеся символы представлялись одним байтом, а остальные символы — двумя, тремя и большим количеством байтов.
Для разрешения этих затруднений была разработана кодировка уникода. В результате исследований, начавшихся в 1980-х годах, выяснилось, что двухбайтового кода более чем достаточно для представления всех символов, использующихся во всех языках мира. И еще оставался достаточный резерв для любых мыслимых расширений. В 1991 году была выпущена спецификация Unicode 1.0, в которой использовалось меньше половины из возможных 65536 кодов. В Java изначально были приняты 16-разрядные символы уникода, что дало ему еще одно преимущество над другими языками программирования, где используются 8-разрядные символы.
Но впоследствии случилось непредвиденное: количество символов превысило допустимый для кодировки предел 65536. Причиной тому стали чрезвычайно большие наборы иероглифов китайского, японского и корейского языков. Поэтому в настоящее время 16-разрядного типа char недостаточно для описания всех символов уникода.
Для того чтобы стало понятнее, каким образом данное затруднение разрешается в Java, начиная с версии Java SE 5.0, необходимо ввести ряд терминов. В частности, кодовой точкой называется значение, связанное с символом в кодировке. Согласно стандарту на уникод, кодовые точки записываются в шестнадцатеричной форме и предваряются символами и+. Например, кодовая точка латинской буквы А равна
U+0041


. В уникоде кодовые точки объединяются в 17 кодовых плоскостей. Первая кодовая плоскость, называемая основной многоязыковой плоскостью, состоит из "классических" символов уникода с кодовыми точками от U+0000 до U+FFFF. Шестнадцать дополнительных плоскостей с кодовыми точками от U+10000 до U+10FFFF содержат дополнительные символы.
Кодировка UTF-16это способ представления в уникоде всех кодовых точек кодом переменной длины. Символы из основной многоязыковой плоскости представляются 16-битовыми значениями, называемыми кодовыми единицами. Дополнительные символы обозначаются последовательными парами кодовых единиц. Каждое из значений кодируемой подобным образом пары попадает в область 2048 неиспользуемых значений из основной многоязыковой плоскости. Эта так называемая область подстановки простирается в пределах от U+D800 до U+DBFF для первой кодовой единицы и от U+DC00 до U+DFFF для второй кодовой единицы. Такой подход позволяет сразу определить, соответствует ли значение коду конкретного символа или является частью кода дополнительного символа. Например, математическому коду символа О, обозначающего множество октонионов, соответствует кодовая точка U+1D546 и две кодовые единицы — U+D835 и U+DD46 (с описание алгоритма кодировки UTF-16 можно ознакомиться, обратившись по адресу http://ru.wikipedia.org/wiki/UTF-16).
В Java тип char описывает кодовую единицу в кодировке UTF-16. Начинающим программировать на Java рекомендуется пользоваться кодировкой UTF-16 лишь в случае крайней необходимости. Старайтесь чаще пользоваться символьными строками как абстрактными типами данных (подробнее о них речь пойдет ниже, в разделе "Символьные строки").
Опубликовал Kest November 18 2014 03:36:02 · 0 Комментариев · 2350 Прочтений · Для печати

• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •


Комментарии
Нет комментариев.
Добавить комментарий
Имя:



smiley smiley smiley smiley smiley smiley smiley smiley smiley
Запретить смайлики в комментариях

Введите проверочный код:* =
Рейтинги
Рейтинг доступен только для пользователей.

Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.

Нет данных для оценки.
Гость
Имя

Пароль



Вы не зарегистрированны?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.
Поделиться ссылкой
Фолловь меня в Твиттере! • Смотрите канал о путешествияхКак приготовить мидии в тайланде?
Загрузки
Новые загрузки
iChat v.7.0 Final...
iComm v.6.1 - выв...
Visual Studio 200...
CodeGear RAD Stud...
Шаблон для новост...

Случайные загрузки
3D Октаэдр
IMtale
Dnavigator
Эффект лампы на р...
ЯЗЫК ПРОГРАММИРОВ...
Tank [Исходник на...
Панель "ссылки"
JanReplace
БД студентов
MiniChat
Применение жадног...
Моделирование дви...
Atb
RSS Feeds
Философия C++. Пр...
Matrix2D
VksButton
netBIOS
Обучение Borland ...
Добавление к ссы...

Топ загрузок
Приложение Клие... 100502
Delphi 7 Enterp... 89143
Converter AMR<-... 20088
GPSS World Stud... 14231
Borland C++Buil... 12404
Borland Delphi ... 8810
Turbo Pascal fo... 7069
Калькулятор [Ис... 5030
Visual Studio 2... 5012
FreeSMS v1.3.1 3551
Случайные статьи
Request Information
Интернет-магазины ...
Игра «Выдающийся ум»
Pikavippi s-pankin...
Исключения
протоколу аутентиф...
Да, Microsoft чрез...
Perl :: LWP + MIME...
Доменные зоны мира
ГЛАВА 7. ЕЩЕ НЕСК...
Зачем нужна MySQL
Что делать?
Оптимизация сайта ...
Построение концепт...
Бюджеты и инфографика
Применение элемент...
Новый корпус для н...
Работа с MySQL в P...
Массивы
Список таблиц в ди...
Предикат, вычисляю...
Настраиваемые инте...
Социативный массив...
Выключить компьютер
• Раскрытие циклов...
Статистика



Друзья сайта
Программы, игры


Полезно
В какую объединенную сеть входит классовая сеть? Суммирование маршрутов Занимают ли таблицы память маршрутизатора?