Навигация
Главная
Поиск
Форум
FAQ's
Ссылки
Карта сайта
Чат программистов

Статьи
-Delphi
-C/C++
-Turbo Pascal
-Assembler
-Java/JS
-PHP
-Perl
-DHTML
-Prolog
-GPSS
-Сайтостроительство
-CMS: PHP Fusion
-Инвестирование

Файлы
-Для программистов
-Компонеты для Delphi
-Исходники на Delphi
-Исходники на C/C++
-Книги по Delphi
-Книги по С/С++
-Книги по JAVA/JS
-Книги по Basic/VB/.NET
-Книги по PHP/MySQL
-Книги по Assembler
-PHP Fusion MOD'ы
-by Kest
Professional Download System
Реклама
Услуги

Автоматическое добавление статей на сайты на Wordpress, Joomla, DLE
Заказать продвижение сайта
Программа для рисования блок-схем
Инженерный калькулятор онлайн
Таблица сложения онлайн
Популярные статьи
OpenGL и Delphi... 65535
Форум на вашем ... 65535
HACK F.A.Q 65535
Бип из системно... 65535
Гостевая книга ... 65535
Invision Power ... 65535
Содержание сайт... 65535
Организация зап... 65535
Вызов хранимых ... 65535
Программируемая... 65535
Эмулятор микроп... 65535
Подключение Mic... 65535
Создание потоко... 65535
Приложение «Про... 65535
Оператор выбора... 65535
Создание отчето... 63912
Модуль Forms 63636
ТЕХНОЛОГИИ ДОСТ... 60490
Пример работы с... 59882
Имитационное мо... 55960
Реклама
Сейчас на сайте
Гостей: 15
На сайте нет зарегистрированных пользователей

Пользователей: 13,079
новичок: Openair
Новости
Реклама
Выполняем курсовые и лабораторные по разным языкам программирования
Подробнее - курсовые и лабораторные на заказ
Delphi, Turbo Pascal, Assembler, C, C++, C#, Visual Basic, Java, GPSS, Prolog, 3D MAX, Компас 3D
Заказать программу для Windows Mobile, Symbian

Метод половинного деления для нахождения корня уровнения на Turbo Pascal...
Моделирование ЭВМ на GPSS (три класса заданий) + Пояснительная записка
Игра Sokoban на Delphi + Блок схемы

Реклама



Подписывайся на YouTube канал о программировании, что бы не пропустить новые видео!

ПОДПИСЫВАЙСЯ на канал о программировании
Тип данных char
Тип данных char служит для представления отдельных символов. Чаще всего это символьные константы. Например, символьной константой является !А', которой соответствует числовое значение 65. Не следует путать символ 'А1 со строкой "А", состоящей из одного символа. Кодовые единицы уникода (Unicode) могут быть представлены шестнадцатеричными числами в пределах от \u0000 до \uFFFF. Например, значение \u2122 соответствует символу торговой марки (™), а значение \u03C0 — греческой букве п.
Кроме префикса \и, который предваряет кодовую единицу в уникоде, существует также несколько специальных управляющих последовательностей символов, приведенных табл. 3.3. Эти управляющие последовательности можно вводить в символьные константы или строки, например f\u2122f или "Не11о\п". Управляющие последовательности, начинающиеся с префикса \и (и никакие другие), можно даже указывать за пределами символьных констант или строк, заключаемых в кавычки. Приведенная ниже строка кода вполне допустима, потому что последовательности \u005B и \u005D соответствуют кодировке символов [ и ].
public static void main(String\u005B\u005D args)

Таблица 3.3. Управляющие последовательности специальных символов
















































Управляющая



Назначение



Значение в
уникоде



последовательность


 


 







Возврат на
одну позицию





\u0008



\t



Табуляция





\u0009



\п



Переход на
новую строку





\u000a





Возврат
каретки





\u000d



\"



Двойная
кавычка





\u0022



V



Одинарная
кавычка





\u0027



\\



Обратная косая
черта





\u005c



 


Для того чтобы полностью уяснить тип char, нужно иметь ясное представление о принципах кодировки уникода. Кодировка уникода была изобретена для преодоления ограничений традиционных кодировок символов. До появления уникода существовало несколько различных стандартных кодировок: ASCII, ISO 8859-1, KOI-8, GB18030, BIG-5 и т.д. При этом возникали два затруднения. Во-первых, один и тот же код в различных кодировках соответствовал разным символам. Во-вторых, в языках с большим набором символов использовался код различной длины: часто употребляющиеся символы представлялись одним байтом, а остальные символы — двумя, тремя и большим количеством байтов.
Для разрешения этих затруднений была разработана кодировка уникода. В результате исследований, начавшихся в 1980-х годах, выяснилось, что двухбайтового кода более чем достаточно для представления всех символов, использующихся во всех языках мира. И еще оставался достаточный резерв для любых мыслимых расширений. В 1991 году была выпущена спецификация Unicode 1.0, в которой использовалось меньше половины из возможных 65536 кодов. В Java изначально были приняты 16-разрядные символы уникода, что дало ему еще одно преимущество над другими языками программирования, где используются 8-разрядные символы.
Но впоследствии случилось непредвиденное: количество символов превысило допустимый для кодировки предел 65536. Причиной тому стали чрезвычайно большие наборы иероглифов китайского, японского и корейского языков. Поэтому в настоящее время 16-разрядного типа char недостаточно для описания всех символов уникода.
Для того чтобы стало понятнее, каким образом данное затруднение разрешается в Java, начиная с версии Java SE 5.0, необходимо ввести ряд терминов. В частности, кодовой точкой называется значение, связанное с символом в кодировке. Согласно стандарту на уникод, кодовые точки записываются в шестнадцатеричной форме и предваряются символами и+. Например, кодовая точка латинской буквы А равна
U+0041


. В уникоде кодовые точки объединяются в 17 кодовых плоскостей. Первая кодовая плоскость, называемая основной многоязыковой плоскостью, состоит из "классических" символов уникода с кодовыми точками от U+0000 до U+FFFF. Шестнадцать дополнительных плоскостей с кодовыми точками от U+10000 до U+10FFFF содержат дополнительные символы.
Кодировка UTF-16это способ представления в уникоде всех кодовых точек кодом переменной длины. Символы из основной многоязыковой плоскости представляются 16-битовыми значениями, называемыми кодовыми единицами. Дополнительные символы обозначаются последовательными парами кодовых единиц. Каждое из значений кодируемой подобным образом пары попадает в область 2048 неиспользуемых значений из основной многоязыковой плоскости. Эта так называемая область подстановки простирается в пределах от U+D800 до U+DBFF для первой кодовой единицы и от U+DC00 до U+DFFF для второй кодовой единицы. Такой подход позволяет сразу определить, соответствует ли значение коду конкретного символа или является частью кода дополнительного символа. Например, математическому коду символа О, обозначающего множество октонионов, соответствует кодовая точка U+1D546 и две кодовые единицы — U+D835 и U+DD46 (с описание алгоритма кодировки UTF-16 можно ознакомиться, обратившись по адресу http://ru.wikipedia.org/wiki/UTF-16).
В Java тип char описывает кодовую единицу в кодировке UTF-16. Начинающим программировать на Java рекомендуется пользоваться кодировкой UTF-16 лишь в случае крайней необходимости. Старайтесь чаще пользоваться символьными строками как абстрактными типами данных (подробнее о них речь пойдет ниже, в разделе "Символьные строки").
Опубликовал Kest November 18 2014 03:36:02 · 0 Комментариев · 2150 Прочтений · Для печати

• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •


Комментарии
Нет комментариев.
Добавить комментарий
Имя:



smiley smiley smiley smiley smiley smiley smiley smiley smiley
Запретить смайлики в комментариях

Введите проверочный код:* =
Рейтинги
Рейтинг доступен только для пользователей.

Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.

Нет данных для оценки.
Гость
Имя

Пароль



Вы не зарегистрированны?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.
Поделиться ссылкой
Фолловь меня в Твиттере! • Смотрите канал о путешествияхКак приготовить мидии в тайланде?
Загрузки
Новые загрузки
iChat v.7.0 Final...
iComm v.6.1 - выв...
Visual Studio 200...
CodeGear RAD Stud...
Шаблон для новост...

Случайные загрузки
AdBlaster v2.5 - ...
Моделирование дви...
Программирование ...
Run
PRNDbgrid
Пишем программы и...
Игра "Астероиды" ...
CodeGear RAD Stud...
Интерактивный инт...
AddPage [Исходник...
FileFind
Длинный заголовок...
Illusion
Delphi 6. Учебный...
Halcyon
AboutSystem
Пользовательская...
DelTrayIcon [Исхо...
KOL & MCK v1.69
TDBF

Топ загрузок
Приложение Клие... 100449
Delphi 7 Enterp... 85823
Converter AMR<-... 20067
GPSS World Stud... 12518
Borland C++Buil... 11576
Borland Delphi ... 8504
Turbo Pascal fo... 7023
Visual Studio 2... 4989
Калькулятор [Ис... 4739
FreeSMS v1.3.1 3536
Случайные статьи
Анализатор протокола
Как решать задачи ...
Отправка по факсу ...
В версии Android SDK
Протокол SNMPLucer...
Обработка транзакц...
1.1. Разработка пр...
Комплексные числа
Соглашение о вызовах
Инициализация пере...
В этой главеГруппо...
Онлайновая инфогра...
Немного о DMOZ
Что нужно делать п...
Здравый смысл
Реализация динамич...
вкладках службы FT...
превышает реальный...
Можно было бы, кон...
Как писать правиль...
Кириллица и локаль...
Задача кажется сло...
Каковы значения ад...
Использование авто...
Полосы понижения и...
Статистика



Друзья сайта
Программы, игры


Полезно
В какую объединенную сеть входит классовая сеть? Суммирование маршрутов Занимают ли таблицы память маршрутизатора?