Тип данных char - Java. Библиотека профессионала. .:: CodingRUS ::. программирование по-русски на Delphi, C++, PHP, Prolog, GPSS

Услуги

• Автоматическое добавление статей на сайты на Wordpress, Joomla, DLE
• Заказать продвижение сайта
• Программа для рисования блок-схем
• Инженерный калькулятор онлайн
• Таблица сложения онлайн

Популярные статьи

OpenGL и Delphi...		65535
Форум на вашем ...		65535
21 ошибка прогр...		65535
HACK F.A.Q		65535
Бип из системно...		65535
Гостевая книга ...		65535
Invision Power ...		65535
Пример работы с...		65535
Содержание сайт...		65535
ТЕХНОЛОГИИ ДОСТ...		65535
Организация зап...		65535
Вызов хранимых ...		65535
Создание отчето...		65535
Имитационное мо...		65535
Программируемая...		65535
Эмулятор микроп...		65535
Подключение Mic...		65535
Создание потоко...		65535
Приложение «Про...		65535
Оператор выбора...		65535

Сейчас на сайте

Гостей: 6
На сайте нет зарегистрированных пользователей

Пользователей: 13,372

новичок: vausoz

Новости

Выполняем курсовые и лабораторные по разным языкам программирования
Подробнее - курсовые и лабораторные на заказ
Delphi, Turbo Pascal, Assembler, C, C++, C#, Visual Basic, Java, GPSS, Prolog, 3D MAX, Компас 3D
Заказать программу для Windows Mobile, Symbian

Моделирование системы управления качеством производственного процесса на...

База данных - рабочее место кассира на Delphi + бд Access

Моделирование интернет магазина (Apache, Php, Html) на GPSS + Блок схема

Тип данных char

Тип данных char служит для представления отдельных символов. Чаще всего это символьные константы. Например, символьной константой является !А', которой соответствует числовое значение 65. Не следует путать символ 'А1 со строкой "А", состоящей из одного символа. Кодовые единицы уникода (Unicode) могут быть представлены шестнадцатеричными числами в пределах от \u0000 до \uFFFF. Например, значение \u2122 соответствует символу торговой марки (™), а значение \u03C0 — греческой букве п.
Кроме префикса \и, который предваряет кодовую единицу в уникоде, существует также несколько специальных управляющих последовательностей символов, приведенных табл. 3.3. Эти управляющие последовательности можно вводить в символьные константы или строки, например f\u2122f или "Не11о\п". Управляющие последовательности, начинающиеся с префикса \и (и никакие другие), можно даже указывать за пределами символьных констант или строк, заключаемых в кавычки. Приведенная ниже строка кода вполне допустима, потому что последовательности \u005B и \u005D соответствуют кодировке символов [ и ].
public static void main(String\u005B\u005D args)

Таблица 3.3. Управляющие последовательности специальных символов

Управляющая	Назначение	Значение в уникоде
последовательность
\ь	Возврат на одну позицию	\u0008
\t	Табуляция	\u0009
\п	Переход на новую строку	\u000a
\г	Возврат каретки	\u000d
\"	Двойная кавычка	\u0022
V	Одинарная кавычка	\u0027
\\	Обратная косая черта	\u005c

Для того чтобы полностью уяснить тип char, нужно иметь ясное представление о принципах кодировки уникода. Кодировка уникода была изобретена для преодоления ограничений традиционных кодировок символов. До появления уникода существовало несколько различных стандартных кодировок: ASCII, ISO 8859-1, KOI-8, GB18030, BIG-5 и т.д. При этом возникали два затруднения. Во-первых, один и тот же код в различных кодировках соответствовал разным символам. Во-вторых, в языках с большим набором символов использовался код различной длины: часто употребляющиеся символы представлялись одним байтом, а остальные символы — двумя, тремя и большим количеством байтов.
Для разрешения этих затруднений была разработана кодировка уникода. В результате исследований, начавшихся в 1980-х годах, выяснилось, что двухбайтового кода более чем достаточно для представления всех символов, использующихся во всех языках мира. И еще оставался достаточный резерв для любых мыслимых расширений. В 1991 году была выпущена спецификация Unicode 1.0, в которой использовалось меньше половины из возможных 65536 кодов. В Java изначально были приняты 16-разрядные символы уникода, что дало ему еще одно преимущество над другими языками программирования, где используются 8-разрядные символы.
Но впоследствии случилось непредвиденное: количество символов превысило допустимый для кодировки предел 65536. Причиной тому стали чрезвычайно большие наборы иероглифов китайского, японского и корейского языков. Поэтому в настоящее время 16-разрядного типа char недостаточно для описания всех символов уникода.
Для того чтобы стало понятнее, каким образом данное затруднение разрешается в Java, начиная с версии Java SE 5.0, необходимо ввести ряд терминов. В частности, кодовой точкой называется значение, связанное с символом в кодировке. Согласно стандарту на уникод, кодовые точки записываются в шестнадцатеричной форме и предваряются символами и+. Например, кодовая точка латинской буквы А равна

U+0041

. В уникоде кодовые точки объединяются в 17 кодовых плоскостей. Первая кодовая плоскость, называемая основной многоязыковой плоскостью, состоит из "классических" символов уникода с кодовыми точками от U+0000 до U+FFFF. Шестнадцать дополнительных плоскостей с кодовыми точками от U+10000 до U+10FFFF содержат дополнительные символы.
Кодировка UTF-16 — это способ представления в уникоде всех кодовых точек кодом переменной длины. Символы из основной многоязыковой плоскости представляются 16-битовыми значениями, называемыми кодовыми единицами. Дополнительные символы обозначаются последовательными парами кодовых единиц. Каждое из значений кодируемой подобным образом пары попадает в область 2048 неиспользуемых значений из основной многоязыковой плоскости. Эта так называемая область подстановки простирается в пределах от U+D800 до U+DBFF для первой кодовой единицы и от U+DC00 до U+DFFF для второй кодовой единицы. Такой подход позволяет сразу определить, соответствует ли значение коду конкретного символа или является частью кода дополнительного символа. Например, математическому коду символа О, обозначающего множество октонионов, соответствует кодовая точка U+1D546 и две кодовые единицы — U+D835 и U+DD46 (с описание алгоритма кодировки UTF-16 можно ознакомиться, обратившись по адресу http://ru.wikipedia.org/wiki/UTF-16).
В Java тип char описывает кодовую единицу в кодировке UTF-16. Начинающим программировать на Java рекомендуется пользоваться кодировкой UTF-16 лишь в случае крайней необходимости. Старайтесь чаще пользоваться символьными строками как абстрактными типами данных (подробнее о них речь пойдет ниже, в разделе "Символьные строки").

Опубликовал Kest November 18 2014 00:36:02 · 0 Комментариев · 4723 Прочтений ·

• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •

Комментарии

Нет комментариев.

Добавить комментарий

Рейтинги

Рейтинг доступен только для пользователей.

Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.

Нет данных для оценки.

Гость

Вы не зарегистрированны?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.

Поделиться ссылкой

• Фолловь меня в Твиттере! • Смотрите канал о путешествиях • Как приготовить мидии в тайланде?

Загрузки

Новые загрузки

Случайные загрузки

Топ загрузок

Приложение Клие...	100814
Delphi 7 Enterp...	98119
Converter AMR<-...	20317
GPSS World Stud...	17100
Borland C++Buil...	14274
Borland Delphi ...	10401
Turbo Pascal fo...	7407
Калькулятор [Ис...	6109
Visual Studio 2...	5248
Microsoft SQL S...	3683