Символы
Для записи одиночных символов используются
следующие формы.
- Печатные символы можно записать
в апострофах: 'а', 'N', '?'.
- Управляющие символы записываются
в апострофах с обратной наклонной чертой:
- '\n'
— символ перевода строки newline с кодом ASCII 10;
- '\r'
— символ возврата каретки CR с кодом 13;
- '\f'
— символ перевода страницы FF с кодом 12;
- '\b'
— символ возврата на шаг BS с кодом 8;
- '\t'
— символ горизонтальной табуляции НТ с кодом 9;
- '\\'
— обратная наклонная черта;
- '\"'
— кавычка;
- '\''
— апостроф.
- Код любого символа с десятичной
кодировкой от 0 до 255 можно задать, записав его не более чем тремя цифрами
в восьмеричной системе счисления в апострофах после обратной наклонной черты:
'\123' — буква S, '\346'
— буква Ж в кодировке СР1251. Не рекомендуется использовать
эту форму записи для печатных и управляющих символов, перечисленных в предыдущем
пункте, поскольку компилятор сразу же переведет восьмеричную запись в указанную
выше форму. Наибольший код '\377' — десятичное число
255.
- Код любого символа в кодировке
Unicode набирается в апострофах после обратной наклонной черты и латинской
буквы ц ровно четырьмя шестнад-цатеричными цифрами: '\u0053'
— буква S, '\u0416' — буква
Ж.
Символы хранятся в формате типа
char (см. ниже).
Примечание
Прописные русские буквы в кодировке
Unicode занимают диапазон от '\u0410' — заглавная буква
А, до '\u042F' — заглавная
Я, строчные буквы от '\u0430' —
а, до '\044F' — я.
В какой бы форме ни записывались
символы, компилятор переводит их в Unicode, включая и исходный текст программы.
Замечание
Компилятор и исполняющая система
Java работают только с кодировкой Unicode.
Сайт создан в системе
uCoz