Алексей Стахнов - Linux
Настройка поддержки кириллицы с помощью пакетов console-tools и kbd состоит из:
• настройки экранного шрифта и таблицы экранных шрифтов. Это делается с помощью программы consolechars (для console-tools) или setfont и mapscrn (для kbd);
• настройки таблицы символов приложения и fallback-таблицы;
• загрузки соответствующей раскладки клавиатуры с помощью программы load keys.
Файлы шрифтов обычно размещаются в каталогах /usr/share/consolefonts или /usr/lib/kbd/consolefonts, символьные таблицы в каталоге /usr/share/consoletrans, клавиатурные раскладки в /usr/share/keymap/i386/qwerty.
console-tools Если на компьютере установлен пакет console-tools, то необходимо выполнить следующие действия:loadkeys ru.map consolechars -v -f Cyr_a8x16 -m $foo/koi2alt
Переключение раскладки клавиатуры производится нажатием правой клавиши <Ctrl> (иногда это можно сделать нажатием клавиши <Alt> или <Caps Lock>). Cyrillic console tools
Все шрифты в этом пакете основаны на альтернативной кодировке (СР866). Это сделано потому, что в текстовом режиме VGA использование другой кодировки приводит к разрывам в отображении горизонтальной псевдографики. Все шрифты содержат в себе таблицу отображения в Unicode.
В пакет также включены таблицы перекодировки в Unicode из распространенных кодировок русского, белорусского, болгарского, сербского и украинского языков.
Для настройки консоли следует выполнить следующие команды:consolechars -f UniCyr_8x16.psf -m koi8-r.acm loadkeys console_russian.map
Для украинизации вместо koi8-r необходимо подставить koi8-u. kbd Для настройки кириллицы с помощью kbd обычно используются следующие команды:
loadkeys /usr/lib/kbd/keytables/ru.map
setfont /usr/lib/kbd/consolefonts/Cyr_a8x16
mapscrn /usr/lib/kbd/consoletrans/koi2alt # ниже идет «магическая» последовательность echo – ne " 33(K"Во время загрузки системы для русификации всех виртуальных текстовых консолей необходимо выполнить команду
echo -ne « 33(К»
семь раз. Это можно сделать с помощью следующей строки:
for i in 1 2 3 4 5 6 7; do echo -ne « 33(K» > /dev/tty$i; done
«Магическая» последовательность необходима для перекодировки вывода символов на экран при использовании шрифтов, основанных на кодовой странице СР866.
Настройка консольных приложений
После настройки консоли необходимо также настроить и консольные программы, которые работают с символами. Основная проблема большей части этих программ – они считают, что используется 7-битная кодировка символа.
bash В файле. inputrc, находящемся в домашнем каталоге пользователя, необходимо установить следующие три переменные:set meta-flag on
set convert-meta off
set output-meta onЭти строки указывают, что для кодирования символа используется 8-битная последовательность.
Поскольку файл. inputrc является конфигурационным файлом библиотеки GNU readline, внесенные исправления кириллизируют не только bash, но и другие программы, использующие GNU readline.
csh/tcshТе же действия в отношении программ csh/tcsh будут выглядеть следующим образом:
В файле. cshrc необходимо добавить следующие строки:setenv LC_CTYPE iso_8859_5
stty pass8
zsh В файле. zshrc необходимо добавить следующие строки:setenv LC_CTYPE iso_8859_5
stty pass8
less Для нормального функционирования программы less в файл ~/.lesskey необходимо добавить:LESSCHARSET=
Это позволяет программе игнорировать установку переменной LESSCHARSET= другими программами. После этого надо запустить lesskey для получения бинарного файла ~/.less. mc (The Midnight Commander)
Чтобы использовать кириллицу в mc, нажатием клавиши <F9> зайдите в системное меню, выберите пункт меню Options | Display и установите опцию full 8 bits .
nroffДля корректной работы nroff с кириллицей необходимо запускать его с ключом Tlatinl.
manЕсли программа man не желает корректно отображать кириллицу на экране, необходимо правильно настроить less.
Также измените в файле /usr/lib/man.conf строку:NROFF /usr/bin/groff -S -Tascii -mandoc
на
NROFF /usr/bin/groff -S -Tlatin1 -mandoc
lsПри неправильно настроенной локали Is не будет выводить кириллические символы. В этом случае поможет одна из следующих команд:
• ls -N
• ls –show-control-chars
Samba Чтобы увидеть кириллические символы в именах файлов, в файл /etc/smb.conf следует добавить следующие строчки:[global]
character set = koi8-r
client code page = 866
preserve case = yes
short preserve case = yesПервые две строки указывают кодировку пользователя (character set = koi8-r) и кодировку имен файловой системы (client code page = 8 66).
Третья и четвертая строки определяют, что необходимо сохранять регистр длинных и коротких имен файлов.
telnet При возникновении проблемы ввода русских символов необходимо создать файл ~/.telnetrc, содержащий следующую строку:DEFAULT set outbinary
Локализация и интернационализация
Как можно заметить, каждая из вышеперечисленных программ требует своего особого подхода, выражающегося в том или ином изменении индивидуальных конфигурационных файлов. Это сильно раздражает. А проблема возникла потому, что при проектировании программ не учитывались какие-либо национальные особенности.
Решение таких проблем основывается на двух базисных концепциях: локализации (Localization, lion) и интернационализации (Internationalization, il8n).
Под локализацией подразумевается написание программного кода, способного адекватно воспринимать, использовать и обрабатывать различающиеся стандарты представления данных для различных стран. Например: формат записи даты в США имеет вид ММ/ДД/ГГ, в странах СНГ – ДД.ММ.ГГ, а в Японии – ГГ.ММ.ДД. Помимо даты необходимо разрешить проблемы с представлением форматов времени, чисел, валюты и т. п. Кроме того, базовый аспект локализации – определение соответствующих классов символов.
Интернационализация должна решать проблемы, связанные со способностью программ взаимодействовать с пользователем на его родном языке.
Обе эти концепции должны быть стандартизованы, давая программистам непротиворечивый путь создания программ, работающих в национальной среде.
Локаль
Одно из основных понятий локализации – локаль (locale). Под локалью подразумевается набор соглашений, специфичных для отдельно взятого языка в отдельно взятой стране.
Каждая локаль определяет, по меньшей мере, следующие соглашения:
• классификация символов и преобразований;
• представление валюты;
• представление чисел;
• формат даты/времени.
Настройка локали
Локализация включается путем задания переменной окружения lang строкой:export lang={язык}
В том случае, если такой строки не существует, используется значение локализации по умолчанию: lang="C" или lang="posix". По стандарту POSIX.2 язык локализации записывается в форме:
language_TERRITORY. Codeset
где
• language – двухсимвольный код, обозначающий язык (ru, fr и т. д.);
• TERRITORY – двухсимвольный код, обозначающий страну (RU, UA и т. д.);
• codeset – определяет кодировку символов.
Стандарт ISO 639 определяет коды языков, ISO 3166 – коды стран.
Для русского языка переменная lang устанавливается, как правило, равной LANG="ru_RU.KOI8-R" или LANG="ru_RU.ISO_8859-5".
Также по стандарту допустимы короткие именования значений локали, которые часто используются в качестве псевдонимов. Наиболее известная пара псевдоним-наименование: «С» – "POSIX".
Локализацию можно провести частично, либо определить для отдельных категорий локализации значения, отличные от общесистемной локализации.
В табл. 15.1 приведены опции локали.
Таблица 15.1. Опции локалиПосмотреть текущие значения категорий локализации можно утилитой locale (без параметров).
Интернационализация
Интернационализация детализирует способы общения программы с неанглоговорящим пользователем. Для этого при создании программы используются функции, специально предназначенные для создания интернационализированных программ. Эти функции и особенности их применения описываются документом LI18NUX 2000 Globalization Specification Version 1.0 with Amendment 2 Linux Internationalization Initiative (Lil8nux).
Кириллизация X Window
X Window в современных дистрибутивах кириллизованы «из коробки». Однако зачастую некоторая настройка X Window все же требуется. Рассмотрим кириллизацию X Window 4.x.
Установка шрифтов для X Window
Сначала необходимо установить кириллические шрифты. В современных дистрибутивах они включены в поставку, однако возможно найти и установить свои кириллические шрифты.
Предварительно следует проверить, установлены ли вообще кириллические шрифты в вашей операционной системе. Для этого выполните команду: xisfonts | grep koi8. В результате ее выполнения будет выдан список кириллических шрифтов. Еще один вариант – поискать местоположение шрифта, в котором заведомо присутствует кириллица: find / – name crox*.pcf*.
В том случае, если кириллические шрифты не обнаружены, установите их самостоятельно:
1. Создайте каталог /usr/lib/X11/fonts/cyrillic и скопируйте туда кириллические шрифты.
2. Если шрифты получены в формате BDF (файлы *.bdf), то перед использованием их необходимо скомпилировать. Для каждого шрифта выполните: bdftopcf -о <font>.pcf <font>.bdf.
3. В каталоге шрифтов для X Window должен присутствовать файл fonts.dir, хранящий список шрифтов, находящихся в каталоге. Этот список создается С ПОМОЩЬЮ команды: cd Скаталог где лежат шрифты>; mkfontdir.