Как создать собственный словарь для OpenOffice.org/LibreOffice
Материал из Forumooo wiki
Версия от 19:04, 20 октября 2012; Yakov (Обсуждение | вклад)
Как создать собственный словарь для OpenOffice.org/LibreOffice
Для создания словаря понадобится:
- Hunspell - система проверки орфографии http://downloads.sourceforge.net/hunspell/
- Файл со словами, из которых необходимо создать словарь. В качестве основы это может быть, например, пользовательский словарь OpenOffice.org. В нашем примере этот файл будет называться input.txt
- Если создание словаря планируется в Windows, то для создания словаря потребуется Cygwin http://www.cygwin.com/
Перевод документации по Hunspell доступен по адресу: http://mozilla-russia.org/projects/dictionary/hunspell.html
Приступим к сборке.
- Скачиваем hunspell-1.X.X.tar.gz c http://downloads.sourceforge.net/hunspell/.
- Распаковываем. Копируем файл affixcompress из hunspell-1.x.x\src\tools\ в рабочий каталог.
- Копируем в рабочий каталог файл input.txt со словами, из которых надо создать словарь.
- Запускаем скрипт создания словаря:
LC_ALL='C' sort input.txt >sorted.txt LC_ALL='C' ./affixcompress sorted.txt 250
- Словарь создан! Это 2 файла sorted.dic и sorted.aff
Теперь надо в начале аффикс-файла указать служебную информацию о кодировке и типе аффикс-файла
SET UTF-8 FLAG num
- теперь проверяем полученный словарь
hunspell -d sorted
и печатаем слова, которые должны быть в словаре. Если Hunspell их распознал, то словарь работает!
- Приступим к упаковке словаря в расширение. Переименуем файлы словаря:
my_ru-dict.dic my_ru-dict.aff