Как создать собственный словарь для OpenOffice.org/LibreOffice
Материал из Forumooo wiki
(Различия между версиями)
Yakov (Обсуждение | вклад) (Новая страница: «{{DISPLAYTITLE: Как создать собственный словарь для OpenOffice.org/LibreOffice}} == Как создать собственный сл...») |
Yakov (Обсуждение | вклад) |
||
Строка 10: | Строка 10: | ||
Перевод документации по Hunspell доступен по адресу: http://mozilla-russia.org/projects/dictionary/hunspell.html | Перевод документации по Hunspell доступен по адресу: http://mozilla-russia.org/projects/dictionary/hunspell.html | ||
+ | |||
+ | |||
+ | Приступим к сборке. | ||
+ | * Скачиваем hunspell-1.X.X.tar.gz c http://downloads.sourceforge.net/hunspell/. | ||
+ | * Распаковываем. Копируем файл affixcompress из hunspell-1.x.x\src\tools\ в рабочий каталог. | ||
+ | * Копируем в рабочий каталог файл input.txt со словами, из которых надо создать словарь. | ||
+ | * Запускаем скрипт создания словаря: | ||
+ | |||
+ | LC_ALL='C' sort input.txt >sorted.txt | ||
+ | LC_ALL='C' ./affixcompress sorted.txt 250 | ||
+ | |||
+ | * Словарь создан! Это 2 файла sorted.dic и sorted.aff | ||
+ | Теперь надо в начале аффикс-файла указать служебную информацию о кодировке и типе аффикс-файла | ||
+ | |||
+ | SET UTF-8 | ||
+ | FLAG num | ||
+ | |||
+ | * теперь проверяем полученный словарь | ||
+ | |||
+ | hunspell -d sorted | ||
+ | |||
+ | и печатаем слова, которые должны быть в словаре. Если Hunspell их распознал, то словарь работает! | ||
+ | * Приступим к упаковке словаря в расширение. Переименуем файлы словаря: | ||
+ | |||
+ | my_ru-dict.dic | ||
+ | my_ru-dict.aff |
Версия 19:04, 20 октября 2012
Как создать собственный словарь для OpenOffice.org/LibreOffice
Для создания словаря понадобится:
- Hunspell - система проверки орфографии http://downloads.sourceforge.net/hunspell/
- Файл со словами, из которых необходимо создать словарь. В качестве основы это может быть, например, пользовательский словарь OpenOffice.org. В нашем примере этот файл будет называться input.txt
- Если создание словаря планируется в Windows, то для создания словаря потребуется Cygwin http://www.cygwin.com/
Перевод документации по Hunspell доступен по адресу: http://mozilla-russia.org/projects/dictionary/hunspell.html
Приступим к сборке.
- Скачиваем hunspell-1.X.X.tar.gz c http://downloads.sourceforge.net/hunspell/.
- Распаковываем. Копируем файл affixcompress из hunspell-1.x.x\src\tools\ в рабочий каталог.
- Копируем в рабочий каталог файл input.txt со словами, из которых надо создать словарь.
- Запускаем скрипт создания словаря:
LC_ALL='C' sort input.txt >sorted.txt LC_ALL='C' ./affixcompress sorted.txt 250
- Словарь создан! Это 2 файла sorted.dic и sorted.aff
Теперь надо в начале аффикс-файла указать служебную информацию о кодировке и типе аффикс-файла
SET UTF-8 FLAG num
- теперь проверяем полученный словарь
hunspell -d sorted
и печатаем слова, которые должны быть в словаре. Если Hunspell их распознал, то словарь работает!
- Приступим к упаковке словаря в расширение. Переименуем файлы словаря:
my_ru-dict.dic my_ru-dict.aff