Как создать собственный словарь для OpenOffice.org/LibreOffice

Материал из Forumooo wiki

(Различия между версиями)
Перейти к: навигация, поиск
Строка 6: Строка 6:
* Hunspell - система проверки орфографии  http://downloads.sourceforge.net/hunspell/
* Hunspell - система проверки орфографии  http://downloads.sourceforge.net/hunspell/
* Файл со словами, из которых необходимо создать словарь. В качестве основы это может быть, например, пользовательский словарь OpenOffice.org. В нашем примере этот файл будет называться input.txt
* Файл со словами, из которых необходимо создать словарь. В качестве основы это может быть, например, пользовательский словарь OpenOffice.org. В нашем примере этот файл будет называться input.txt
 +
{{Note| Пользовательский словарь {{Office}} находится в профиле пользователя, каталог wordbook, файл Standard.dic.}}
* Если создание словаря планируется в Windows, то для создания словаря потребуется Cygwin http://www.cygwin.com/
* Если создание словаря планируется в Windows, то для создания словаря потребуется Cygwin http://www.cygwin.com/
 +
 +
Строка 27: Строка 30:
  FLAG num
  FLAG num
-
* теперь проверяем полученный словарь
+
* Переименуем файлы словаря:
-
  hunspell -d sorted
+
my_ru-dict.dic
 +
my_ru-dict.aff
 +
 
 +
* Теперь проверяем полученный словарь
 +
 
 +
  hunspell -d my_ru-dict
и печатаем слова, которые должны быть в словаре. Если Hunspell их распознал, то словарь работает!
и печатаем слова, которые должны быть в словаре. Если Hunspell их распознал, то словарь работает!
-
* Приступим к упаковке словаря в расширение. Переименуем файлы словаря:
 
-
  my_ru-dict.dic
+
 
-
  my_ru-dict.aff
+
* Дополнительно можно настроить алгоритм работы механизма исправлений неизвестных слов словаря (команды добавить в файл *.aff)
 +
 
 +
**Не предлагать варианты с пробелами:
 +
 
 +
  NOSPLITSUGS
 +
 
 +
** Ограничить число вариантов исправлений, генерируемых встроенным алгоритмом
 +
 
 +
MAXNGRAMSUGS 4
 +
 
 +
 
 +
** Настроить порядок букв для алгоритма подстановки
 +
 
 +
TRY абвгдеёжз.....эюя'
 +
 
 +
необходимо их расположить в последовательности от наиболее часто употребляемой к менее употребляемой
 +
 
 +
 
 +
* Приступим к упаковке словаря в расширение.

Версия 19:15, 20 октября 2012


Как создать собственный словарь для OpenOffice.org/LibreOffice

Для создания словаря понадобится:

Note.png Пользовательский словарь LibreOffice/OpenOffice находится в профиле пользователя, каталог wordbook, файл Standard.dic.



Перевод документации по Hunspell доступен по адресу: http://mozilla-russia.org/projects/dictionary/hunspell.html


Приступим к сборке.

LC_ALL='C' sort input.txt >sorted.txt
LC_ALL='C' ./affixcompress sorted.txt 250

Теперь надо в начале аффикс-файла указать служебную информацию о кодировке и типе аффикс-файла

SET UTF-8
FLAG num
my_ru-dict.dic
my_ru-dict.aff
hunspell -d my_ru-dict

и печатаем слова, которые должны быть в словаре. Если Hunspell их распознал, то словарь работает!


NOSPLITSUGS
MAXNGRAMSUGS 4


TRY абвгдеёжз.....эюя'

необходимо их расположить в последовательности от наиболее часто употребляемой к менее употребляемой


Личные инструменты
Пространства имён
Варианты
Действия
Компоненты
Общие вопросы
Совместимость
Навигация
Инструменты