[Home]
КРАТКИЕ ХАРАКТЕРИСТИКИ СЛОВАРЕЙ Polyglossum




    С тех самых пор как я сел за изучение Linux основной проблемой для меня было отсутствие хороших словарей для этой операционной системы (как никак почти вся документация на английском языке и как - то читать ее надо). В некотором смысле словари Polyglossium фирмы Ets. (www.ets.ru) всегда являлись для меня идеалом. Единственным недостатком данных словарей являлось отсутствие доступной Linux-версии. Насколько мне известно Linux - версия данных словарей существует, точнее существует упоминание об оболочке для различных операционных систем (в том числе и Linux) на www.ets.ru, но найти свободную для скачивания версию оболочки для Linux я так и не смог.
    Сами словари поставляются данной фирмой вместе с программой для их просмотра. Выглядит это примерно следующим образом

Рис. 1 Словари Polyglossum II. Программа Polyglossum 1.80 для MS Windows

Кроме того данной фирмой предоставляются демонстрационные версии словарей, которые и используются в моей программе. Демо-версию словарей можно достать здесь  pg18sfx.exe.

Имеет смысл привести краткие характеристики этих словарей.

Во-первых в одном файле собраны сразу два словаря: англо-русский и русско-английский, что редко встречается в других словарях. При этом организовано все довольно таки неглупо: словарная статья состоит из строк, на которые есть указатели из англо-русского словаря и из русско - английского. Например (статья взята из словаря soft.pgb). Английский вариант перевода слова "compulsory"

Рис 2. Англо-русский словарь

Как видно в данном случае статья состоит из двух строк. Рассмотрим первую из них: каким образом осуществляется перевод слова "обязательный"

Рис. 3 Русско-английский словарь (1)

Если посмотреть внимательно, то первые две строки в данных словарях: рис. 1 и рис. 2 совпадают.
Теперь если посмотреть каким образом осуществляется перевод слова "принудительный" то можно увидеть совпадающую строчку (строчка 2 на рис. 2 и строчка 1 на рис. 4) и в данном варианте перевода

Рис. 4 Русско-английский словарь (2)

Таким образом словарные статьи для англо-русского и русско-английского словаря одни и теже. Откуда следует тривиальнейший вывод о том что таким образом экономится колосальное количество места на Вашем жестком диске. Кроме того по поводу сохраненного места следует отметить, что :

Во-вторых словарные статьи хранятся в сжатом виде. Для сжатия применен метод Хаффмана , который выгодно отличается от других методов простой процедурой декодирования и довольно высокой степенью сжатия. По поводу сжатия следует отметить, что сами словарные статьи занимают порядка 50% всего объема словаря, что в общем-то не много и что очень хорошо характеризует степень сжатия словарных статей и быть может не с лучшей стороны характеризует "сжатие" других (отличных от словарных статей, например, массива индексов и самое главное списка слов для быстрого поиска) данных этого словаря.

В-третьих просто громадный выбор словарей (причем не только англо-русских но и немецко-русских, финско-русских и т.д. и т.п.) и просто ужасающее количество слов в них :-). Так например самый большой из имеющихся у меня словарей: Инженерный (enginee.pgb) содержит 172264 английских и 180046 русских слов и занимает при этом порядка 16Mb на жестком диске. И это при том что только один список английских слов (в не заархивированном виде) занимает 3 Mb, а сколько там сами словарные статьи занимают я даже говорить побаиваюсь. Следует сказать пару слов по поводу объема словарных статей. Лично меня громадный список со значениями данного слова не привлекает, поэтому мне нравится краткость перевода специализированных словарей, например указанного на рис.2 англо-русского компьютерного словаря. Но люди бывают разными и кому-то нравится иметь богатство выбора, и специально для таких существуют общие словари (например Большой англо-русско-английский словарь) см. рис. 5

Рис. 5 Большой англо-русский словарь (обратите внимание на объем словарной статьи)

В-четвертых благодаря усилиям Вашего покорного слуги теперь доступно описание формата данных словарей, что позволит Вам писать собственные программы, использующие данные словари.

Где достать данные словари?
В последнее время я стал получать много писем с просьбами рассказать, где можно достать словари большего объема. По данному поводу я могу сказать следующее:
данную программу я составлял именно по той причине что существует просто громадный выбор данных словарей. В частности у меня на "старых" компашках существует порядка 76Мб данных словарей немецко-русско-немецких и англо-русско-английских. Я уверен на сто процентов что на любом диске со словарями существует и данный словарь. Он очень распространен!
Достать из сети данный словарь тоже можно. Раньше с помощью ftpsearch'а я находил данные словари. Для поиска задавал soft.pgb или pgb (soft.pgb - наиболее распространенный словарь). В последнее время они куда-то пропали. Но вы конечно должны понимать что выкладывание для свободного скачивания данных словарей - нарушение авторских прав.
И наконец самый простой, но не самый дешевый путь для получения данных словарей - купить их у Ets. Но если вы имеете желание пользоваться kdictionary, то покупать вы должны словари версии 2.0 (файлы с расширением *.pgb).