Небольшой фак для тех, кто компилирует словари Мультитран для ПРОМТ-а.
Когда Вы скачиваете одну страничку мультитрановского словаря (вручную или с помощью скрипта, который есть где-то на этом сайте), то получается что-то вроде этого:
словарь Мультитран О Мультитране FAQ Реклама на
сайтеdimockВыходНастройки
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z >>
Термины по тематике Биржевой термин (4587 статей)Список
тематик
"best efforts" agreement соглашение о "максимальных усилиях"
(raiper)
"company out " "Без фирмы" Неудачная торговая сделка из-за
неправильного обозначения фирм контрагентов (SergeyL)
"declared" shares объявленные акции (Sukhopleschenko)
"in the box" "в ящике" Сообщение брокера / дилера клиенту о
получении от контрагента телеграфного уведомления о том, что
фактическая поставка ценных бумаг по ранее заключенной сделке
осуществлена (SergeyL)
12b-l fund фонд 12А-1 (dimock)
144 Stock ценные бумаги с ограничением обращения
(Sukhopleschenko)
3-box reversal трёхклеточный разворот (dimock)
50K Accounting Audit
a parcel of shares пакет акций
A share неголосующая акция
A share 'безголосая' акция
A share 'безголосая'акция
A/D indicator accumulation/distribution indicator (dimock)
A/D line advance/decline line (dimock)
AAP Asset Allocation Plan
AARP American Association of Retired People (dimock)
abandonment option опцион на отказ от проекта
ABN ABN AMRO Bank
abnormal return повышенная доходность (dimock)
abnormal return отличная от нормальной доходность (dimock)
Оценить сайт
Переделать такую свалку слов в словарь – нелегкая задача. Первое что нужно сделать – это удалить повторения, которые находятся в основном в шапке страницы. Для начала установите программу Word Utilities с сайта
http://wordutilities.chat.ru Выполните следующее: Файл – Объединение файлов, а дальше по инструкции. Теперь все страницы с нужными статьями лежат в одном файле. Потом удалите все повторы, и при помощи этой же программы наведите порядок в тексте. После установки у нее появится своя панель в Ворде на самом верху – WU. Параметры можно выбрать с помощью команды Параметры Word Utilities, а сам процесс запускается командой Перелопачивание текста (в первый раз я не сразу ее нашел). Обычно я отмечаю опции 2, 4, 5, 9.
Когда в файле останется только один словарь, нужно разделить английские и русские половины статей двойным пробелом, который является разделителем английской и русской части статей в словарях, которые ПРОМТ допускает для компиляции. Обычно большинство англо-русских статей имеет практически одинаковую структуру: Английский термин – пробел – русский термин. Такие статьи можно обработать с помощью мощного текстового редактора. Я использую Иероглиф. Сайт –
http://www.adelaida.net/hieroglyph/download.html Нужно создать список замен, который будет искать сочетание символов (если это англо-русский словарь):
Английская буква (любой регистр) – пробел – Русская буква (любой регистр)
заменить на
Английская буква (любой регистр) – двойной пробел – Русская буква (любой регистр)
Предварительно удалите двойные пробелы из текстов. Список замен Иероглифа для англо-русских и русско-английских словарей находится здесь –
http://slil.ru/27434205 Вместо двойного пробела там знак решетки – #. В процессе замены учитывайте и сохраняйте регистр при помощи опций программы.
Но есть и другие статьи, которые состоят только из слов одного языка или имеют любые знаки, кроме букв, в конце английской и в начале русской части статьи, которые нельзя обработать с помощью этого списка. Такие примеры есть и в этом тексте. Их придется обработать вручную или создайте для них свой список, если их много.
И, наверное, последнее. К сожалению, ПРОМТ не умеет обрабатывать статьи со скобками. В принципе, они и не нужны. Есть четыре вида скобок.
1. Скобки в английской части. Обычно это комментарий на английском языке, из-за которого программа не найдет точного эквивалента в оригинальном тексте.
2. Пометы в русской части. Тоже влияют на качество перевода. Появятся в переводе.
3. Комментарии в русской части. Тоже влияют на качество перевода. Появятся в переводе.
4. Авторы словарей. Тоже влияют на качество перевода. Появятся в переводе.
В итоге после компиляции в скобках появляются лишние пробелы, которые потом нужно редактировать в Редакторе словарей (встроенный модуль программы ПРОМТ). Он медленно работает, поэтому скобки лучше удалить заранее. Это мое мнение.
У мультитрановских словарей структура проще, чем у Лингво, поэтому им повезло больше. Наверно, я больше не буду заниматься компиляцией, а готовые словари очень скоро выложу в этой ветке. Не торопитесь компилировать свои словари.