Ru-Board.club
← Вернуться в раздел «Программы»

» GoldenDict

Автор: ramix
Дата сообщения: 22.11.2014 08:46
BKSRU
В Lingvo они системно не ищутся. К тому же, установленное ограничение на минимальные 4 символа исключает часть транскрипции и помет из поиска (например, n, adj, v, adv - основные части речи в англ. яз. и т. д.), в результате чего ищущий получит ложное представление о их наличии в словаре. Если уж очень редкий ищущий захочет их найти, то он может открыть интересующий его словарь в текстовом редакторе и найти всё, что ему нужно.

Я уже ставил себя на место крейзи-юзера, который хочет найти слова по транскрипции. Взял транскрипцию такого коротенького слова как low - и насчитал девять вариантов ее написания (из-за различных применяемых транскрипционных значков). Представляете, сколько вариантов будет у чуть более длинных слов?

А если исходить из принципа "Мало ли для чего это может пригодится", то надо снять ограничение в 4 минимальных символа для поиска текста.

Добавлено:
Lingvo, к тому же, автоматически исключает из индексации и поиска часть популярной пунктуации, дабы не занимала и не мешала.
Автор: BKSRU
Дата сообщения: 22.11.2014 10:36
ramix

Цитата:
В Lingvo они системно не ищутся. К тому же, установленное ограничение на минимальные 4 символа исключает часть транскрипции и помет из поиска (например, n, adj, v, adv - основные части речи в англ. яз. и т. д.), в результате чего ищущий получит ложное представление о их наличии в словаре.

На самом деле, например в режиме Wildcards таких ограничений нет и пользователь вполне может найти статьи относящиеся, например к фр.. Ну а если пользователь захочет найти упоминание о хим. и т.д., да мало-ли какие могут быть пометы в словарях? Они ведь не только переводческие могут быть.
Автор: ramix
Дата сообщения: 22.11.2014 11:29
Я, например, могу понять, почему Lingvo исключила пометы из поиска. Особого смысла в этом нет. Даже при их относительной стандартизации. В разных словарях они различаются, кто по-русски их пишет, кто по-английски, по разному сокращают (например: adv, adv., нар., нареч.). Если человеку они нужны там для научной работы, то он и внутрь словаря залезет в текстовом редакторе и поищет там.

А объем, занимаемый пометами и пр. немалый. В некоторых словарях они практически в каждой статье присутствуют.

Плохо, что не будет системы. И придется для каждой словарной оболочки вырабатывать свои привычки. Одно и то же в них будет по-разному работать.

Я вот думаю сейчас - надо ли дополнительно обвешивать словари для GoldenDict тегами исключения из индексации? Если сделать так, то уменьшится индекс, и наоборот, увеличится сам словарь. Как ни делай, выигрыша не получишь.
Автор: Abs62
Дата сообщения: 22.11.2014 11:40
Пометы - это как правило аббревиатуры, обычно не длиннее трёх символов. А значит, так и так в индекс не попадающие.
Автор: ramix
Дата сообщения: 22.11.2014 11:52

Цитата:
обычно не длиннее трёх символов

Но есть масса распространенных и длиннее: прил., нареч., мест., техн., банк., экон., pron., past p., pres. p. и пр.

Ладно, бог с ними, уживемся как-нибудь с форками. Навесить теги - не проблема.
Автор: Abs62
Дата сообщения: 22.11.2014 17:44
ramix
Вот, пробуйте - goldendict-1.5.0-RC-442-g83397ce(EXE only).7z - 1.25 MB
В дополнение к [no][!trs][/no] из индексирования исключаются [no][s], [url], [video], [preview][/no]. [no][t] и [p][/no] за отсутствием единодушия по этому вопросу трогать не стал.
Автор: AndroS
Дата сообщения: 22.11.2014 17:55
Abs62
По поводу тегов:
1) Сама Лингва тег [p] исключает из полнотекстового поиска, если придерживаться правил обработки языка DSL программой-первоисточником - то тоже надо убрать. Хотя я могу себе представить случаи, когда надо отловить что-то по пометам, с большим трудом.
2) А вот для чего поиск по транскрипции нужен - вообще не пойму. Скажите, как ввести в строку поиска фрнетические символы? Извращение какое-то...
Автор: CAEman
Дата сообщения: 22.11.2014 18:14
justman20

Цитата:
А словари в таком случае надо поместить в папку "CONTENT", да? Потому что область выбора директории словарей становится нерегулируемой (неактивной). И мне предлагается только этот путь.

Просто попробуйте сделать вместо этой папки одноимённую символическую ссылку на папку со словарями.

Добавлено:
Tvangeste

Цитата:
Попробуйте еще Forvo включить, и еще Wiktionary английский, например; там тоже озвучка есть из онлайна. Уж чтобы наверняка. Я только что проверил у себя на Windows XP, слово 'stuff', прекрасно проигралось

Вы же отказывались от поддержки намного более новых версий ОС, ссылаясь на их "возраст"...
Автор: BKSRU
Дата сообщения: 22.11.2014 18:21
Откуда такое слепое подражание Lingvo. Забавно, как показалось (по демонстрационным скринам) что X6 как раз начал подражать GD.
Извините, если фантазии не хватает, то включу свою:
- Ну захотел пользователь найти статьи по хими (или любой иной тематике). Можно получить нечто вроде глоссария.
- Пользователь захотел отловить слова с определенным звуком для отработки произношения, поиск поможет.
По моему достаточно веские доводы.

А вот теперь если следовать правильному поведению Lingvo напомню, что исключение из поиска заголовков не есть хорошо и не дает такой поиск назвать полноценно полнотекстовым.
Автор: CAEman
Дата сообщения: 22.11.2014 18:24

Цитата:
Удивительные у вас системы! Хорошо хоть поддержка Windows XP заканчивается даже у Microsoft, пора уже переходить на Windows 7, пора!

Более того: пора уже переходить на GNU/Linux! Причём давно. А сейчас, когда MS присоединяется к санкциям против России- и подавно...

Добавлено:
anion23

Цитата:
Цитата:
Удивительные у вас системы!

Скорее руки у меня кривые


Linux установится и будет работать в полном объёме для дома и офиса (в некоторые дистр-ы даже GoldenDict входит), причём без "допилов" (в отличие от Виндоус) вне зависимости от степени "кривизны" Ваших рук. Причём, это касается и последующих обновлений до новых версий. Единственное, что для тестирования новых версий GD от разработчиков, руки нужно иметь действительно очень "прямые"...
Мне тоже, когда я купил комп., компьютерщики пытались "впарить" Виндоус (в надежде на приобретение новой "дойной коровы"). Но, во-первых, им пришлось "за так" (опять-таки, в надежде...) пытаться запустить эту ОС, что получилось только после "плясок с бубном" и дискетой, а, во-вторых, вместо "допила" этой ОС до рабочего состояния (уже не "за так") "потерять" меня навечно: я по совету неалчного компьютерщика (с работы) самостоятельно установил Linux без всяких "плясок" и до сих пор им пользуюсь, ни разу не пожалев о своём выборе (жалко только одну хорошую программу, которая могла бы стать ещё лучше, если бы не лишалась из-за позиции своих разработчиков большей части своих потенциальных тестеров)...

Добавлено:
Tvangeste

Цитата:
Возьмите официальный Early Access билд вот отсюда: https://github.com/goldendict/goldendict/wiki/Early-Access-Builds-for-Windows

Скачайте 7z архив и распакуйте его содержимое поверх существующего, там и QtSvg4.dll будет тоже.


А откуда взять официальный Early Access билд основной массе Ваших пользователей, чтобы все библиотеки там тоже были (а то их даже в исходниках дефицит, и без "допила" не скомпилируешь, несмотря на следование Вашему совету и установке новой версии ОС)?
Автор: ramix
Дата сообщения: 22.11.2014 19:38
BKSRU

Цитата:
Забавно, как показалось (по демонстрационным скринам) что X6 как раз начал подражать GD.

Унификация и стандартизация!


Цитата:
- Ну захотел пользователь найти статьи по хими (или любой иной тематике). Можно получить нечто вроде глоссария.


Я еще до первого своего поста на эту тему думал об этом.

Решил еще раз проверить - поискать "хим.".
Подключил группу Ru-En (180 словарей). Запустил поиск по шаблону (в других режимах не ищет - мало символов)...
Ищет, но долго. Как для меня, ну очень долго и сильно замедляет работу компьютера (100% ЦП). Кроме хим., находит и биохим.
Удобно ли? Не знаю, спорно. Не самый лучший метод. Когда счетчик через минут десять показал число найденных слов более 2100, я остановил поиск.


Цитата:
Пользователь захотел отловить слова с определенным звуком для отработки произношения, поиск поможет.


Я выше приводил уже пример касательно слова low и количества возможных вариантов написания его транскрипции - и это только если более-менее придерживаться транскрипции IPA, а если еще и американский метод транскрипции подключить к поиску? Или подмену фонетических значков символами греческого алфавита? Сколько будет вариантов написания всего лишь трехсимвольной транскрипции? Такой метод поиска и обучения не годится. Поверьте мне - практикую и обучение.


Цитата:
А вот теперь если следовать правильному поведению Lingvo напомню, что исключение из поиска заголовков не есть хорошо и не дает такой поиск назвать полноценно полнотекстовым.


Что вы имеете в виду под исключением из поиска заголовков? Про них же речь, вроде, не шла?
Автор: CAEman
Дата сообщения: 22.11.2014 19:40
leiris

Цитата:
(utf-16 [лень было перегонять в utf-8])


Зря: ужимает файл раза в 2, причём, без всякой дополнительной нагрузки на систему при дальнейшей работе со словарём...

Добавлено:
BKSRU

Цитата:
БСЭ скачайте с рутреккера.
Там все поправлено и не только картинки.


А прямую ссылку не сможете выложить? В попадавшихся мне до сих пор БСЭ (правда, до ветки Руборда со словарями Лингво я пока не дошёл) не хватает много картинок.

Заранее благодарю.
Автор: ramix
Дата сообщения: 22.11.2014 21:07
Abs62

Цитата:
Вот, пробуйте - goldendict-1.5.0-RC-442-g83397ce(EXE only).7z - 1.25 MB

Спасибо, закончит индексацию - отпишусь.
Автор: BKSRU
Дата сообщения: 23.11.2014 05:57
БСЭ http://rutracker.org/forum/viewtopic.php?t=4483562

ramix

Цитата:

Я выше приводил уже пример касательно слова low ...

В какой то мере на транскрипции уже собаку съел и меня это не пугает. Не так все запутано. Нормальных пояснений фактически нет, хотя в двух словах можно все разъяснить. И вот как раз поиск по транскрипции возможно поможет проясни кое что тем кому это надо.

В общем я за то, что сломать всегда успеем.
Вот например [URL] мне теперь скорее сего придется возвращать и подобных "улучшений" достаточно. Все таки DSLGD не всем безразличен.


Цитата:
Что вы имеете в виду под исключением из поиска заголовков? Про них же речь, вроде, не шла?

Про них речь заводил еще со времен основания FTS. В Lingvo заголовки не исключены из поиска. В GD решили исключить. С какой стати?
Автор: ramix
Дата сообщения: 23.11.2014 14:06
Abs62
Всё работает ОК. Экономия составила 0,36%.


Цитата:
В Lingvo заголовки не исключены из поиска. В GD решили исключить.


Я пропустил тогда этот момент, кажется.

Сейчас заметил, что заголовки карточек через FTS не ищутся, но заголовки подкарточек ищутся! Возникает социальная несправедливость и неравноправие . По сути, и то, и другое на практике является заголовками. Отношение к ним должно быть одинаковое. Подкарточка она только для удобства составителей является подчиненной, а в LSD она превращается в полноценную карточку.

Если в GD даже составную часть заголовка можно в любом случае найти в окне поиска заголовков, то стоит ли их искать через FTS - что это даст, кроме дополнительного увеличения размера индекса? (Вот если бы GD FTS сортировал, как FTS в Lingvo...) Или в GD FTS есть какие-либо способы поиска, не реализуемые через окно поиска заголовков?

Добавлено:
Интересно, а есть смысл искать [ref] (<<>>) в FTS? Если есть, то в чем он на практике заключается?
Автор: AndroS
Дата сообщения: 23.11.2014 15:00
ramix

Цитата:
Интересно, а есть смысл искать [ref] (<<>>) в FTS? Если есть, то в чем он на практике заключается?

Видимо, такая же экзотика, как и поиск по транскрипции.
А вообще, моё мнение таково: не стоит превращать словарную оболочку в средство для шитья, жнивья и на дуде...
Автор: BKSRU
Дата сообщения: 23.11.2014 16:43
ramix
Не стоит путать FTS с выводом заголовков. В общем то это не должно отразиться на индексе, да и на скорости.

Добавлено:

Цитата:
Интересно, а есть смысл искать [ref] (<<>>) в FTS? Если есть, то в чем он на практике заключается?

Собственно, а чем этот подтекст отличается от остальной части статьи? В чем его вина ?
Автор: ramix
Дата сообщения: 24.11.2014 14:23
BKSRU, Abs62

[no]Одна из причин, почему лучше исключить некоторые части словаря из FTS, это, кроме объема, нежелание копаться в мусоре, который иногда приносит FTS. Как говорится, почувствуй себя бомжом.

Если, например, есть (редкая!) надобность поискать по транскрипции, то можно открыть словарь и заменить или просто удалить в нем теги [t] - легко и просто (и дело опять же идет к уменьшению размера!).

То же касается и помет - обрамить их тегом [c][i] вместо [p] - и всё - FTS будет работать на них.

Тег [t] уже частично стал атавизмом, так как с приходом Юникода отпала необходимость использовать специальный шрифт для символов, обрамленных тегом [t]. А вот функцию исключения из индекса он еще несет в себе.

Что касается ссылок - нашли мы ссылку, например, на какую-либо карточку... А толку с этой информации? Только то, что такая-то и такая-то карточка есть в словаре? Но нам нужна не эта информация, а сама карточка. Вместо ссылки лучше иметь под рукой заголовок этой карточки.[/no]
Автор: BKSRU
Дата сообщения: 24.11.2014 14:37
leiris

Цитата:
такая фишка существует только для немецкого языка?

Что значит фишка? Движки разные (вернее один от какой либо фирмы), а вот голоса могут быть разные (но к этому движку). Хотя тут можно немного запутаться.
В общем так яснее http://rutracker.org/forum/viewtopic.php?t=4350169
Сомневаюсь, что нейтив отличит если речь об отдельных словах или предложениях. В общем для словарных дел самое то. Интонацию в тексте хоть и соблюдает, но монотонность (вернее безэмоциональность) уже может себя выдавать .
Что радует это то, что даже русский на очень приличном уровне. Единственное, что не всегда в вопросительном предложении делает повышение (но это уже каприз). Немецкий не проверял, но если с русским справляется...

Так же качественный английский (качество других голосов не проверял) движок от Neospeech
http://rutracker.org/forum/viewtopic.php?t=3386156

Добавлено:
ramix
Что ссылка, что пометы могут быть просто встроены в текст и быть частью предложения, статьи. Зачем терять такой поиск? Мне кажется вы забываете, что кроме переводческих словарей много энциклопедичного характера.
А пользователю все равно как работает FTS и где он копается. Зато если приспичит, то выяснит, а почему собственно транскрипцию исключили из поиска? Не утверждаю, что завтра все кинутся искать звуки для той цели которую предложил. Но такая возможность в целом не исключена. Я вот предполагал ее использовать.
Автор: ramix
Дата сообщения: 24.11.2014 15:48
BKSRU
Больше десяти лет пользуюсь Lingvo, и не могу припомнить, чтобы я досадовал из-за того, что потерял что-то при поиске (а там и пометы, и транскрипция, и ссылки исключены из поиска).

Можно еще и третью причину привести - меньше мусора при поиске - больше скорость (а скорость FTS-поиска у GD пока ниже, чем у LV).
Автор: BKSRU
Дата сообщения: 24.11.2014 16:22
ramix
Мне кажется все просто - все, что относится к тексту статьи (не исключая заголовки) должно быть найдено. На то он и FTS. За счет урезания якобы ненужного текста в статье не стоит пытаться что либо ускорить. Тем более это не принесет сколько нибудь заметного выигрыша.
Автор: anion23
Дата сообщения: 24.11.2014 22:13
Abs62
Проблематично осуществить выборочное отключение словарей на полке, когда в группе их очень много, так как развернутая полка не умещается в размеры экрана. Вот например, выбираю группу все словари, и хочу отключить онлайн-википедию. Удобно было бы это сделать одним кликом мышки по иконке на полке, но википедия находится где-то в середине списка и найти ее на полке просто нереально при таком большом количестве словарей. Есть ли выход из этой ситуации кроме отключения в настройках? Может стоит, как вариант, добавить опцию "отключить словарь" в контекстное меню панели навигации по переводу?..
Автор: Abs62
Дата сообщения: 24.11.2014 23:00
anion23
А чтобы включить словарь обратно, всё равно придётся ползать по полке, потому как в списке результатов он уже не появится. И если это будет просто нереально, что тогда делать?
Автор: anion23
Дата сообщения: 25.11.2014 10:22
Abs62

Цитата:
А чтобы включить словарь обратно, всё равно придётся ползать по полке

Включить обратно легче. Можно изолировать любой словарь, а затем включить все, т.е. в два клика и без ползания по полке.
Автор: sudha79
Дата сообщения: 26.11.2014 12:40
Please upload new link for
Longman business english dictionary with sounds and pictures.
Автор: MasteRAssassiN
Дата сообщения: 26.11.2014 20:04
For sudha79

Best En-En

http://thepiratebay.se/torrent/5205813/Goldendict_dictionary_interface_and_english_dictionaries
Автор: sudha79
Дата сообщения: 27.11.2014 09:22
Hi MasteRAssassiN Thanks but I have asked
Longman business english dictionary
http://lingvodics.com/dics/details/3112/
please try to upload it.
Автор: MasteRAssassiN
Дата сообщения: 27.11.2014 19:28
http://forum.ru-board.com/topic.cgi?forum=93&topic=3408&start=40#21

".... * Имя словаря: Longman Business English Dictionary 2nd Edition (En-En).
* Конвертировал под Lingvo: miled--------------------------------------------------------------------------!!!! (on ftp)
* Описание: Самый объемный на сегодняшний день учебный словарь международного делового английского языка.
* Имя файла словаря: En-En_Longman_Business_Dictionary_1_0.rar
* Залито на KVK (в /from_miled/En-En_Longman Business English Dictionary/) и на приватный фтп olympic911. ..."
Автор: anion23
Дата сообщения: 27.11.2014 19:38
Abs62

Цитата:
А чтобы включить словарь обратно, всё равно придётся ползать по полке, потому как в списке результатов он уже не появится. И если это будет просто нереально, что тогда делать?

Если это не слишком сложно, то удобным вариантом было бы в меню словарной полки рядом с элементом "Расширенное меню со всеми словарями" добавить "Отключенные словари" с выпадающим списком...
Автор: sudha79
Дата сообщения: 28.11.2014 04:02
Oh MasteRAssassiN once again thanks.
But can't download from onlinedisk.ru in our country. and I have no knowledge toget it from ftp. Please upload it in depositfiles if you have the dictionary.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156

Предыдущая тема: Total video converter 3.14 ошибка конвертации


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.