Ru-Board.club
← Вернуться в раздел «Программы»

» GoldenDict

Автор: BKSRU
Дата сообщения: 14.11.2014 18:15
Abs62
Возможно здесь была бы интереснее иконка словаря:
Автор: Abs62
Дата сообщения: 14.11.2014 18:42
BKSRU
Пожалуй, да. Сделаю, это несложно.
Автор: ramix
Дата сообщения: 16.11.2014 17:27
Abs62
Возможно ли сделать так, чтобы щелкнув на заголовке в окне вывода заголовков словаря фокус оказывался не в начале списка карточек, а на карточке того словаря, заголовки которого выведены в окне списка заголовков?
Автор: Abs62
Дата сообщения: 16.11.2014 18:32
ramix
В принципе можно, наверно, хотя простого пути я так сразу не вижу. А сильно нужно?
Автор: ramix
Дата сообщения: 16.11.2014 23:03
Abs62
Полезно при выверке словарей путем проверки заголовков. Можно, конечно, проверяемый словарь каждый раз загонять в пустую группу - там ему другие мешать не будут, но вдруг найдется способ выводить фокус в общей группе.
Автор: Abs62
Дата сообщения: 17.11.2014 17:18
ramix
Пробуем - goldendict-1.5.0-RC-439-g46298a8(EXE only).7z - 1.25 MB
Автор: ramix
Дата сообщения: 17.11.2014 18:31
Abs62
Всё работает хорошо. Спасибо!
Автор: ramix
Дата сообщения: 19.11.2014 12:32
Abs62
В файле конфигурации есть параметр
<maxHeadwordSize>N</maxHeadwordSize>

А какова судьба заголовков, превышающих N?

Например, я указал 128 и с удивлением обнаружил, что заголовки, превышающие данный параметр, отсутствуют в списке заголовков, равно как и карточки в подключенном словаре. Мы когда-то обсуждали данный параметр. Я-то думал, что заголовки, превышающие N, будут просто обрезаться для экономии до данной величины и показываться в обрезанном виде, но не игнорироваться вместе с карточкой (хотя статистика их учитывает). Или я чего-то не понимаю в механизме функционирования данного параметра?
Автор: Abs62
Дата сообщения: 19.11.2014 13:24
ramix

Цитата:
А какова судьба заголовков, превышающих N?

Судьба незавидная - они отбрасываются как ошибочные. Это не экономия, это такая проверка на допустимость.
Автор: romanticUK
Дата сообщения: 19.11.2014 13:27
Abs62
Так, может, лучше их урезать до указанной величины?
А выбрасывать только в том случае, когда карточка пустая?
Автор: ramix
Дата сообщения: 19.11.2014 13:31
Abs62


Цитата:
Судьба незавидная - они отбрасываются как ошибочные. Это не экономия, это такая проверка на допустимость.


В чем резон отбрасывания? Сами себя лишаем карточек...

Добавлено:
Я бы предложил сделать два параметра:

<maxPermissableHeadwordSize> - длиннее этого GoldenDict будет игнорировать карточки с такими заголовками
и
<maxShowableHeadwordSize> - та часть, которая длиннее этого, просто не будет показываться
Автор: Abs62
Дата сообщения: 19.11.2014 14:24
ramix

Цитата:
В чем резон отбрасывания? Сами себя лишаем карточек...

Подразумевается, что если заголовок слишком длинный, это не настоящий заголовок, а ошибка в словаре. Например, потерянный пробел в начале строки в DSL или ещё что.
Автор: ramix
Дата сообщения: 19.11.2014 14:43
В случае потерянного пробела можно было бы выдать ошибку в лог...
И вообще было бы хорошо, чтобы в логе писалось о всех чересчур длинных заголовках, которые надо было бы проверить на предмет ошибки.
Автор: BKSRU
Дата сообщения: 19.11.2014 14:47
Abs62

Цитата:

Подразумевается, что если заголовок слишком длинный, это не настоящий заголовок, а ошибка в словаре. Например, потерянный пробел в начале строки в DSL или ещё что.

Однако, это поощрение ляпов. К тому же не решает проблему, а усугубляет.
IMHO
Автор: Abs62
Дата сообщения: 19.11.2014 15:14
BKSRU

Цитата:
Однако, это поощрение ляпов. К тому же не решает проблему, а усугубляет.

GD - программа в первую очередь для юзеров, а не для словаределов. А типичный юзер, увидев в заголовках что-то непонятное, не словарь редактировать полезет, а на программу грешить начнёт.
Автор: BKSRU
Дата сообщения: 19.11.2014 15:30
Abs62
Не ясно как такой подход решает проблему с потерей пробела?
Т.е. если пробел потерян то слияние происходит? На сколько я понял вообще ничего не происходит. Парсер просто доходит до этого якобы липового заголовка и показывает то, что и должен показать.
И в худшем случае мы просто не увидим карточку, если таковая имеется.

Хорошо, просто если замечены длинные заголовки, то может стоит увеличить до приемлемого ограничения, если еще есть причины о которых я не знаю?
Но на мой взгляд ограничения вообще бессмысленны. Ну есть правильный порядок построения словарей. Ну с чего бы это порядок нарушать? А как тогда ляпы вообще обнаружить? Не думаю, что у Lingvo есть подобные ограничения. Кривую карточку как то можно обнаружить. Бесследно исчезнувшую наверное не реально.



Добавлено:
С другой стороны пользователи словарей должны давать фитбаки (или как их там).
Автор: Abs62
Дата сообщения: 19.11.2014 16:07
BKSRU

Цитата:
Т.е. если пробел потерян то слияние происходит? На сколько я понял вообще ничего не происходит. Парсер просто доходит до этого якобы липового заголовка и показывает то, что и должен показать.

Строка без начального пробела будет воспринята как заголовок, только и всего.

Цитата:
Хорошо, просто если замечены длинные заголовки, то может стоит увеличить до приемлемого ограничения, если еще есть причины о которых я не знаю?

Ограничение - 256 символов, разве этого мало? Весь мой предыдущий пост и до 200 не дотягивает, к примеру.
Мир словарей одним DSL не ограничивается, есть и другие форматы. В которых, если определённая ошибка встретится, может и "заголовок" на мегабайты образоваться.
Автор: BKSRU
Дата сообщения: 19.11.2014 16:24

Цитата:
Ограничение - 256 символов, разве этого мало?

Ну тогда я не понимаю почему сыр-бор? Тут цифра 128 прозвучала и что заголовки теряются.
Автор: Abs62
Дата сообщения: 19.11.2014 17:02
BKSRU

Цитата:
Ну тогда я не понимаю почему сыр-бор? Тут цифра 128 прозвучала и что заголовки теряются.

Прозвучало "например, я указал 128". Ну, если человек хочет для DSL указать меньше, он в своём праве.
Вот насчёт логирования таких заголовков можно подумать.
Автор: BKSRU
Дата сообщения: 19.11.2014 17:09

Цитата:
Вот насчёт логирования таких заголовков можно подумать.

Может в перечне заголовков указать их количество (при их наличии) наряду с отфильтрованными. Хоть знать где искать.
Автор: ramix
Дата сообщения: 19.11.2014 19:01
Вот если бы в окошке "Заголовки словаря" разместить опцию "Подсчитать количество заголовков длиной более N символов", то можно было бы ввести свою цифру N и увидеть, сколько заголовков превышают N символов и проверить их на предмет ошибки. Но это опять же всё для этих треклятых словаределателей, о которых мало кто хочет заботиться. )
Автор: yozhic
Дата сообщения: 19.11.2014 19:54

Цитата:
Подсчитать количество заголовков длиной более N символов

Мне кажется, проще это регулярками сделать в текстовом редакторе. Для ГД разве это не лишний функционал?!
Автор: ramix
Дата сообщения: 19.11.2014 23:02
Не так, наверное, выразился я. Важно, конечно, не подсчитать количество длинных заголовков, а показать их для проверки. Это окошко с заголовками уже помогает отлавливать разного рода ошибки - например, вводишь квадратную скобку и видишь, какие заголовки подцепили теги или вводишь длинное тире и отлавливаешь заголовки, где оно использовано, и меняешь на дефис для улучшения поиска и т. д. (стандартизация заголовков - целый этап).
Автор: BKSRU
Дата сообщения: 20.11.2014 14:55
Наверное действительно не стоит лишней информацией перегружать интерфейс.
Надо прсто дать возможность поиска таких заголовков простым регеспом - .{128,}
Автор: romanticUK
Дата сообщения: 20.11.2014 15:00
BKSRU

Цитата:
Надо прсто дать возможность поиска таких заголовков простым регеспом - .{128,}

это в какой проге и как?
Автор: BKSRU
Дата сообщения: 20.11.2014 15:13
romanticUK
В самом GD при выводе заголовков в режиме регеспа.
Автор: ramix
Дата сообщения: 21.11.2014 17:46
Abs62
Скажите, а содержимое тега [t]...[/t] не исключается из индексирования в GoldenDict для FTS?
Автор: Abs62
Дата сообщения: 21.11.2014 19:06
ramix
Насколько я помню, нет, только [!trs].
Автор: ramix
Дата сообщения: 21.11.2014 19:19
Abs62
Может, есть смысл исключать их? Индекс будет занимать меньше места. Ведь никто не ищет практически по транскрипции. DSL в Lingvo исключает содержимое данного тега.

Добавлено:
[no]Если решите исключить, то заодно исключите и теги и [p] - тут еще меньше смысла для FTS-поиска.
[/no]

[s]Добавлено:
[no]И еще - [url] [preview] [video][/no]
Автор: BKSRU
Дата сообщения: 22.11.2014 06:35
Ни транскрипцию, ни аббревиатуру не стоит исключать из поиска. Мало ли для чего это может пригодится. Экономии это не принесет.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156

Предыдущая тема: Total video converter 3.14 ошибка конвертации


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.