Ru-Board.club
← Вернуться в раздел «Программы»

» dtSearch

Автор: revinsky
Дата сообщения: 08.12.2003 21:15
evoroz
ссылочку дай поглядеть, где об этом говорится
Автор: evoroz
Дата сообщения: 09.12.2003 09:36
Похоже нашли и убрали ссылочку
Автор: ppch
Дата сообщения: 09.12.2003 17:33
evoroz


Цитата:
И что она делает?


То же что и dtSearch (без всяких излишеств типа Group Policy, Searching for a List of Words, Phonic Search и т.д.) + OCR для поиска сканированных файлов.

revinsky


Цитата:
а так, если бы точно знать, какие файлы переводить, я бы к скачанному мной dtSearch 6.30 (Build 6386) перевел бы весь интерфейс и хелп-файлы


Переводить надо следующие файлы:
- dtIndexer.exe - диалог индексации и все что c этим связано
- dtSearch.exe - поиск, результаты поиска, главное окно
- dtIndexerw.exe, dtSearchw.exe - можно не переводить, просто переименовать exe-ки без w на конце. эти файлы такие же, только вроде как-то лучше отображают ресурсы под Win2000/XP, но что-то я этого не заметил.

эти не очень важно:
- dtinfo.exe - диагностика
- dtsetup.exe - инсталляция
- dtWebSetup.exe - Web\CD Wizard
- cdrun.exe - CD Launcher, в версии 6.30 вроде он не будет выводиться
- dtImage.exe - простенький просмотрщик графических файлов, используется редко
- extext.exe - вообще не понял нафиг надо
- forixw.exe - для одновременного создания нескольких индексов
Справка, вызываемая по F1 из приложения:
- dtSearch.chm
- dtSearch_Web.chm
Другие файлы:
- SearchIntro_Desktop.html, SearchIntro_Engine.html - текст выводимый в подложке главного окна
- dtsearch_about.html - текст выводимый в About
- dtsearch_intro.html - текст вводного сообщения (добро пожаловать ...)

Могу по мере сил и свободного времени помочь в благородном деле русификации dtSearch.
Автор: revinsky
Дата сообщения: 09.12.2003 23:00
ppch
ты уж извини меня, ламера, но как переводить хелпы - это я знаю

а вот как переводить ехе-шники, совершенно не представляю...

если бы язык был вынесен в отдельный файл, как в Тотал Коммандере, например, то это было бы совсем круто...
Автор: ppch
Дата сообщения: 10.12.2003 10:35
revinsky
Ну не знаю кто из нас лемер, но как мне тык проще переводить exe-ки
С английским я не очень дружу
А переводить exe-ки на самом деле очень просто, в общем случае это почти тоже самое что и переводить отдельный файл как в Тотал Коммандере.
Я использую Restorator , есть тема в Варезнике:
http://forum.ru-board.com/topic.cgi?forum=35&topic=2709&start=40#lt
Могу тебе на мыло его выслать с лекарством, там где-то 1,5-2 мега всего.
Инструкция на русском тоже есть



Автор: tox
Дата сообщения: 14.12.2003 13:03
Вчера сравнивал dtsearch engine 6.30 и Cros 4.01.79. Результат вышел такой: обрабатывалась директория (с поддиректориями) 1 221 791 860, содержащая на 99% только текстовые файлы. dtsearch сооружал индекс и затем сжимал его 1 час 9 минут, размер индекса составил 992 331 308. Cros делал индекс чуть дольше (увидев, что явно дольше, я отошел прогуляться), размер индекса 1 066 085 028. По поиску отдельных слов Cros визуально был чуть быстрее, но когда я попытался задать поиск двух слов с заданным интервалом между ними, то поиск шел уже минут пять, причем с нулевым результатом. dtsearch, чуть проигрывая по времени поиска одного слова (буквально секунду-другую), справился с заданием поиска двух слов в заданном интервале друг от друга буквально секунд за 3-5, причем результат был не нулевой (с тем же заданием).
Автор: revinsky
Дата сообщения: 14.12.2003 16:20
tox
а у тебя Cros купленный или триальный?

а то соответствующий топик в Варезнике пуст...
Автор: tox
Дата сообщения: 15.12.2003 12:49
revinsky
Триальный. А по топику ищи Cronos, там мельком и Cros проскакивал.
Автор: by Dim
Дата сообщения: 12.06.2004 17:34
всем привет

из прочитанного я так и не понял: осуществляестя ли поиск с запросами по русскому?
т.е ищет ли он в русских файлах?
Автор: MrPerfect
Дата сообщения: 13.06.2004 03:25
by Dim

Цитата:
ищет ли он в русских файлах?

Да.
Автор: ghosty
Дата сообщения: 10.09.2004 11:59
Я уверен, что кто-то уже специально занимался настройкой DTSearch для правильной индексации русских текстов во всех кодировках, какие только есть
ОЧЕНЬ прошу, вышлите ваши настройки!
forforums<ape>yandex<point>ru
Заранее премного благодарен!
Автор: TITANiKi
Дата сообщения: 04.11.2004 08:27
а все таки жаль что никто не перевел его на русский
классный и мощный поисковик!
Автор: ghosty
Дата сообщения: 13.12.2004 05:14
Помогите хоть советом. Как настроить его, чтобы он во всех русскоязычных файлах искал. А то в одних он индексирует кракозяблики, в других - нормально все.
Может быть есть где-нибудь все-таки "идеальный" файл настройки?
Жалко с ним расставаться. Все-таки мощная штука.
Автор: sbornik2001
Дата сообщения: 18.01.2005 00:01
ppch

Цитата:
Если кому нужен словарь русских стоп-слов для dtSearch, сообщите - вышлю по мылу. В стоп-словаре примерно 500 слов

Если ещё в силе, кинь
Автор: sbornik2001
Дата сообщения: 22.01.2005 23:38
Бесконечно раздражает время создания базы данных dtSearch. Как я понял, файлы LEP302 и LEP303 как-то ускоряют процесс?! Как правильно устанавливать эти файлы? Я распаковал их в отдельную директорию. Затем запустил lepsetup.exe у одного и LEP303.MSI у второго. Установка стартовала, прошла и всё. Ни путей не спросили у меня, ничего. Создание базы никак не ускорилось. Может я что-то неправильно делал? И второй вопрос: ОБНОВЛЕНИЕ базы данных возможно как-то ускорить? Я так понял(по скорости), что прога заново перечитывает все файлы, даже если они не изменялись. Интерфейс на английском и потому мне не понятно, может где-то галку надо поставить? Где можно почитать инфу на русском по работе с dtSearch?
Автор: MrPerfect
Дата сообщения: 23.01.2005 06:07
sbornik2001
К скорости индексирования эти файлы не имеют никакого отношения. Имеют отношение только опции:

Index new or modified documents
Индексировать только новые или изменённые документы

Clear index before adding documents
Очистка индекса перед добавлением документов

Remove deleted documents from index
Удалять ранее удалённые документы из индекса

Compress index after adding documents
Сжатие индекса после добавления документов

Плюс в последних бета-версиях используется новый формат индексов, что по утверждениям производителя даёт прирост скорости 10-15%.
Автор: ghosty
Дата сообщения: 23.01.2005 06:33
sbornik2001

Цитата:
Интерфейс на английском и потому мне не понятно, может где-то галку надо поставить?

Возьми тогда лучше индексатор с русским интерфейсом. DTSearch наиболее эффективен для поиска именно по английским текстам. Русской морфологии он не знает.

MrPerfect

Цитата:
люс в последних бета-версиях используется новый формат индексов, что по утверждениям производителя даёт прирост скорости 10-15%.

По моим ощущениям даже больший.


Цитата:
LEP302 и LEP303


Цитата:
К скорости индексирования эти файлы не имеют никакого отношения.

А в них есть что-нибудь кроме noise words?

Автор: MrPerfect
Дата сообщения: 23.01.2005 06:51
ghosty
Language Extension Pack (LEP) Add multilingual search expansion to your dtSearch powered application, or Internet/Intranet site!
_http://www.dtsearch.co.uk/language.htm

Language Packs include:

Stemming rule files and noise word files for each supported language
Test files to check the operation of stemming in all the supplied languages.
Stemming language selector application
One year of on-line technical support and updates.
Автор: ghosty
Дата сообщения: 23.01.2005 07:01
MrPerfect
Спасибо.

Цитата:
Stemming rule files

Неужели, действительно, работают с русскими словами? И есть ли существенный прирост эффективности при поиске по русским текстам?

Добавлено:
Пошлите и мне тоже тогда: forforums{apfe}yandex.ru
Буду премного благодарен.
Автор: MrPerfect
Дата сообщения: 23.01.2005 07:20
ghosty
Не знаю, я этим не пользуюсь. У меня нет проблем с русскими текстами и так. Тем более на странице речь идёт о 400-й серии, которой нет где скачать. Файлы 300-й свободно лежат здесь
_ftp://support.dtsearch.com/pub/
Пароли есть здесь
http://forum.ru-board.com/topic.cgi?forum=35&topic=7123
Автор: ghosty
Дата сообщения: 23.01.2005 07:27
MrPerfect
Еще раз спасибо.

Цитата:
У меня нет проблем с русскими текстами и так.

Может быть, в таком случае Вы сможете ответить на мои первые два письма на этой странице?
Автор: MrPerfect
Дата сообщения: 23.01.2005 08:47
ghosty
Не могу. У меня выставлено в общих настройках Default encoding - Auto-detect и всё нормально работает. У вас Default encoding? Win 1251? Тогда наверняка при таком выборе многие файлы с другой кодировкой будут нечитаемыми. На файлах с какой кодировкой кракозяблы? Какая версия windows? Региональные настройки - russian?

Вот это используете?

Для Win NT, 2000, XP


Цитата:
Windows Registry Editor Version 5.00

[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage]
"1250"="c_1251.nls"
"1251"="c_1251.nls"
"1252"="c_1251.nls"
"1253"="c_1251.nls"
"1254"="c_1251.nls"
"1255"="c_1251.nls"


Для Win 95, 98, ME


Цитата:
REGEDIT4

[HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\Nls\Codepage]
"1250"="cp_1251.nls"
"1251"="cp_1251.nls"
"1252"="cp_1251.nls"
"1253"="cp_1251.nls"
"1254"="cp_1251.nls"
"1255"="cp_1251.nls"


Для Win 95, 98, ME


Цитата:
Англоязычные программы часто используют в своём интерфейсе шрифт Arial, по умолчанию в Windows не зарегистрирован его русский вариант и вместо нормального текста отображается набор символов, чтобы его зарегистрировать необходимо в файле win.ini (для Win32) в раздел [FontSubstitutes] дописать Arial,0=Arial,204 и перезагрузить компьютер.


Вообще для таких вещей в любой программе есть support. Отправляете подробные данные и ошибки быстро исправляются.
Автор: s79
Дата сообщения: 02.03.2005 02:04
Господа несколько вопросов:
Кто нибудь таки прикрутил CHM к dtSearch?
Можно ли сделать индекс только по оопределенной части XML и если можно то как?
Если кто писал под него плагины, поделитесь опытом.
Автор: Restr
Дата сообщения: 19.03.2005 11:22

Цитата:
Если кто писал под него плагины, поделитесь опытом

Где-то в начале этого топика писали о плагинах.
Попробуй просмотреть весь топик через "Версия для печати"
Автор: yurynok
Дата сообщения: 19.07.2005 08:20
А сд диски кто пробовал создавать? Проблема следующая диск создает нормально, только не запускает поиск, при попытке нажать ПОИСК выходит сохранить файл (скорее всего скрипт для поиска) нажимаешь открыть и все страница не обновляется.... как бороться с этим?
Автор: Alex_B
Дата сообщения: 15.08.2005 18:22
Сегодня поставил DTSearch Engine 7.10 и был неприятно удивлен количеством «исправлений» в реестре. В этом плане прога устанавливает своеобразный рекорд. А поскольку смысл этих изменений (не просто добавлений) мне совершенно непонятен, то прошу специалистов подсказать значение записей в Win XP типа

[HKLM\SOFTWARE\Classes\CLSID\{0000002F-0000-0000-C000-000000000046}\InprocServer32]
"InprocServer32"=ZC42LKM%g(xX10(h66PpRequired>M5KDYSUnf(HA*L[xeX)yi7R(d6jnX8iv0l4VX6{Ioleaut32>M5KDYSUnf(HA*L[xeX)yi'}NJ0Q.0@QyflX3tIBPSystemFiles>M5KDYSUnf(HA*L[xeX)y

Спасибо
Автор: ghosty
Дата сообщения: 15.08.2005 20:12
yurynok
На 6.5 все прекрасно работало.
Автор: ppch
Дата сообщения: 17.01.2006 16:26
Может кому пригодится:


Цитата:

dtTools - Development Tools for dtSearch
dtTools are a set of companion products for the market leading search engine product dtSearch. As developers of custom dtSearch applications we decided to create products that complement the fine features of dtSearch. If you are developing a dtSearch Web application, our tools can significantly reduce the development time needed to develop your custom solution.


http://www.cybergroup.com/products.cfm
Автор: dosya
Дата сообщения: 21.02.2006 17:37
Я ни у одной поисковухи не видел такого огромного индекса.
У меня индексов 800 мб в windows desktop и на 30 гиг в dtsearch
Автор: yanko12
Дата сообщения: 21.02.2006 20:15
Случайно столкнулся с непонятням форматом в Adobe Acrobat Reader 7.0.0 - не ищется в некоторых текст в dtSearch7.21Build7161
Копирую из етих "неищущихся" файлов Acrobat-а в блокнот через клипборд - грузинские буквы и сохранить не хочет грит Юникод содержит, сохраните блокнотик в формате юникод
Но при индексировании dtSearch индексирует автономно и никак не использует Adobe Acrobat
Значит проблемма в dtSearch
Пример кракозябельно-копирущегося клипбордом (не ищется dtSearch-ем) - http://www.rmj.ru/rmj/t13/n6/RMJ06.pdf
И рядом нормально-копирующийся через клиборд - www.rmj.ru/rmj/t13/n19/pdf/RMJ19.pdf
PS Кодировки установлены -
[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage]
"1250"="c_1251.nls"
"1251"="c_1251.nls"
"1252"="c_1251.nls"
"1253"="c_1251.nls"
"1254"="c_1251.nls"
"1255"="c_1251.nls"
Как понял ето не всегда срабатывает - см Программы » Adobe Acrobat Reader http://forum.ru-board.com/topic.cgi?forum=5&topic=0523&start=0

Страницы: 1234567

Предыдущая тема: NetManager Light


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.