Ru-Board.club
← Вернуться в раздел «Программы»

» Программы индексации и поиска файлов / Desktop Search

Автор: ghosty
Дата сообщения: 23.12.2005 23:34
Comanchero

Цитата:
Паранойя какая-то у меня по поводу всех этих индексаторов.

Ага!
А файрволлы все тоже теперь в ФСБ и ФБР дырявятся (пока не продырявят, продавать не разрешат).
А принтеры снабжены дополнительной памятью, в которой сохраняется все, что ты напечатал.
А спутник может прочитать, что у тебя написано в паспорте.
А другой спутник по дребезжанию стекол в твоей квартире сможет узнать, о чем ты там говоришь.




Добавлено:
Comanchero

Цитата:
Что такое подстановочные знаки я не знаю

Ну типа звездочки всякие, доллары...

Добавлено:
ivanMSV

Цитата:
В одном из топиков по Ворду один из старожилов форума категорически выступил против MS службы индексации. Хотелось бы услышать аргументы ghosty , а не громогласное необоснованное заявление. Альтернативы MS индексатору для поиска файлов на сервере также весьма приветствуются.

Да я и не был тогда особенно громогласным
Понимаешь, это было 3 года назад, и я, хоть убей меня, не помню, какие глюки я словил, воспользовавшись индексатором от MS. Но глюки были очень серьезными, и народ со мной согласился, что индексатор получился у них глючным.
Из объективных минусов - слишком долго индексирует и слишком долго ищет.

Однако если тебя он устраивает, я не вижу никаких причин переубеждать.
Просто у нас могут быть задачи разные:
1) Мне нужен индексатор для обработки (иногда) гигабайтов текстовой информации. dtSearch считается рекордсменом по индексации (слышал давно об этом, сейчас, может быть, он и отдал свои лавры, но вряд ли). Он традиционно применяется для решения самых сложных задач по поиску информации и закупается очень серьезными структурами - разведывательными, судебными органами, органами госбезопасности и пр.
2) Также мне нужен самый широкий набор поисковых возможностей. Особенно для англ. языка.
В dtSearch этих возможностей навалом, и я их все использую. Напр., нужно найти расшифровку аббревиатуры USA, пишу U* w/2 S* w/2 A* находит "United States of America".
Хочу найти нечто похожее на "Unyted SStates ov Emerica" - все равно найдет то, что мне надо...
Хочу найти все синонимы, семантически сходные слова, антонимы - все, что угодно...
Автор: Comanchero
Дата сообщения: 24.12.2005 14:04
ghosty


Цитата:
Также мне нужен самый широкий набор поисковых возможностей. Особенно для англ. языка.
В dtSearch этих возможностей навалом, и я их все использую. Напр., нужно найти расшифровку аббревиатуры USA, пишу U* w/2 S* w/2 A* находит "United States of America".
Хочу найти нечто похожее на "Unyted SStates ov Emerica" - все равно найдет то, что мне надо...
Хочу найти все синонимы, семантически сходные слова, антонимы - все, что угодно...


А русской азбуке он обучен?
Автор: vitaly1
Дата сообщения: 24.12.2005 14:37
Comanchero
Нет.
Автор: ghosty
Дата сообщения: 24.12.2005 15:06
vitaly1
В смысле? :/
Обучен, конечно. Все кодировки определяет автоматически. Настраиваем в любую сторону.
Есть даже морфология. Но она на практике оказывается излишней - и без нее все прекрасно находится.

Добавлено:
Кстати, у меня есть файлик со словами-исключениями для русского языка (для ускорения индексации и снижения объемов индексов).
Автор: Comanchero
Дата сообщения: 24.12.2005 16:59
ghosty

А говорят к нему некий Language Extension Packs нужен чтобы он русский воспринимал также как и инглищь?
Автор: ghosty
Дата сообщения: 24.12.2005 20:42
Comanchero

Цитата:
А говорят к нему некий Language Extension Packs

Я именно о нем и говорю. Он включает только морфологию, если я правильно помню. Но на самом деле этот элемент не особенно нужен...
Автор: Comanchero
Дата сообщения: 25.12.2005 20:08
ghosty
Осталось попробовать эту программу в действии. А в ем различие между dtSearch Engine и dtSearch Desktop?
Мне так сказать для частного, домашнего использования, инфы, подлежащей индексации гигов 10 не больше.
А что он еще может индексить, закладки, историю браузера, письма каких почтовых клиентов?
Автор: ghosty
Дата сообщения: 25.12.2005 21:39
Comanchero
В dtSearch Engine есть, в первую очередь, Web Spider - все то же что и с документами, но индексируются интернет-страницы. Очень полезная фича, если принять во внимание, что dtSearch, начиная с 7-й версии можно настроить на индексацию с одновременным кэшированием текстовой информации с попутной ее архивацией. Далее, к примеру, имеется возможность записи CD со встроенным движком поиска. В общем, много полезного, времени не хватает, чтобы все это описать.
А главное, о чем надо было сказать в самом начале - железобетонная надежность Продуктов такого качества становится все меньше...

Подробнее...
Автор: ivanMSV
Дата сообщения: 27.12.2005 23:10
ghosty
То, что dtSearch следует опробовать - даже не стоит сомневаться. Есть приятности и неприятности (не знаю чего пока больше), последние надеюсь разрешить. Что сам, а что и с помощью коллег в соответствующей теме.

Цитата:
Понимаешь, это было 3 года назад

Примерно в тоже время тестировал dtSearch при выборе индексатора, но тогда это была совсем другая песня.

Цитата:
если тебя он устраивает (MS служба индексации), я не вижу никаких причин переубеждать

Нет программ полностью устраивающих пользователя. И это причина продолжения поисков "совершенства" .

пользователям MS службы индексации
Необходимо как минимум дополнительно индексировать pdf. Как?
Автор: ProbaRK
Дата сообщения: 06.01.2006 17:12
ivanMSV

Цитата:
пользователям MS службы индексации
Необходимо как минимум дополнительно индексировать pdf. Как?


Поставить IFilters от Adobe, последняя версия 6-я, весит более 9Mb

вопрос к ghosty

Вам не удалось к dtSearch 7.21 (Build 7159) прикрутить IFilters?
Автор: ghosty
Дата сообщения: 06.01.2006 18:02
ProbaRK

Цитата:
Вам не удалось к dtSearch 7.21 (Build 7159) прикрутить IFilters?

hттp://www.dtsearch.com/ReleaseNotes.html
Автор: ProbaRK
Дата сообщения: 06.01.2006 19:20
ghosty

Да в релизе-то оно есть, а вот у меня не работает.

Фильтры установлены, в т.ч дополнительные (Adobe, Citeknet и т.д).
Работоспособность с помощью FiltDump.Exe из ResKit проверил - работают, фильтруют.

А вот dtSearch при настройках из HLP пользоваться ими не хочет.
Автор: ivanMSV
Дата сообщения: 10.01.2006 13:54
ProbaRK
Вот спасибочки! IFilters от Adobe - то что надо! Пользую, доволен.
Автор: Comanchero
Дата сообщения: 17.01.2006 16:25
А Коперник между прочим из под прав ПоверЮзер ставится и работает, в отличии от DtSearch - ему административные права для установки нужны.
Автор: dvygun
Дата сообщения: 24.01.2006 19:56
Господа, вижу разговор у Вас о поисковиках. Так пользуйте DVYGUN Smart Search. Программа бесплатна. Поддерживает все распространенные типы данных. Производит полнотекстовый поиск, с логическими операторами. Ранжирует результаты, и приводит цитаты с выделенными поисковыми словами. Имеет самую быструю индексацию и скорость поиска. Может создавать индексы в несколько миллионов элементов. Одним словом попробуйте, а потом (если не понравиться) критикуйте в этом топике.

Страничка программы: http://ru.dvygun.com
Автор: anryk
Дата сообщения: 31.01.2006 08:24

Цитата:
а потом (если не понравиться) критикуйте в этом топике.

нравится, только вылетает без видимых причин часто
Автор: leomaks
Дата сообщения: 31.01.2006 11:39
locate32 - интексирует по расписанию, поиск только по имени, но мгновенно
http://locate32.webhop.org/
Автор: dvygun
Дата сообщения: 31.01.2006 11:51
anryk
Вы не могли бы написать на support@dvygun.com - мы обещаем всяческое содействие в поиске ошибок. А кой версией Вы пользуетесь на данный момент?
Автор: anryk
Дата сообщения: 01.02.2006 11:53
dvygun
как отловлю ошибку и скопирую ее сообщение, то отпишусь, т.к. в каталоге программы я не нашел никакого error-отчета. И еще странность, вчера индекс был 1,5 гига размером, потом программа вылетела, вечером я ее включил опять - сегодня индекс 65 мб
Автор: dosya
Дата сообщения: 02.02.2006 22:52
Скажите пожалуйста, кто кроме google индексирует djvu?
для меня это крайне актуально, тк. слишком большая библиотека.

и еще, кто пробовал windows desktop search? тоже бесплатная и вроде бы неплохо сделана.

Добавлено:
неплохо было бы в шапку вынести

http://forum.ru-board.com/topic.cgi?forum=5&topic=6635&
http://forum.ru-board.com/topic.cgi?forum=5&topic=13275
http://forum.ru-board.com/topic.cgi?forum=5&topic=13332
http://forum.ru-board.com/topic.cgi?forum=5&topic=15875
http://forum.ru-board.com/topic.cgi?forum=5&topic=12456
http://forum.ru-board.com/topic.cgi?forum=5&topic=16310
Автор: Widok
Дата сообщения: 06.02.2006 17:00
шапка включена
Автор: dosya
Дата сообщения: 19.02.2006 01:37
еще можно добавить яндекс

http://forum.ru-board.com/topic.cgi?forum=5&topic=18573
Автор: dvygun
Дата сообщения: 03.03.2006 10:45
Новая версия DVYGUN Smart Search = 2.5.4.9 = уже не вылетает
Автор: ToRNaDo1980
Дата сообщения: 06.02.2007 21:36
Я вот недавно сам написал программу поиска текста в документах

Программа предназначена для поиска текста в файлах формата html, text, doc, rtf, xls, pps, а так же картинки. Автоматически распознаёт кодировку символов (Unicode, UTF-8, windows-1251, KOI8-R, dos-866, ISO-8859-1, ISO-8859-5). Реализована в виде системного сервиса, но может запускаться и с параметром "/DEMO" как обычная прогамма. В последнем случае индексная база данных не загружается и не сохраняется, файлы только индексируются (использую для отладки). До начала поиска необходимо дождаться, пока программа проиндексирует все (или хотя-бы часть) документов. При первом запуске, если в реестре не прописано иное, индексируется каталог Мои Документы.

http://.zip
Автор: Bozo
Дата сообщения: 07.02.2007 20:11
ToRNaDo1980
А чё толку? Еще один мертворожденный проект, который будет через 2 месяца закопан в землю. Сколько их таких. Вот еще к примеру: http://www.solarix.ru/index-ru.shtml
Автор: ToRNaDo1980
Дата сообщения: 08.02.2007 19:45

Цитата:
Bozo

Может быть, однако один плюс - могу сделать поддержку любых нужных _мне_ форматов файлов. Я над этом проектом работаю уже два года, программа отлажена и надёжна.
Автор: grayfog
Дата сообщения: 27.02.2007 01:17
Посоветуйте пожалуйста программу для поиска файлов, содержащих заданный текст. Чтобы не было проблемм c поиском русского текста (в частности в pdf), разными кодировками и форматами (обязятельно нужна поддержка pdf). И самое главное чтобы программа не занималась индексацией, а искала непосредственно по запросу.

Заранее спасибо.
Автор: specz
Дата сообщения: 27.02.2007 09:38
locate имхо чудо, а не программа, самое лучшее и быстрое что я видел.. найти можно здесь: http://locate32.webhop.org/
//upd только что увидел сообщение выше про эту программу, пост можно удалить.
Автор: vitaly1
Дата сообщения: 27.02.2007 12:36
specz
Судя по описанию, она ищет только по именам файлов, а содержимого никак не касается. Т.е. свое применение у нее есть, но возможности программ в шапке несколько шире
Автор: grayfog
Дата сообщения: 27.02.2007 12:52
Среди этих программ из шапки есть такие что не требуют индексации, а ищут находу?

Страницы: 12345678

Предыдущая тема: пользовательские словари FineReader 4.0


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.