Ru-Board.club
← Вернуться в раздел «Программы»

» Программы индексации и поиска файлов / Desktop Search

Автор: ghosty
Дата сообщения: 20.02.2012 14:46
Блин, сейчас попробовал Архивариус - полное разочарование. Синтаксис полностью повторяет синтаксис Гугла. Ну и зачем нужен отдельный индексатор, если синтаксис такой куцый.
Даже proximity для двух слов нельзя задать

Пока самый развитый синтаксис у dtSearch...
Автор: ytr
Дата сообщения: 29.06.2012 00:01
Друзья, не посоветуете ли прогу для поиска файлов на компьютерах. Перебрал много вариантов, но не нахожу нужного. Требуется прога для WinXP с такими несложными, вроде бы, требованиями.
1. Поиск файлов и папок в определенном наборе папок на винчестере и сетевых шарах.
2. Поиск по названию файла/папки. Поиск по содержимому не требуется.
3. Корректная сортировка результатов поиска по алфавиту. Такие проги, как Locate32 и Agent Ransack сортируют русские имена файлов с учетом регистра (сначала файлы, начинающиеся со всех заглавных букв, потом - с прописных), а надо - независимо от регистра.
4. Очень желательно - обновление индекса сразу после внесения изменений в файловую систему, чтобы введя в окошко первые буквы искомого слова - всегда мгновенно получали актуальный результат. И очень желательно - окошко поиска разместить в системном трее.

Все это есть в Windows Desktop Search 4.0, но эта прога слишком глючная. Copernic почему-то не хочет добавлять сетевые пути (на шарах). Google DS и Yandex DS перестали поддерживаться и убраны с загрузки. Остальные перепробованные (в частности - из http://www.techsupportalert.com/best-free-desktop-search-utility.htm) тоже имеют различные проблемы...
Спасибо!!
Автор: IosifStalin
Дата сообщения: 29.10.2012 19:01
Обругала типа: „runtime-error“, и даже не запустилася.

+10500

именно так, коллега
Автор: speedfan218
Дата сообщения: 25.03.2013 14:54
А существуют локальные поисковики с сжатым файлом индекса?
А то иметь 5-7 гиг индекса когда мало свободно места.
А сжатое занимает всего 200мб. .
Автор: KismetT
Дата сообщения: 25.03.2013 15:03
Это чтобы найти искомое, необходимо разжать всю базу, а затем в ней найти?
Таковых не знаю, довольствуюсь родным поиском 7-ки. Индексируется много гигабайт текстовой информации и PDF, общий индекс - 412 МВ.
Я думаю, что это не очень много.
Автор: cuneiform
Дата сообщения: 27.03.2013 21:17
Убил целый день на розыск подходящего поисковика.
У меня несколько языков, в региональных установках более 2 не выставить (второй там).
Тогда не получишь ни немецкого, ни французского.
А нужно на них искать также и на русском.
Поэтому отпали сразу проги с русским интерфейсом.
Понравился Архивариус - но в некоторых файлах квадратики. Но в принципе хорошо.
Потом за ним идет dtSearch. Но ужасный интерфейс.
Понравился с виду Softinform Search Desktop, но там проблема с русскими шрифтами, если Русский не выставлен в региональных установках. А еслм русский выставить, то исчезнет диакритика для немецкого и французского, как уже говорил. Короче, я давно заметил, что комп более чем на 2 языках нормально не может работать.
Остальные даже близко не подходят, полный мусор, типа от мелкософта, гугла.
Коперник не работает нормально с русским.
Вот как-то так получается.
Автор: ghosty
Дата сообщения: 27.03.2013 22:17
cuneiform
dtSearch - по-прежнему industrial-strength в мире индексаторов. Особенно если речь идет о многих языках-кодировках и пр. Архивариус и близко не стоял.
Автор: cuneiform
Дата сообщения: 28.03.2013 00:53
ghosty

Цитата:
dtSearch - по-прежнему industrial-strength в мире индексаторов. Особенно если речь идет о многих языках-кодировках и пр. Архивариус и близко не стоял.


В режиме автоопределения кодировки - вполне может быть, но в Архивариусе есть ещё и ручной выбор кодировки!

И после всех экспериментов на несколько дней оторвавшись от привычной работы -- на розыски, я наконец нашел то, что хотел и что мне объективно требуется (отвлекаясь от дизайна и всяких мелочей). - Буду юзать 2 проги одновременно:
1/ Архивариус 2/ dtSearch и ничего больше нет на замену!

Повторюсь, но среди нас наверняка есть люди, которые профессионально работают на нескольких языках .

Вот поставят люди какой-нить Larousse, Robert, Bertelsmann, Wahrig, Langenscheidt, Duden и - начинаются проблемы. Иностранный текст местами заменяется то русскими буквами вместо умляутов, то иероглифами какими-то вместо французской диакритики. - Это значит, надо менять локальные установки на French, German. И там - не одна единственная галочка! А также выбор кодировок. Чем больше указать, тем лучше. Надо пробовать. Но после этого русские программы потеряют интерфейс (пойдут ????????????? в меню!), и русские тексты - это в зависимости от программ - перестанут корректно отображаться. - Юзер начинает паниковать и писать на форумы, что делать, помогите! - В тексте нет немецких умляутов, нет французской диакритики! (Если выставить Russian в локальных (региональных настройках)

Проверив дюжину поисковиков на предмет поиска и отображения русских слов, пришлось остановиться на указанных 2-х выше. - Эти проги индексировали русские тексты и корректно отображали их, когда Russian намеренно не был выставлен в региональных установках --- в пользу иноязычных текстов и символов (кодировок). Как видим, выбор не особенно велик. - Если узнаете, какая прога также корректно отображает автоматом кириллицу без региональных установок русского - плиз напишите мне в личку. Заранее благодарю.





Вот такая редкая красота на экране - после изучения массы всяких поисковиков, не споосбных работать на нескольких языках параллельно. А эти - могут.

Ну вот, можете скачивать онлайн словари, энциклопедии, справочники, книги на иностранных языках, исплользуя эти проги, помещать книги в базы данных и искать затем понятия, термины, названия, определения. - На многих языках.

Могу себе также представить, что у вас иностранный комп, скажем, купили ноут в загранке, но надо работать с русскими файлами и текстами. Так вот другие проги поставят вам ????????? вместо кириллицы. А эти - нет.

Всё же настроек и возможностей отладки у Архивариуса больше, чем у dtSearch (изменить размер шрифта, сменить кодировку, например). Но время покажет, какая из них точно лучше. - У меня ХР СП3.
Автор: cuneiform
Дата сообщения: 28.03.2013 13:01
Пришлось просмотреть бегло, а что там "на Западе".
Обзор от 29 января 2013.Хорош тем, что не ставит целей типа, "лучшие 5 поисковиков". Причем, опять же - речь то о бесплатных тулзах, что привлекательно!

http://www.techsupportalert.com/best-free-desktop-search-utility.htm?page=8

И что же там? - Не все захотят читать от А до Я.

Прежде всего, на первом месте всем известный Коперник, с авардом от Gizmo.
У нас он тоже многим нравится, но ведь у него проблемы поиска с русским языком.
Причем не интерфейса, а реального поиска в русских текстах.
Тут же аатор признается,что Коперник - это далеко не Х1 , которая давно уже не бесплатная (и требует .NET Framework 4). - То есть, хуже ее. Но надо же было сравнить с чем-то.

Дальше идет малоизвестная Locate32, она в отличие от Коперника и Google Desktop не должна работать постоянно и нагружать проц! Поиск слов предусмотрен, но минимальные возможности для этого. Но все же, не только поиск файлов. - Имхо, это составная часть ранее известного PowerExplorer (менеджер файлов, дико дорогая весчь помню была - $85). Так может и Total Commander искать. Даже сразу и без создания базы данных.

Далее идет Agent Ransack - маленькая утилитка, - просто урезанная бесплатная версия более солидного софта - 'lite' version of FileLocator Pro. Фичи бесплатной версии и платной отличаются сильно:
http://www.mythicsoft.com/page.aspx?page=features&type=agentransack

Да, это наш FileLOcator Pro:
http://forum.ru-board.com/topic.cgi?forum=35&topic=16348&start=120#lt
Нельзя указать папку, где искать, надо индексировать весь диск; нельзя указать тип файла для поиска. Мне надо например только htm. И искать среди htm. А тут винегрет предлагают. Ну. дела.

Н-да, "бесплатный и родной" поисковик для ХР от MS наверное не плох, поскольку имеет интеллектуальные механизмы поиска (пример запроса: "Email from Bill Gates sent yesterday"

Но какие системные условия работы? А вот какие:
http://support.microsoft.com/kb/940157

И удалять его будет тоже геморно:
http://www.makeuseof.com/tag/remove-windows-desktop-search-pc/
Поэтому мне лично лишние заботы никчему.

В общем-то ничего нового и интересного там у них не появилось.
Автор: ghosty
Дата сообщения: 29.03.2013 17:17
cuneiform

Цитата:
Вот поставят люди какой-нить Larousse, Robert, Bertelsmann, Wahrig, Langenscheidt, Duden и - начинаются проблемы.

Да, но, по-моему, в Win7 этих проблем стало поменьше. Нет?

А вообще, подбор индексатора/поисковика - очень индивидуальный процесс. Мне, например, нужен максимально гибкий и сложный синтаксис поисковых запросов. Такой синтаксис обеспечивает только dtSearch, на котором и сижу уже лет 8. Пробовал ставить Архивариус - этот показался мне совсем примитивным.

Но не очень понятно, зачем Вам ручное переключение кодировки, если dtSearch должен правильно отображать все кодировки.
Автор: rrr777
Дата сообщения: 29.03.2013 19:05
cuneiform

Какая нафиг индексация в FileLOcator Pro, как так нельзя искать по определенному расширению, Ва как-будто совсем про другой продукт пишите..
Автор: cuneiform
Дата сообщения: 30.03.2013 11:47
ghosty

Согласен на 200%, что это очень персональный выбор. Я уже понял, что у вас требования по синтаксису поиска, мне это тоже будет интересно, напр. узнать, два понятия А и В у данного автора вместе употребляются?

Счас активно работаю с файлами из интернета - со страниц онлайн. Словарь, напр., 175 000 файлов. Вместе с ними загружается всякая муть с сайта и о сайте - автоматом (95% обьема загрузки). ВЫрезаем ее скриптом при скачивании. Хтм файл при этом может потерять данные о кодировке. В результате даже такие классные проги как Архивариус и dtSearch вместо текста пишут или пустые прямоугольники или японские (откуда?!) иероглифы - в русско-немецком тексте. - Ручная установка кодировки тогда спасает! - Да и интернет-броузеры не в 100% случаев автоматом правильно кодировку страниц на сайтах распознают. Скока раз уже приходилось UTF-8 вручную ставить.

Все-таки интересно: Как в 7-ке с заданием региональных установoк? Лучше или хуже ХР? - Пока не знаю. - В ХР есть тока 1 окно, где задается безальтернативно Russian, German, French... + набор кодировок с галочками. Может ручной выбор "улучшили" тем, что убрали на автомат? - Я к "нововведениям" критически отношусь. Скажем, ГОСТ (кста - необязательный к исполнению!) на колбасу сегодня допускает содержание мяса 2,7%. Почему 7-ка "должна" быть наверняка лучше?!

rrr777

FileLOcator Pro - это же не мой выбор, я тока пересказал статью на английском.
По расширениям файлы ищет даже Total Commander.


Автор: ghosty
Дата сообщения: 30.03.2013 13:10
cuneiform

Цитата:
Счас активно работаю с файлами из интернета - со страниц онлайн. Словарь, напр., 175 000 файлов. Вместе с ними загружается всякая муть с сайта и о сайте - автоматом (95% обьема загрузки).

Опять-таки лучше использовать для этих целей кроулер от dtSearch - он индексирует страницы сразу, не загружая на ЖД. А так проблема явно в скриптах, которые Вы используете. Неужели в браузерах такие html нормально отображаются?


Цитата:
Все-таки интересно: Как в 7-ке с заданием региональных установoк? Лучше или хуже ХР?

Проблема, которую Вы описываете, была настоящим проклятием для всех, кто работал с несколькими языками в системах, начиная с Win95 и заканчивая WinXP. Это была самая мутная проблема, не имевшая однозначного решения. Именно поэтому могу сказать, что по ощущениям Win7 лучше - просто потому, что я еще ни с чем подобным пока не сталкивался (сейчас сижу за компом с WinXP и не могу ничего проверить).
Автор: cuneiform
Дата сообщения: 31.03.2013 22:55
ghosty
Как научиться или просто юзать кроулер?
Есть документация?
Автор: ghosty
Дата сообщения: 31.03.2013 23:31
cuneiform
Да там все просто должно быть (давно уже не использовал). Вместо папки с документами просто вписываете адрес сайта.

В хелпе это называется Indexing Web Sites.
Автор: cuneiform
Дата сообщения: 05.04.2013 22:32
ghosty

A dtSearch замены в тексте может делать? Или нужна прога типа Search and Replace?
Автор: ghosty
Дата сообщения: 06.04.2013 00:06
cuneiform

Цитата:
A dtSearch замены в тексте может делать?

Нет, индексаторы для этого не предназначены, да и вообще, воплощать такое технически нецелесообразно.

Самая гибкая и мощная программа для замены текста - TextPipe.
Автор: AftarJjet
Дата сообщения: 20.04.2013 06:48
cuneiform

Цитата:
FileLOcator Pro...
Нельзя указать папку, где искать, надо индексировать весь диск; нельзя указать тип файла для поиска. Мне надо например только htm. И искать среди htm. А тут винегрет предлагают. Ну. дела.

ЛОЛ ШТО?



Добавлено:
Поставь галочку на чекбоксе Expert User.

Автор: PREVED
Дата сообщения: 23.05.2013 11:29
Подскажите пожалуйста поисковую программу (с возможностью поиска внутри файлов). Требования:

- Наличие индекса. С возможностью выбрать произвольные диски/каталоги для индексирования.

- Поиск внутри файлов.

- Поиск по именам файлов.

- Возможность выбрать кодировку, в которой ищется текст внутри файлов. Конкретно нужна поддержка уникода.

- Самое главное! Возможность добавить произвольный формат (по расширению и/или по сигнатуре файла) файлов для поиска текста внутри них. Задача - проиндексировать двоичные файлы, в которых встречается определенный текст. Конкретно файлы чертежей САПР-программы (в стандартных наборах поисковых програм данного формата разумеется нет).

Заранее спасибо!
Автор: AntikillerPM
Дата сообщения: 24.05.2013 15:01
cuneiform
испробуйте Cros http://forum.ru-board.com/topic.cgi?forum=5&topic=15164&start=60#4
Автор: suomifinland
Дата сообщения: 24.05.2013 15:05
Пользуюсь, с УСПЕХОМ, более 7 лет, связку ЯндексПоиск + GooglDesktop ищутся оффисные файлы, у меня их более 250 000 индексация первая заняла почти сутки, но потом ПОИСК доли секунды.
Автор: cuneiform
Дата сообщения: 25.06.2013 10:53
Снова обращаюсь за помощью и советом. Пока остаюсь при старом своем выборе: Archivarius-3000 + DTSearch. Но проблема возникла в другом.

Работа со словарями. Каждое слово - 1 html файл. Получается, сколько словарей, столько папок с 90 000 до 200 000 небольших файлов (0,5 - 3 Кб) и более. Чтобы с ними работать, комп частично подвисает (2Гб RAM), переписать папку - 3 дня надо (с перерывами на ночь).
То есть, проблема с обработкой такого числа небольших файлов на компе.

Нельзя даже поиск других файлов на диске задать, он эти 200 000 файлов со словарем (с одним только, а есть и другие) сутки перебирает.

Я уже убрал эти словари на флешку, чтобы не "тупили" компьютер.

В принципе, мне надо продолжать работу со словарями. Но как-то не так.
Они просто ко мне приходят в таком виде.

А если эти 200 000 файлов положить в архив (превратить в 1 файл архиватором - сразу вопрос - какой архиватор может работать с таким числом файлов?) ? - Иначе ведь их ни скопировать, ни перезаписать на другой носитель так просто.

Интересно, а архивы какие-нить доступны для корректного и вообще поиска Archivarius-3000 + DTSearch ?
В таблице выше от ghosty видел информацию, что использовались архивы различных форматов - значит, поиск в архивах в принципе возможен, но у меня особые условия - большое число малых файлов, а не относительное малое число более крупных файлов. В чем и вопрос.


Автор: ghosty
Дата сообщения: 25.06.2013 16:52

Цитата:
Работа со словарями. Каждое слово - 1 html файл. Получается, сколько словарей, столько папок с 90 000 до 200 000 небольших файлов (0,5 - 3 Кб) и более.

Где Вы такое откопали? Это архивариус, что ли, такое мутит?


Цитата:
В таблице выше от ghosty видел информацию, что использовались архивы различных форматов - значит, поиск в архивах в принципе возможен, но у меня особые условия - большое число малых файлов, а не относительное малое число более крупных файлов. В чем и вопрос.

Во-первых, это не моя таблица. И таблица некорректна. Я не помню, чтобы dtSearch не поддерживал каких-либо форматов. Другое дело, что он не поддерживает все форматы "out of box" - но ведь и каждый индексатор, вообще-то, лучше всегда настраивать под свои нужды.
dtSearch изначально создавался для разного рода... дознавательных (forensic) целей - он специально оптимизирован для индексации большого количества разнородных файлов - чтобы можно было за короткое время выудить как можно больший объем инф-и из компа "пациента" - т.е. эти ваши "сноудены" раньше пользовались именно dtSearch и альтернативы ему практически не было. А сейчас они есть, и гораздо круче, но уже засекречены.
Иными словами, я по-прежнему не верю, что какой-то другой продукт может справляться с подобной задачей лучше...
Автор: cuneiform
Дата сообщения: 25.06.2013 18:05
ghosty

Я сказал "таблица от ghosty" , а не то, что Вы ее составили. В этом разница.

В Примечании к Таблице сказано: 7 Gb различный софт в архивах rar,zip,7z, кроме того, mht,doc,rtf,txt и др. файлы.

У меня же просто 200 000 небольших файлов. Чтобы с ними работать, собираюсь их заархивировать. а потом в них искать. Иначе комп просто подвисает при любой другой поисковой работе на диске из-за большого числа файлов.
Автор: ghosty
Дата сообщения: 25.06.2013 18:10
cuneiform
Я бы на Вашем месте поступил так (особенно если ситуация повторяется). Взял бы, к примеру, 1000 типичных файлов и проиндексировал бы разными способами. Выбрал бы тот, который занимает меньше времени/требует меньших затрат.

Добавлено:

Цитата:
Я сказал "таблица от ghosty" , а не то, что Вы ее составили.
Я вообще никакого отношения к ней не имею - не я ее в шапку засунул.
Автор: Death_INN
Дата сообщения: 28.08.2013 21:34
Поюзал MultiFind. Прога не находит японские символы в текстовых файлах с кодировкой "UTF8 без BOM".
Автор: Alexios
Дата сообщения: 11.11.2013 21:52
---
Автор: SobAlex
Дата сообщения: 22.05.2014 10:10
Для поиска по имени рекомендую FileSearchy. Кстати, неплохо было бы добавить в шапку. Похожа на EVERYTHING, но, как по мне, более удобная - запоминает результат поиска, есть табы, нагляднее иконки и т. д.
Автор: VsVsV
Дата сообщения: 24.05.2014 20:04
Прошу посоветовать прогу для поиска по тексту типа AVSearch, без индексирования, (считаю ее лучшей), но способную искать в современных типах файлов (docx и др.) и желательно (но не обязательно), поддерживающей поиск в украинских текстах.


Также хотелось бы связаться с автором AVSearch (вроде бы это Анатолий Вознюк) и попробовать узнать его мнение об апгрейде его творения. Кто может сказать его действующий имейл или страницу в соц.сетях?



upd. Попробовал MultiFind Pro. Вроде бы неплохая, но в отличие от AVSearch хуже отображение искомого слова в контексте (мало), платная, в архивах вроде бы не ищет
Автор: shadow_member
Дата сообщения: 24.05.2014 20:31

Цитата:
MultiFind Pro

Не понимает кирилицу в путях и именах, проект заморожен (не дай бог, что с автором случилось).

Страницы: 12345678

Предыдущая тема: пользовательские словари FineReader 4.0


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.