Цитата:
Признаю, обзоры старые, но полезную информацию при желании почерпнуть можно... И про DTSeach почитать. Если Архиваруис в них не упоминается, это не даёт повода обсерать их и мою помощь =)
Дорогой Falanster, если Вы посмотрите на мои формулировки немного менее эмоционально, то заметите, что я так отзывался не о Вашей помощи, а о конретно этих обзорах. Они, к сожалению, не просто старые, а очень старые. Человеческий мозг хитрая штука, и может найти много полезного даже в старом чулане на даче, но если всерьёз, то читать такие старые обзоры для выбора сегодняшней программы это как выбирать между Win95 и OS/2, чтобы потом обнаружить, что первая проэволюционировала уже с десяток важных этапов, а вторая и вовсе сгинула в небытие. Хотя, безусловно, что-то полезное из их обзора при желании подчерпнуть можно
Цитата:
сотни поддерживаемых форматов/расширений архивов у архивариуса вызывают огромнейшее уважение к программерам, которые все это впихнули в 6-метровый инстал
У меня есть ощущение, что там всё чуть более, чем просто и большого уважения, увы, не достойно - каждый формат, если надо, распаковывается до вида, где есть открытые строки (как, например, PDF, где строки закодированы), а методов упаковки обычно немного, а затем всё они там тупо индексируются без учёта всякой внутренней структуры. Только таким лобовым методом можно объяснить и поддержку в одном небольшом бинарнике сотен форматов, в то время как иногда один формат сам по себе у производителя имеет и больший размер "читалок", и сам факт крайне низкого качества поиска и некоторые артефакты поиска.
В любом случае, меня как пользователя интересует в первую очередь выполнение главной функции программы - поиска. А будет ли это достигаться 6 или 600 мегабайтным бинарником дело уже настолько стодвадцать пятое, что и вспоминать неудобно.
Цитата:
что не нравится у обеих - платные, заразы, но и тут, порядок цен ОЧЕНЬ отличается, соотношение фичастость/цена, имхо, не в пользу DtSearch
Да, согласен.
Причём, цена - это, по моему, увы, единственное достоинство Архивариуса (у меня честно купленная версия).
Цитата:
Вот неплохое сравнение поисковых программ:
http://forum.ru-board.com/topic.cgi?forum=5&topic=7321&start=100
и более развёрнутое - http://filospecan.easyforum.ru/viewtopic.php?id=61
Большое спасибо! Буду изучать!
Цитата:
Это можно прочувствовать при поиске лица с такой очень распространённой фамилией, как Иванов, но именем Григорий.
Архивариус выдал мне 85 документов, DTSearch - 3 (проверялось на небольшом индексе).
При рассмотрении результатов выбранных Архивариусом, оказалось, что он нашёл все документы, в которых встречаются оба эти слова, но только в одном упоминалось искомое лицо. Т.е. в результаты поиска он выдал и те документы, в которых два поисковых слова были сильно разбросаны. В начале текста стояла фамилия Иванов, а в конце текста Григорий, речь шла о разных людях.
DTSearch выдал 3 документа, в одном из которых шло упоминание о нужном лице.
Вооо!!! Урааа!!!! Это именно та главная причина, которая меня бесит в Архивариусе - ищещь определение какого-нить составного термина, а он выдаёт тебе 100500 результатов, где первое слово термина есть в начале 600 страничной книги, второе где-нить к концу, а третье - посередине. И ищи потом среди них...
Falanster, огромное Вам спасибо за этот последний пост, который содержит как раз большинство того, что я и хотел узнать про различия)
Цитата:
Сначала очень интересной показалась возможность Архивариуса извлекать из текстовых массивов разные данные, особенно номера телефонов.
Ага, я тоже на этом попадался. Никакого реального применения тем возможностям, что у них зашиты я тоже не нашёл. Это только спамерам базы собирать
Я, кстати, как-то хотел сделать (да и ща хочу сделать или найти) софтину для сбора ISBN книг и статей своей библиотеки для поиска дубликатов и каталогизации, и думал воспользоваться архивариусом для этой цели - ну, он же типа ISBN собирать умеет. Ага, умеет. Собирает абсолютно всё, что тупо подходит под шаблон ISBN, например, весь список литературы в конце каждой статьи) И чо с этим делать?
Я тогда, как зарегленный пользователь, обратился к ним в суппорт с предложением открыть и задокументировать API для работы с индексом Архивариуса - тогда люди смогут на его основе много чего полезного и интересного сделать, типа вот такой вот софтины. Это сделать дешево и совершенно безопасно для них, а вот результат может быть очень сильным, т.к. софт становится сильно более популярен при наличии вокруг него богатой экосистемы. Но они даже не ответили, хотя раньше на какие-то вопросы отвечали... Ну, да и фиг с ними.
У dtSearch, кстати, вроде бы судя по описанию, какой-то API доступа есть... Но цена кусается...