Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: VitRom
Дата сообщения: 06.11.2007 09:25
manuilov, "юридически" -- да, проверяльщик нужен на "следующем этапе". Но проверка внутри распознавалки гораздо удобнее (по тем же "неуверенно распознанным" пробежаться, скажем)... Да и просто как-то так сложилось, спасибо школе, что я нигде, кроме Файна, спеллчеком не пользуюсь...
Автор: manuilov
Дата сообщения: 07.11.2007 04:05
Astra55

Цитата:
Простите, а Вы случаем не из девелоперов ABBYY будете? И с каких пор критика софта стала считаться "обливанием грязью"? Если у Вас лично 9-я версия вызывает дикий восторг, причем доказательств этому Вы не приводите, (тот же "голый свист" по Вашему же выражению), то почему все остальные должны безоговорочно разделять Вашу "кочку зрения"?

Увы, должен вас разочаровать - я не получаю зарплату на abbyy
Я занимаюсь своим делом, в котором не последнее место занимает сканирование и обработка большого количества материалов, содержащих текст, графику, таблицы и т.п. И именно исходя из этого я делаю вывод, что 9-я версия - шаг вперед.
Теперь о вас. Вы подбираете документ, с которым 9-ка справляется явно хуже, чем 8-ка и на основании этого объявляете версию сырой и глючной?
Я могу вам предоставить ворох документов, которые 8-ка обрабатывает гораздо хуже 9-ки. И по вашей логике я должен объявить все предыдущие версии сырыми?

Судя по всему, вы никогда не сталкивались в жизни с разработкой реальных коммерческих программ - в лучшем случае ваш опыт программирования сводится к выводу на экране строчки "Привет, морячок!"

Что ж изменилось в 9-ке? И почему?
Уровень распознавания текста в последних версиях практически не меняется и это неудивительно - он уже очень высок и дальнейшее совершенствование алгоритма распознавания текста не имеет смысла. Это все достаточно дорого, а, учитывая процветающий раздел "варезник" на этом форуме, то это вовсе может не случиться.
Не забудем и все более высокое качество попадающих на сканер документов - современная техника не сопоставима с тем, что было лет 10 назад.
Поэтому логично стремление компании сосредоточиться на том, чтобы сделать работу с документами более комфортной и быстрой.
У меня, например, при обработке сложных документов, основное время уходит на корректировку разметки страницы - как в восьмерке, так и в девятке. Имеется в виду исправление положения границ рисунков, переразбивка таблиц (в которых не выделены строки) и т.п.
И только возможность использовать Ctrl, Alt, Shift для практически мгновенного изменения размеров блоков, добавления и убирания строк в таблицах позволяет мне обрабатывать страницу на порядок быстрее. Напомню, что в предыдущей версии за всем нужно было лазить в меню, на панельки и т.п.
Плюс возможность настройки горячих клавиш под себя, что тоже сокращает время работы над документом.
Еще раз повторюсь, это IMHO, IMAO.
У меня к девятке много претензий - прежде всего по работе со сканером (самое спорное нововведение), но то, что сделано - уже огромный шаг вперед, особенно если учесть наплевательское отношение к юзабилити интерфейса в предыдущих версиях.
В конце концов, каждый может скачать и попробовать FR9 и решить - стоит она перехода или нет!
Автор: tukktukk
Дата сообщения: 07.11.2007 06:25
Как я уже говорил в другой ветке, 9 меня не устраивает. Сравнил распознование одного и того же текста (никаких фото и сложного форматирования) над которым работал в 8 и 9. Ошибок в 9 намного больше (особенно со скобками и распознаванием жирного и курсива). Так что вполне согласен с Astra55.
Автор: pom205
Дата сообщения: 07.11.2007 06:51
Подтверждаю изменения только в худшую сторону. И если фирма не пересмотрит свои нововведения (размер, портабельность, кач-во распозн-я...), программа,считай, завяла.
Автор: Nadeyew
Дата сообщения: 07.11.2007 11:50
manuilov

Цитата:
...дальнейшее совершенствование алгоритма распознавания текста не имеет смысла.


Позвольте с Вами не согласиться. Если разработчики прислушаются к этому Вашему мнению, что любимой программе действительно осталось недолго жить. Ведь это же просто безобразие, когда 9-ка неуверенно распознает идеальный текстовый PDF (я не говорю сейчас про сохранение форматирования, для большинства пользователей это дело десятое), а должна давать 99.9% если не все 100! С форматом "дежавю" тоже должно быть почти 100%, их нет. А как быть с разрешениями меньше 300 точек, экранками, чересчур светлыми или темными копиями, сделанными на убитых "ксероксах", которые Вам (опять за деньги!) выдадут, например, в библиотеке? Это же именно тот материал, который в большинстве случаев людям и надо распознавать. А если у человека есть доступ к идеальному исходнику, то скорее всего ему Файнридер будет не нужен, он сможет воспользоваться другими утилитами, такими как PDF2Word. И Вы говорите, что не имеет смысла работать над алгоритмом? Странно...
Автор: ghosty
Дата сообщения: 07.11.2007 12:10
Думаю, Astra55 со мной согласится, если я предположу, что разработчики в ABBYY скорее похожи на этаких продвинутых юзеров: у них есть некий движок с кучей настроек, который они модифицировать уже боятся (т.к. создатели движка в ABBYY, скорее всего, уже не работают), а могут лишь его "настраивать". В основном для того, чтобы создать видимость, что движок работает как-то немного по-другому
Автор: Astra55
Дата сообщения: 07.11.2007 14:48
Соглашусь, тем более, что была непроверенная инфа насчет слиняния мозгов в очень другое государство И Nadeyew совершено прав: на форуме ABBYY были дебаты насчет эталонного текста, который ФР распознает с вероятностью 100%. Аргументы контра выглядели крайне неубедительно. Если бы у девелоперов была возможность улучшать алгоритм OCR в ФР, то такой текст обязан был бы существовать в природе. А его нет. Что косвенно подтверждает нестабильность OCR и неумение (?) девелоперов устранить ее на идеальных текстах. Ну нет у меня сейчас времени на широкое тестирование всех версий ФР и конкурирующего софта. Скорее всего, к Новому году смогу что-то сделать в этом отношении. Мне самому жутко любопытно получить результаты такого сравнения.
Кстати, идеальный PDF, то бишь, вектор, категорически не рекомендуется прогонять через ФР или Трансформер. Сразу внесете элемент непредсказуемости в отличие от хороших pdf конвертеров, где некорректность в каких-либо знаках будет 100% повторяема и можно всегда ее устранить. А элемент OCR может дать такие ошибки, что только человек при тщательной вычитке их заметит. Благо, конвертеров сейчас хватает. Из последних поступлений Able2Doc/Able2Extract, с русским работает очень неплохо. Про конвертацию в Excel не говорю, для этого тоже хватает софта.
Автор: VadimirTT
Дата сообщения: 07.11.2007 22:39
В компьютерре козлонка про девятку, старый стрекозел, не смотря на неистребимую любовь к халяве, разнес новинку.
Автор: ghosty
Дата сообщения: 07.11.2007 22:58
VadimirTT
Эмм, может быть, объяснитесь?
Автор: Nep
Дата сообщения: 07.11.2007 23:25
VadimirTT
по русски пиши
ghosty
он сказал что Козловский не хвалил новую версию в газете
Автор: VadimirTT
Дата сообщения: 07.11.2007 23:43
Вот
http://webfile.ru/1586057
надеюсь читаемо.
Меня порадовал ответ от абби, что он фотографировать не умеет , не в бровь, а в глаз!
Автор: Astra55
Дата сообщения: 08.11.2007 15:55
Весьма читаемо, спасибо. Особенно меня тронул коммент Липича. Так и хочется сказать ему, лучше лично: "Дяденька, ну кому ты арапа заправляешь? Ведь не одни же чайники юзают ФайнРидер, мы, чай, не первый год замужем!" С другой стороны, в Инете выложили книгу "Красные уши", снятую фотиком, причем, весьма похабно, 310 метров на 163 страницы!!! Просто недостижимый рекорд объема и мерзкого качества. Я еще детально не исследовал, но вроде как ФР 8-й явно лучше справляется, нежели расхваливаемая 9-ка. Надо будет еще конкурентами пройтись, что они на этот счет скажут. В выходные попробую и доложу общественности.
Автор: Astra55
Дата сообщения: 10.11.2007 17:32
Более внимательно сравнивал ФР8 и ФР9. Увы, но выводы печальны для новинки. Она стала слепая, тупая, с дурацкими инициативами, которые приходится давить вручную, с почти полным набором багов из беты, словом, даже если и есть некое улучшение распознавания, то имеющиеся недостатки полностью замазывают черной краской миф о якобы шаге вперед. Тут уже не шаг вперед, два назад, а бодрая рысь вспять Я берусь утверждать, что выход ФР9 был продиктован чем угодно, но не готовностью софта к продаже, как это должно быть. Одна чахлая бета не может расцениваться как серьезная работа над недостатками. Увы, но ABBYY начала работать по известному принципу - пипл и так схавает, незачем стараться, когда на российском рынке нет конкуры и можно смело заряжать новые деньги за комплект старых недостатков и новых косяков. Dixi.
Автор: softes
Дата сообщения: 10.11.2007 20:15
Девятка все текстовые блоки передает в Вёрд (2007) как текстовые боксы (text box).
Можно как-то настроить так, чтобы текст был обычным? В настройках ничего подобного не обнаружил.
Автор: Astra55
Дата сообщения: 10.11.2007 20:59
Про 2007-й не скажу, на 2003-м такая картина будет при выборе "Точная копия", поэтому для последующего редактирования нужно выбирать в опциях сохранения в Ворд - "Редактируемая копия" или что-то в этом роде.
Автор: softes
Дата сообщения: 10.11.2007 22:06
Astra55
Спасибо, помогло. До этого выставлял "Редактируемую копию", но все равно были боксы. Видимо, это случается из-за сложной топографии текста.

А что, в 9-ой версии экспорт в Ворд с окошком Zoom Window убрали?

Добавлено:

Заметил такую вещь - случайным образом пропадает/появляется распознавание сносок. Сначала открыл-распознал демо-файл из папки программы - в Ворде появилась сноска (!). Там где ей и положено быть (все-таки распознавание структуры документа - это здорово). Экспортировал то же распознавание повторно - нету сноски...
Никто не сталкивался с подобным? Если да, то просьба подсказать, как правильно настроить программу.
Автор: Astra55
Дата сообщения: 11.11.2007 05:34
Со сносками может быть такой прикол: они считаются колонтитулами . Поэтому проверить галочку в настройках по этому поводу, она там есть.
Автор: softes
Дата сообщения: 11.11.2007 14:31
Astra55
С колонтитулов галку не снимал (соответственно они и распознавались во всех случаях - в демо-файле есть и колонтитул, и сноска, и гиперссылка, и номер страницы). Сбоила только сноска. Впрочем, после перераспознавания все выправилось.
Автор: Astra55
Дата сообщения: 11.11.2007 18:23
Вот я и говорю - совершенно сырой софт впаривают за новые деньги. Что уж тут лукавить, пора бы ABBYY признаться в грехе мздоимства и публично покаяться, да не дождемся мы этого. И что-то никто опровергать наезды на ФР9 не рвется, хотя были попытки. И это, товарищи - правильно! Не надо защищать откровенную халтуру. Разумеется, если вы не работаете в ABBYY
Автор: Alex4230
Дата сообщения: 11.11.2007 18:50
<<<< ScannerDoctor >>>>

Пакет форматирования в MS Word отсканированных книг.
Разработано на платформе MS Office Word 2003 SP2.
Опробовано на документах полученных ABBYY FineReader 7-8.
Автор: Александр, alex-mail@tut.by, Брест, 2005-2007.
Скачать можно по адресу: http://alex-mail.at.tut.by/.
Автор: manuilov
Дата сообщения: 16.11.2007 13:27
Nadeyew

Цитата:
Позвольте с Вами не согласиться. Если разработчики прислушаются к этому Вашему мнению, что любимой программе действительно осталось недолго жить. Ведь это же просто безобразие, когда 9-ка неуверенно распознает идеальный текстовый PDF (я не говорю сейчас про сохранение форматирования, для большинства пользователей это дело десятое), а должна давать 99.9% если не все 100! С форматом "дежавю" тоже должно быть почти 100%, их нет. А как быть с разрешениями меньше 300 точек, экранками, чересчур светлыми или темными копиями, сделанными на убитых "ксероксах", которые Вам (опять за деньги!) выдадут, например, в библиотеке? Это же именно тот материал, который в большинстве случаев людям и надо распознавать. А если у человека есть доступ к идеальному исходнику, то скорее всего ему Файнридер будет не нужен, он сможет воспользоваться другими утилитами, такими как PDF2Word. И Вы говорите, что не имеет смысла работать над алгоритмом? Странно...

Давайте мы все же не будем путать совершенно разные понятия.
Алгоритм распознавания текста вообще-то имеет мало общего с проблемами сканирования некачественных оригиналов. Тут нужен грамотный блок сканирования и обработки после сканирования. Я уже говорил, кстати, что основная претензия к новой версии у меня - это модуль сканирования.
И если бы я работал в Abbyy, как упорно пытается намекать Astra55 , то в таком виде FR бы не вышел.
Между прочим, похвальба участием в бета-тестировании и параллельно выливание ушата грязи на разработчиков характеризует его как крайне безответственного человека.
Тем не менее, отсканировав и обработав в девятке около 500 страниц, я ну никак не могу назвать ее совершенно сырой версией. Человеку всегда кажется, что ему что-то не додали - меня, например, искренне возмущает, что в дивиди рекордере за 25 тыс. рублей нет встроенной кофеварки эспрессо!
Специально для Astra55 сообщаю, что некоторые люди заняты работой и не могут ежечасно отражать наезды на FR9. Кроме того, наезды как правило малоконструктивны и зачастую вызывают лишь одну реакцию - если ты такой умный, НАПИШИ ЛУЧШЕ!

Кроме того, никто не заставляет насильно пользоваться девяткой и тем более покупать ее. Пользуйтесь восьмеркой, только не забудьте ее приобрести, а то как-то нечестно получается.
Автор: xeroxman
Дата сообщения: 16.11.2007 13:49
Девятка на много удобнее (просто рулез против 8-ки), но блин ооооччччеееень мендленная ...
Проц 2.8 ГГерца, для нее слишком мало, видимо расчитана минимум под два ядра ))))
Автор: ghosty
Дата сообщения: 16.11.2007 13:51
manuilov
Позвольте напомнить, что Astra55, если его очень попросить, может начать говорить хоть немного конкретнее. Уверен, если его попросить еще лучше, он даст и тестовые страницы, на которых наблюдались глюки. Я предоставил скриншоты результатов, говорящие о некотором прогрессе 9-ки по сравнению с 8-кой.
Вы же говорите точно в таком же стиле, в каком говорит Astra55, когда переходит на огульную критику. "Ну никак не могу назвать ее совершенно сырой версией" - невозможно назвать обоснованным утверждением.
Иными словами, вы ругаете его за то же, за что вполне можно поругать Вас

xeroxman

Цитата:
Девятка на много удобнее (просто рулез против 8-ки), но блин ооооччччеееень мендленная ...
Проц 2.8 ГГерца, для нее слишком мало, видимо расчитана минимум под два ядра ))))

Ну вот, еще один Почитайте здесь: http://forum.ru-board.com/topic.cgi?forum=5&topic=6373&start=860#6
Автор: AVV_UA
Дата сообщения: 16.11.2007 23:38
[more=ABBYY: FineReader 9.0 в комплекте с цифровыми фотоаппаратами.]
ABBYY совместно с партнёрами – представителями разработчиков фототехники – ведет работы над новым продуктовым предложением. Поскольку в последнее время наблюдается значительный рост интереса к распознаванию текста, полученного с помощью цифровых фотоаппаратов, предполагается разработать специальный комплект, который может использоваться в качестве портативного сканера. Комплект будет включать цифровую фотокамеру и систему распознаванию ABBYY FineReader 9.0. Новинка адресована самому широкому кругу пользователей.

Учитывая важность вывода на рынок нового предложения, компания ABBYY проводит широкомасштабное пользовательское тестирование комплекта в реальных условиях эксплуатации. Мы приглашаем всех обладателей цифровых фотокамер присылать на специальный адрес test_fr@abbyy.com собственные снимки различных документов, а также документы, которые уже прошли распознавание при помощи ABBYY FineReader 9.0 после фотографирования. Все присланные изображения будут использованы для проведения тестирования комплекта под рабочим названием «портативный сканер».

Помимо пользователей, к тестированию продуктового комплекта приглашены представители IT-сообщества и авторитетные журналисты. Среди участников эксперимента – представители ИД Компьютерра, Finestreet, PC Week, Digital Photo и многие другие.

Выявленные экспертами в ходе теста технологические нюансы, также как и пользовательские пожелания и отзывы, будут проанализированы и использованы разработчиками нового комплекта. Все возможные обновления и дополнения будут учтены при представлении комплекта на рынок, а также доступны пользователям ABBYY FineReader 9.0 в его следующем релизе.

Данный опыт проведения тестирования позволит к концу ноября предложить пользователям в значительной степени адаптированный к рынку и безупречно работающий продукт. Первые отзывы экспертов будут получены коллективом разработчиков в начале ноября.[/more]
(взято c http://www.ixbt.com/news/soft/archive.shtml?2007/1110)
Автор: VadimirTT
Дата сообщения: 17.11.2007 00:37
AVV_UA
я тут недавно выкладывал скан с первого отзыва
Автор: Astra55
Дата сообщения: 17.11.2007 06:13

Цитата:
Между прочим, похвальба участием в бета-тестировании и параллельно выливание ушата грязи на разработчиков характеризует его как крайне безответственного человека.

1. Я не хвастаюсь, а только констатирую факт своего участия.
2. Я был крайне удивлен, и это удивление не прошло до сих пор, скоротечностью бетатестирования, учитывая массу вполне конкретных проблем, которые остались и в релизе.
3. Насчет моей "крайней безответственности" - не Вам судить. По крайней мере, у ABBYY ко мне претензий не было.
4. Свои предложения по улучшению ФР9 я уже высказал. Только не здесь, а тому, кому надо.
5. Я могу выложить кучу скриншотов и примеров для подтверждения недостатков и глюков ФР9, но делать этого не буду, поскольку доказывать здесь что-либо бесполезно. Те, кто пользуется ФР9, это видят и знают, а фанатики будут упорствовать и твердить свое.
6. "Наезды" - как Вы выражаетесь, являются вполне обоснованной критикой, и не Вам их разрешать или запрещать. Вроде я Вас ни о чем не просил и ничего у Вас не спрашивал. Откуда такой фонтан недоброжелательства и переход на мою скромную личность?
Автор: Frost1950
Дата сообщения: 18.11.2007 14:02
друзья, волнует отсутствие в ФР9 Batches. Я, не нашел пакетов ни в меню, нигде... Может, плохо искал, или что, подскажите.
Они что отказались от пакетов?! А вообще распознает не лучше 8, те же ошибки, но там хоть пакеты есть
Автор: vitaly1
Дата сообщения: 18.11.2007 14:41
Вроде да, отказались. На оф. форуме читал.
Автор: Astra55
Дата сообщения: 18.11.2007 15:30
Нет, они просто называются по другому .
Автор: VitRom
Дата сообщения: 18.11.2007 15:31
От пакетов отказались... Хоткеи давным давно сократили донельзя... Зато распознавание с камер будет, ура-ура!.. А в перспективе, глядишь, ещё и телетекста с тарелки, и вообще титров в видепотоке...
В общем, софтина медленно, но верно нацеливается на домохозяек -- всё больше внимания автоматизации и всё меньше -- удобству работы... Помню, как в 4-ке привык, так потом в 6-ке долго искал хоткеи (скажем, выбор типа блока цифрами 1-4 и т.п.)... А потом ещё дольше матерился, когда понял, что их нет, и остаётся только елозить мышой... :-\

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.