Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: unreal666
Дата сообщения: 24.08.2011 06:31
Yevgenijz
это не обзор, а просто инфа от работника эби.
Автор: matheiiv
Дата сообщения: 24.08.2011 21:44
Лучший обзор, который ещё напишут о FR 11, - строчки от bolvanchik'а (пост №2165, см. чуть выше).
Коротко и ясно от пользователя с заслуженной репутацией.
1) абсолютно эволюционные (незначительные) улучшения (скорость, точность, возможности) в ряду последних версий;
2) качество распознавания определяется качеством исполнения "трудных" заданий (например, таблицы или нечеткий текст);
3) готовить надо в первую очередь исходники, а не ждать чудес от программы.
"Лучше сканы - лучше распознавание".
Последний пункт, как правило, совершенно игнорируемый чайниками, верящих в только волшебную силу новых релизов.


Автор: Astra55
Дата сообщения: 25.08.2011 08:07
matheiiv
Я оцениваю каждую версию FR на одних и тех же сканах, которые использую и для прочих тестов по обрабоке графики. Распознавание действительно чуток улучшилось, в моем случае перестали путаться О и 0, это объективно. Остальное бум тестить, исходя из прогресса в Варезнике.

Цитата:
"Лучше сканы - лучше распознавание"

А вот тут не все так однозначно. Недавно сканил несколько книг на протяжном сканере, там от настроек практически ничего не зависит, все на автомате. Сначала обрабатывал полученные сканы, потом перестал. Результаты настолько близкие, что обработка теряет смысл, только лишнее время уходит. Но FR очень чувствителен к любому лишнему пикселю в букве, вот тут он начинает выкидывать самые разные фортели.
Автор: Yevgenijz
Дата сообщения: 25.08.2011 10:11
matheiiv

Цитата:
Лучший обзор, который ещё напишут о FR 11, - строчки от bolvanchik'а (пост №2165, см. чуть выше).

Лучше ссылку, please, а то я не понимаю, где тут номера постов смотреть.

Автор: campoviy
Дата сообщения: 25.08.2011 11:21
Yevgenijz
Цитата:
Лучше ссылку, please…
Пожалуйста.
Автор: Xendar
Дата сообщения: 25.08.2011 11:24
Yevgenijz, эта же страница, через 5 постов от вашего
Автор: niccolo
Дата сообщения: 25.08.2011 12:29
Народ, а новая версия тоже рисункам даёт безумные расширения и рассовывает их по отдельным папкам?
Автор: Fafy
Дата сообщения: 25.08.2011 16:56
Попробовал новую версию в сравнении с 10_ткой - распознавание со сканом на котором тестировал 10_ка даже дала немножко лучшие результаты. Много ошибок вместо Т распознает как Г, заглавия распознало как колонтитулы (десятка заглавия распознала нормально). В списке стилей не нашел нужного Заглавие №1.

Преимущества 11_й версии (только то, что пока удалось потестировать):

а) Быстрее распознает (но только в черно-белом режиме, в цветном чуточку даже медленней).
Пример: книга 50 страниц худ. лит.
10_я версия - 29 секунд;
11_я версия: Цветной режим - 33 секунды
Черно-Белый - 19 секунд.

б) Размеры документов существенно меньше по размеру:
Пример: книга 50 страниц худ. лит.
10_я версия - 270 Мб;
11_я версия - 174 Мб

Минусы 11_й версии:
а) На тестовом скане дала немножко больше ошибок чем 10_я версия.
б) Сыровата + есть и свои неудобства в плане навигации по страницам оригинала, нужно несколько раз колесико прокрутить чтобы перейти на следующую страницу. В десятке достаточно одного шага прокрутки мишкой.
Автор: matheiiv
Дата сообщения: 25.08.2011 20:36
Astra55
Можно много писать об улучшении качества распознавания, но когда программа путает 0 и O, или, например, в русском тексте расставляет повсюду знаки $, или вместо знаков переноса печатает знаки, похожие на "__|" ("кочерга", разве не знакомо?), то хочется только материться.
Соединить распознавание со словарной проверкой, видимо, либо дорого, либо раздует дистрибутивы.
Автор: Astra55
Дата сообщения: 25.08.2011 21:10
matheiiv
Я никогда не говорил о том, что FR ширится и шеперится, как это пытается представить ABBYY Наоборот, всегда критиковал за понты, вместо реального улучшения. Но что есть, то есть, в данном конкретном случае действительно ошибки исчезли. Когда будет возможность потестить на всю катушку, вот тогда поделюсь впечатлениями, благо есть все версии FR. Хотя чаще всего пользуюсь 8-кой, поскольку 9-я и 10-я версии стали намного тормознее, глючнее и неудобнее.
Автор: bolvanchik
Дата сообщения: 25.08.2011 22:38
У 9 10 и 11 есть одно общее преимущество - поддержка многоядерности. можно сказать это единственная их всех программ, которая загружает все 4 ядра (8 потоков) моего компа. время открытия некоторых файлов - 10-30 сек (~400 cтр).

но 8-ка установленная почти 6 лет назад, еще долго будет работать и только потому что наиболее точно выполняет свою функцию, в соответствии своим названием.
Автор: Pafnutiy761
Дата сообщения: 26.08.2011 15:42
Как по мне, так я разницу не заметил между 10 и 11 версией при распознавании и сохранении в word, файла pdf из 300 страниц (использовал корпоративную версию). Пытаются заманить клиентов и срубить бабло всякими плюшками + незначительная оптимизация (которая должна была быть как мне кажется изначально в 10 версии), а сам алгоритм распознавания и конечный результат давно отпихнули на второй план.
P.S.
8+
Автор: Fafy
Дата сообщения: 26.08.2011 18:34
Заметил одно из серьёзных изменений в новой версии - теперь заполнение пользовательского словаря не выдает ошибку переполнения. Таким образом можно добавлять с легкостью новые языки распознавания со словарной поддержкой - пользовательских словарей конечно. Например Русский язык в дореволюционной орфографии или славянский - гражданской транскрипции или с ударениями или в HIP формате.
Наконец-то сделали.
Автор: ILHS
Дата сообщения: 27.08.2011 08:55
Греческий с диакритикой понимает 11-ая?
Автор: selivanoff48677
Дата сообщения: 27.08.2011 16:38
а кряк скоро ожидается?
Автор: unreal666
Дата сообщения: 27.08.2011 17:05
selivanoff48677
Такие вопросы в прогах не задают.
Автор: MaestroA
Дата сообщения: 31.08.2011 09:41
Хм ..., FR11 при установке не дает возможности выбора языков распознавания. Еще один "–".
Автор: ALEX666999
Дата сообщения: 31.08.2011 11:27
MaestroA
Ага, вдобавок к этому ставит кучу ненужных справок, dll , которые не используются, но занимают место

Сохранение распознанных файлов в режиме «с именами исходных изображений» осталось тормозным.

Тест на 285-ти небольших файлах :

9.0.0.1042 Corp: 4 секунды в TXT; 11-13 секунд в DOC (Microsoft Word)

11.0.102.481 Pro: 62 секунды в TXT; 72 секунды в DOC (Microsoft Word 97-2003)
Автор: myual
Дата сообщения: 03.09.2011 11:47
Если сохранить распознанный файл в формате DjVu, то в соотв. DjVu-файле текст можно выделять/копировать только построчно, отдельные слова выделять не получается. Это у всех так же?
Можно ли как-нибудь решить данную проблему или остается ждать пока разработчики не сделают соотв. исправление?
1. FineReader v.11.0.102.481 Professional Edition
2. Windows 7 SP1 (x64);
3. просмотрщик DjVu: WinDjView.
Автор: VadimirTT
Дата сообщения: 03.09.2011 11:51
myual
текстовый слой в djvu может быть пословным или построчным, зависит от опций при внедрении
Автор: myual
Дата сообщения: 03.09.2011 11:56
VadimirTT
А где эти опции в FineReader 11?
Автор: secretsgn
Дата сообщения: 03.09.2011 12:18
Help - About - Licence - Trial 16.09.2011 writing?

i not using Del_Lic_Ser.bat file. because program giving error when i used this file
example: license service ..
Автор: Astra55
Дата сообщения: 03.09.2011 12:57
myual

Цитата:
Это у всех так же?

Да.

Цитата:
остается ждать пока разработчики не сделают соотв. исправление?

Да.
VadimirTT

Цитата:
текстовый слой в djvu может быть пословным или построчным

Не только.
Character level
Word level
Line level
Автор: ghosty
Дата сообщения: 03.09.2011 13:43
ILHS

Цитата:
Греческий с диакритикой понимает 11-ая?

Насколько я помню, в мире существует только один OCR-движок, распознающий греческий с диакритикой. И больше он ничего не распознает, ибо был изначально под это заточен

8-ка остается классической, т.к. после этого практически все основные разработчики ушли, оставив кучку пацанов крутить многочисленные настройки и постоянно менять GUI, создавая таким образом видимость прогресса...
Автор: tolik_09
Дата сообщения: 03.09.2011 18:36
Очень часто приходится сохранять отсканированные документы в виде изображений в pdf - формате. Делаю это через Файл – Сохранить изображение. Т.е. без анализа и распознавания документов. Сохраненные таким образом документы получаются по весу вдвое меньше, чем полученные штатной программой сканера.
Так вот, в 10 версии трехстраничный текстовый документ в качестве 300 dpi отсканированный как черно-белое изображение весит 123 Кб, а в 11 тот же документ – за 3 Мб.
Т.е. 11 версия не ужимает изображение при сохранении в pdf-формат, если это делать через Файл – Сохранить изображение.
Можно конечно выделять каждую страницу как картинку, распознавать ее и уже потом полученный результат сохранять в pdf. Но это не так удобно, тем более если документов много и они многостраничные.
Пока что остаюсь на 10 версии.
Автор: Astra55
Дата сообщения: 03.09.2011 19:18
tolik_09

Цитата:
документы получаются по весу вдвое меньше

Вы бы в порядке пополнения общего компьютерного образования, вникли бы в суть растровой графики и форматов, тогда не было бы подобных историй.
Сохранять растр в контейнере pdf из FR не есть правильно, он под это не заточен, нормальный подход в таких случаях - растровая графика в нужном формате и качестве со сканера, например, через ИрфанВью, и хороший конвертер растра в pdf, который практически ничего не добавляет и не убавляет.
Автор: tolik_09
Дата сообщения: 03.09.2011 21:57
Правильно, не неправильно – это не важно. Главное что удобно, сканировал страниц десять документа, сразу же посмотрел, не пропустил ли страницы, все ли по порядку, ctrl+a, ctrl+alt+S и сохранил полученный результат в pdf-файл. И не нужно отдельной программы-конвертора, не нужно сначала сохранять jpg-файлы, а потом их конвертировать, все одной программой, все «одним касанием».
Не знаю, что там разработчики сделали в десятой версии, но получаемые файлы были в два раза меньше по размеру, чем сделанные «стандартным» способом, при той же разрешительной способности и визуальном качестве создаваемого файла. Возможно дело в степени сжатия графических файлов, передаваемых FR в pdf. Но мне не удавалось получить файлы такого же размера при таком же визуальном качестве изображения обычным способом, т.е. меняя степень сжатия jpg-файлов в графическом редакторе и конвертируя их в pdf. В восьмой, и кажется в девятой версии, такой большой разницы в размерах файла не наблюдалось.
За год пользования 10 версией уже привык к этой возможности программы, а в 11 ее увы нет – наверное просто bmp-файл конвертируются в pdf, поэтому и размер в Мб.
Автор: alkis
Дата сообщения: 05.09.2011 21:02
Правильно ли понимаю, что 11 corp можно смело ставить рядом с 10 corp? (А то доводилось читать в другой ветке автобиографические рассказы: "Снес десятку, поставил 11...")
Автор: aarony
Дата сообщения: 06.09.2011 09:56
Кто подскажет как сохранить область изображения на странице как файл изображения на хард (неважен формат - сама процедура). В 10 и ниже - без проблем, в 11 не смог - только страница целиком...
Автор: Shangry
Дата сообщения: 06.09.2011 13:19
tolik_09

Цитата:
Правильно, не неправильно – это не важно.

Вам может быть и неважно, зато программе важно - что именно от нее требуют и какие входные/выходные условия задают.


Цитата:
Но мне не удавалось получить файлы такого же размера при таком же визуальном качестве изображения обычным способом, т.е. меняя степень сжатия jpg-файлов в графическом редакторе и конвертируя их в pdf.

Значит вы этим по сути и не занимались. Потыкали наобум в кнопки, ничего не вышло - значит это невозможно.
Операции преобразования изображений из чего угодно и во что угодно в растровой графике давно уже отработаны, что называется, до уровня рефлекса.

alkis

Цитата:
Правильно ли понимаю, что 11 corp можно смело ставить рядом с 10 corp?

На оф. форуме не раз встречал заявления сотрудников ABBYY, что можно ставить рядом несколько версий и они будут крутиться независимо друг от друга.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.