Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: LonerDergunov
Дата сообщения: 31.05.2014 01:32

Цитата:
картинка, которую ты выложил, это НЕ текст, это ТАБЛИЦА. Только что выделил область как таблицу

Да мне абсолютно фиолетово - текст или таблица. В любом случае внутри таблицы - всё же ТЕКСТ.
Мне (и большинству пользователей наверняка) главное - чтобы FineReader автоматически распознавал этот фрагмент так, как нужно. И FineReader версий 9 и 10 прекрасно справляется с этой задачей. А в новых версиях программы эту весьма полезную функцию взяли и поломали, и теперь необходимо только вручную обрабатывать области.
Автор: unreal666
Дата сообщения: 08.06.2014 10:36
Такая фигня стала:

Версия FineReader 9.0.0.1297 PE_USB. Долгое время было нормально. Сейчас так. После чего - фиг его знает.
Автор: Sjoe
Дата сообщения: 08.06.2014 10:44
unreal666
Что, всё время теперь так? А и экспортируется?

(Пререраспознать/перезагрузить/переустановить, конечно перепробовали?)
Автор: unreal666
Дата сообщения: 08.06.2014 11:11
Sjoe
экспортируется норм.
Перераспознавать - тоже самое. Перезагрузить прогу - тоже самое (комп нельзя).
"Переустановка" помогла Правда она заключалась всего лишь в удалении ветки реестра HKCU\Software\ABBYY\FineReader\9.00, в которой ничего особого не увидел
Автор: Shangry
Дата сообщения: 11.06.2014 17:17
LonerDergunov

Цитата:
На этой стадии через некоторое время (примерно, после 1000 страниц) - FineReader радостно заявляет, что "Не хватает памяти", потом - "Отсутствуют страницы для анализа", процесс останавливается, программа подвисает.

Именно "Не хватает памяти" или "Not enough memory"?

Если второе, то это обычно какой-то вывих Windows и к нехватке любой разновидности памяти он отношения не имеет. Что-то вроде старого "Программа выполнила недопустимую операцию и будет закрыта".
Соответственно вылечить от этого сразу и навсегда невозможно. Только поштучно, правкой кода от конкретных причин каждого из обломов.

С FineReader'ом от этого может помочь перезагрузка. Или почистить TMP-папку, удалить из нее все, что там есть. А иногда вообще ничего не помогает.
Но обычно такое срабатывает на распознавании данного конкретного PDF. Переходишь на другой PDF и все работает нормально

Dracula

Цитата:
И ещё - сейчас можно в последней 12 версии сканировать с отключёнными настройками всеми предобработки (кроме автоматического поворота двойной страницы)?

В настройки открытия/сканирования сейчас добавили управление всем комплектом операций предобработки. Какие хочешь ставишь, какие хочешь отключаешь.
Автор: drezina76
Дата сообщения: 17.06.2014 15:36
Что не нашел FineReader 12 Professional многостраничного режима сканирования документа, его что убрали?
Автор: Sergeos
Дата сообщения: 17.06.2014 16:27
Есть ли в природе FineReader 64-х разрядный?
С уважением
Автор: Antonij72
Дата сообщения: 17.06.2014 16:45
Sergeos
Нет.
Автор: coherent
Дата сообщения: 23.06.2014 18:41
Друзья, пользуюсь FineReader-ом эпизодически, поэтому заранее извиняюсь, если вопрос покажется странным. Использую 8-ую версию и в основном английский, русский, украинский и греческий (реально греческие символы в различных выражениях и формулах). Совсем редко - венгерский, польский, словацкий и ческий. Собственно вопрос - имеет ли 12-ая версия явные преимущества в качестве и скорости распознавания по сравнению с 8-ой с учетом того, что поддержка азиатских языков, арабского и большинства других меня не интересует.
Автор: ALEX666999
Дата сообщения: 23.06.2014 19:11
coherent
Плюс: поддержка многоядерности (добавлена с 9 версии) и как следствие будет быстрее обрабатывать.
Чем больше пакет по числу изображений, тем разница по времени будет больше, если брать 8-ку.
Минус: памяти новые версии (10+) жрут больше, до гига могут отлопать.
Хотя, если параллельно не собираетесь больше ничем заниматься, то может и некритично.

Ещё ударения добавили (с 12-й версии), но помните, что сделано «через попу»,
поэтому из провекри на орфографию ударные слова исключаются.
Со времени выхода уже могли бы заплатку на это дело выпустить, ан нет.
Автор: coherent
Дата сообщения: 23.06.2014 19:48
ALEX666999
Получается, что если процессор одноядерный (и такое еще имеется) и документ не очень большой 10 - 30 страниц, то выигрыш в скорости и не очень то большой. Ударения тоже не актуально. А как насчет качества распознавания?
Автор: ALEX666999
Дата сообщения: 23.06.2014 21:17

Цитата:
coherent: то выигрыш в скорости и не очень то большой.

Стремится к нулю, или даже в обратную сторону.

Цитата:
А как насчет качества распознавания?

У меня есть набор тестовых изображений килобайт на 10-15 англ. текста.
Я пробовал его на FR с 8-ки по 12-ю: чуть лучше в одной строчке, чуть хуже в другой, а в целом - один фиг.
Мне в 12-й понравилась обработка кривых изображений: дисторсия, всякие перекосы и т.д.
Так что ещё зависит от исходника. Если он хреновый, то последняя версия у 8-ки выигрывает.

Затестил заодно на 12.0.101.264 групповое сохранение в отдельные txt с именами исх. страниц.
~10-11 сек в память, ~18-19 сек на ЖД (285 небольших файлов). По сравнению с 11-й и 9-й версией:

Цитата:
9.0.0.1042 Corp: 4 секунды в TXT; 11-13 секунд в DOC (Microsoft Word)

11.0.102.481 Pro: 62 секунды в TXT; 72 секунды в DOC (Microsoft Word 97-2003)
Автор: coherent
Дата сообщения: 24.06.2014 10:00
ALEX666999

Цитата:
У меня есть набор тестовых изображений килобайт на 10-15 англ. текста. Я пробовал его на FR с 8-ки по 12-ю: чуть лучше в одной строчке, чуть хуже в другой, а в целом - один фиг.

Собственно, поэтому и спросил. Пробовал одни и те же документы, а это - научные статьи с разными выражениями и формулами, распознавать в 8-ке и в 12-ой. Ошибки практически одни и те же и в основном именно в выражениях и формулах. Где-то лучше, где-то хуже. Т.е. сказать, что 12-ая намного лучше нет оснований. А если еще и на слабых компьютерах, то и по времени большой разницы субъективно нет.
Автор: unreal666
Дата сообщения: 24.06.2014 11:21
Зато 12 можно заюзать именно в качестве исправления косяков самих изображений => чисто экспорт исправленной графики => импорт графики в желаемую версию FR.
Автор: coherent
Дата сообщения: 24.06.2014 12:38
unreal666

Цитата:
Зато 12 можно заюзать именно в качестве исправления косяков самих изображений => чисто экспорт исправленной графики => импорт графики в желаемую версию FR.

Не приходилось такое делать, но возможность явно полезная. Буду иметь в виду.
Автор: vvvvv2
Дата сообщения: 09.07.2014 00:14
Я пробовал на одном файле:
1. ABBYY FineReader 12
2. ABBYY FineReader 10
3. ABBYY PDF Transformer 2.0

Результаты:
1. Отвратительно - целые куски текста не распознаны и отсутствуют.
2. Хорошо
3. Отвратительно - целые куски текста не распознаны и отсутствуют.

Где-то нет текста из более мелкого сравнительно с основным шрифтом, а где-то напротив - более крупного.
Я это замечал и ранее.
Придется снова вернуть ABBYY FineReader 11 и сравнить еще с ней.
Но, ABBYY FineReader 12 использовать я не буду - это 100% и снесу с компа.
Так некоторые разработчики ПО могут очень надолго подорвать доверие к их продуктам...
Ведь украсть куски текста - это украсть время пользователя на использование такого софта...

Автор: coherent
Дата сообщения: 09.07.2014 09:59
vvvvv2
Выложите свой pdf-файл или хотя бы проблемный кусок, если это не секрет. Никогда не сталкивался, чтобы пропадали куски текста.
Автор: oshizelly
Дата сообщения: 09.07.2014 11:01
unreal666 11:21 24-06-2014
Цитата:
Зато 12 можно заюзать именно в качестве исправления косяков самих изображений => чисто экспорт исправленной графики => импорт графики в желаемую версию FR.

Не понял, в чём тут фишка. Неужели FineReader в качестве редактора графики удобнее, чем 100500+ специально под это заточенных программ от Windows' Paint до Photoshop?
Автор: bolvanchik
Дата сообщения: 10.07.2014 14:05
oshizelly


Цитата:
Не понял, в чём тут фишка. Неужели FineReader в качестве редактора графики удобнее, чем 100500+ специально под это заточенных программ от Windows' Paint до Photoshop?


фишка в том, что вы сами ответили на свой вопрос. зачем использовать 100500+ приложений, если весь перечень специфичных действий можно осуществлять в FR.
работая с пакетом изображений, можно подустать от разнообразия графических приложений.
Автор: SkyRE
Дата сообщения: 10.07.2014 23:27
oshizelly 11:01 09-07-2014
Цитата:
Не понял, в чём тут фишка. Неужели FineReader в качестве редактора графики удобнее, чем 100500+ специально под это заточенных программ от Windows' Paint до Photoshop?
Имелось ввиду лучшего распознавания - а не редактирования.
Автор: laprad
Дата сообщения: 17.07.2014 20:24
vvvvv2

coherent

Цитата:
vvvvv2
Выложите свой pdf-файл или хотя бы проблемный кусок, если это не секрет. Никогда не сталкивался, чтобы пропадали куски текста.

выложи плиз на файлообменник, действительно интересно
Автор: Antonij72
Дата сообщения: 30.07.2014 00:00
12.0.101.382
12.0.101.264
А ченжлог где-нибудь "пробегал"?
Автор: ALEX666999
Дата сообщения: 31.07.2014 10:09
Antonij72
Ченжлоги абивцы не выдают, побильдово, по крайней мере.
С их слов они есть, но только для внутреннего пользования.

В качестве рекламы выдают вот такое:
http://www.abbyy.ru/finereader-professional/new/

oshizelly
Фиксить дисторсию и прочие огрехи оцифрованных печатных изданий
с помощью монстров типа "Фотошоп" - извращение, на мой взгляд.
Легче тогда уж освоить "ScanKromsator".
Автор: hogu77
Дата сообщения: 31.07.2014 19:39
Кто-то сравнивал межу собой .382 и .264, там что-то важное или как всегда?
Автор: dronAndrey
Дата сообщения: 05.08.2014 13:06
Отлично а то я пользовался все время файнридером 11 версии
Автор: Shangry
Дата сообщения: 07.08.2014 17:09
Добавил сюда по ошибке, а совсем удалить сообщение нельзя.
Автор: RS85
Дата сообщения: 11.08.2014 11:20
День добрый! Подскажите, насколько сильно изменилась прога с версии 9 (она так красиво лечилась... Slip`ом) по качеству распознавания? Стоит ли ставить 12-ю версию, "корабли уже бороздят...", или все стало только хуже?
Смотрю многие ругают новый Файнридер.
Автор: Shangry
Дата сообщения: 11.08.2014 11:56
RS85

Цитата:
Подскажите, насколько сильно изменилась прога с версии 9 (Она так красиво лечилась... Slip`ом)?

Если считать именно с 9-й версии, то очень и очень изменилась.
Не говоря уже про интерфейс (который в 12-й изрядно получшал, по сравнению с предыдущими), стала более толково выполняться разметка на блоки и заметно улучшилось качество распознавания.

Впрочем это не на всяком тексте заметно.
Если у вас что-то с приличным качеством печати, хорошо отсканированное да еще и верстка не особо сложная (уровень "plain text"), то разницы может и не заметить - как раньше распознавалось на уровне, близком к 99%, так и сейчас будет. А вот если что более сложное, чем страничка сегодняшнего худлита, то почувствуете и достаточно быстро.


Цитата:
Смотрю многие ругают новый Файнридер.

А это сейчас похоже мода такая пошла - ругать, критиковать, разоблачать, изобличать и т.д. Соответственно, чем больше человек что-то ругает и критикует, тем больше он эту моду соблюдает, тем больше он в тренде.

Автор: duckbill07
Дата сообщения: 11.08.2014 12:22
Лично я бы сказал так: если вы регулярно пользуетесь программой и до сих пор на девятой версии, то скорее всего вас все устраивает. Тогда можете ничего не трогать - сильно прорывного ничего нет.
Автор: embrace909
Дата сообщения: 14.08.2014 10:32
Есть сканер Epson Perfection v37 с установленным комплектным софтом EPSON Scan и ABBYY FineReader 9.0 Sprint. При нажатии на сканере на кнопку PDF запускается EPSON Scan - Скан. в PDF. По завершении процедуры создаётся многостраничный PDF с текстовым слоем при автоматическом участии ABBYY FineReader 9.0 Sprint. Но на этапе распознавания используется только русский язык, а как выбрать русский и английский? В настройках ABBYY FineReader 9.0 Sprint выбор соответствующей опции не влияет на EPSON Scan - Скан. в PDF. В самом EPSON Scan не нашел опции, где выбирается русский и английский язык распознавания.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.