Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: ALEX666999
Дата сообщения: 12.01.2010 12:42
Не удивляйтесь, если заметите, что в ряде случаев FR отъедает много памяти даже на маленьких картинках. Дело в языке распознавания. Например, попробуйте распознать картинку только с выбранным в опциях русским языком, затем перезапустите и проверьте то же самое с японским.
Автор: Shangry
Дата сообщения: 12.01.2010 14:37
rusfuhrer

Цитата:
при распознавании немецкого тектса все ОК, но при передаче из FineReader в Word умлауты (умляуты) и эс-цет заменяются русскими буквами...

Скорее всего распознается в одном шрифте, а сохраняется в другом. Это достаточно известная головная боль.

Кроме того, лучше не "передавать в Word", а сохранять в DOC/RTF и потом открывать в Word. Не знаю почему, но прямая передача у FineReader тоже хронически глючит.
Автор: Gowdin
Дата сообщения: 14.01.2010 17:44
10я версия умеет работать с вложенными зонами распознавания?
Необходимо распознать таблицу с рисунками в ячейках.
Автор: matheiiv
Дата сообщения: 18.01.2010 14:41
Эксперименты с распознаванием неидеально-напечатанных таблиц (исходный материал -- сканированная с 300 dpi "нормальная" печать на факсовой бумаге. Метод оценки: визуальный. Критерий оценки: "качество важнее скорости") с помощью версий 9.1297, 10.56 и 10.95 показали:
1) значительное улучшение распознавания области таблицы,
2) улучшение качества распознавания таблицы,
3) улучшение форматирования таблицы и приближение её вида к исходной
при сравнении версий 9.1297 и 10.56.
10.56 значительно предпочтительнее 9.1297.
Практически
4) полное отсутствие прогресса в результатах между версиями 10.56 и 10.95.
Имеются доказательства в виде скриншотов экрана
Естественно нет особого смысла сравнивать версии в простых тестах вида "обычный текст, отпечатанный на лазерном принтере"
Автор: Antonij72
Дата сообщения: 19.01.2010 14:04

Цитата:
Списки слов, тезаурусы для пользовательских словарей ФайнРидера - 96 языков.
Их можно открыть в Блокноте и сохранить в новом файле, некоторые придется, наверно, почистить.
http://wiki.services.openoffice.org/wiki/Dictionaries

А для чего? С их помощью Файнридер лучше распознаёт? Объясните чайнику...
Автор: Nbb
Дата сообщения: 19.01.2010 14:32
Corporate вресия должна по идее видеть сетевые сканирующие устройства?
ABBYY FineReader Corp 10.0.102.105 не видит МФУ HP LaserJet 3050
хотя с компа к которому он подключен сканировать через FineReader можно
Автор: Shangry
Дата сообщения: 19.01.2010 14:43

Цитата:
Списки слов, тезаурусы для пользовательских словарей ФайнРидера - 96 языков.
Их можно открыть в Блокноте и сохранить в новом файле, некоторые придется, наверно, почистить.
http://wiki.services.openoffice.org/wiki/Dictionaries

Судя по адресу ссылки, это словари к OpenOffice, сделанные в MySpell. С FineReader ни MySpell, ни ее коллега ISpell напрямую не совместимы - этот момент как-то обсуждался на оф. форуме.

Значит или нужна перелицовка под формат словарей FineReader, или инструкция, как такую перелицовку самому сделать. Лучше конечно первое.

А сами словари в OpenOffice очень даже неплохие. В качестве базы там используется словарь Лебедева, который считается одним из лучших орфографических словарей русского языка.
Автор: valuevmikael
Дата сообщения: 20.01.2010 12:08
kop2005

Цитата:
Как организовать OCR (Оптическое распознавание текста) из командной строки имея ABBYY FineReader 7.0 Corporate Edition. Нужен пример параметров командной строки для FR или такое невозможно (ткните в какую сторону копать)?


Это возможно только в корпоративной версии. Ключи прописаны в файле FinereaderCmd.txt в папке установки (в 9 версии).
Вот выписки:
Finereader.exe <ImageSourceCommands> [<RecognitionCommands>] [<ExportCommands>]

<ImageSourceCommands>
    ImageFiles | /scan [SourceName] | /multiSR [SourceName]

<RecognitionCommands>
    /lang LangName
    /OptionsFile OptionsFileName

<ExportCommands>
    /send Target
Автор: valuevmikael
Дата сообщения: 20.01.2010 14:52
Не могу в версии 10 (любые билды) запустить сканирование с TWAIN драйвером. При нажатии на скан, сканер дергается и ничего не делает.
WIA драйвер работает, но он корявый, при каждой странице, даже в режиме многостраничного сканирования, инициализирует сканер. На это уходит 22 сек. Полный цикл сканирования 45 сек. Это в два раза больше, чем в 9 версии (23 сек/стр). Там TWAIN работает прекрасно.
Кто нибудь подскажет, куды копать?
WinXP SP3, BenQ Scanner 5160C
Автор: Vostrikovskiy
Дата сообщения: 20.01.2010 21:49
valuevmikael
Запорите сканер. ABBYY не спец в области драйверов: лучше в ней не экспериментировать.

Добавлено:
Радует то, что последние версии ABBYY "жрут" меньше памяти при распознавании djvu.
Автор: AlexLev59
Дата сообщения: 21.01.2010 09:59
Вопрос по ABBYY FineReader 10.
Пробовал версии: ABBYY FineReader 10.0.102.95 (70012) Professional Edition Incl. New Patch, и ABBYY FineReader 10.0.101.56 (артикул 7008) + Path
В обоих - ABBYY Screenshot Reader не сохраняет текст в буфер обмена.
Есть мнения? Спасибо.
Автор: bolvanchik
Дата сообщения: 21.01.2010 11:50
AlexLev59

Цитата:
В обоих - ABBYY Screenshot Reader не сохраняет текст в буфер обмена.
Есть мнения? Спасибо.



в версии 10.0.102.109 такая же проблема. похоже "косяк" у SSR с буфером обмена. первый раз срабатывает нормально, а в следующие разы копирует то, что было сохранено в первый раз
Автор: bob1975
Дата сообщения: 21.01.2010 15:44
AlexLev59
Б Р Я Х Н Я!
Автор: bolvanchik
Дата сообщения: 21.01.2010 18:22
bob1975

AlexLev59 "брешет"отчасти. тут проблема скорее всего с тем, что не все текстовые редакторы работают корректно с буфером обмена. хотя я попробовал с девяткой и с тремя текстовыми редакторами Блокнот, AkePad и Бред, и все прошло замечательно со всеми тремя. а вот у десятки только у первых двух нормально. с третим "не дружит" - всё время вставляет тот текст, который был распознан первым или просто был скопирован откуда-то перед работой SSR.
Автор: Astra55
Дата сообщения: 21.01.2010 18:54
AlexLev59
bolvanchik
bob1975
Ошиблись топиком, вам всем сюда - http://forum.ru-board.com/topic.cgi?forum=35&bm=1&topic=43954&glp
Автор: bolvanchik
Дата сообщения: 21.01.2010 18:58
Astra55

я точно не ошибся. у меня лицензия. На 9-ку и на 10-ку
Автор: NickOnToluca
Дата сообщения: 21.01.2010 19:40
Честно опробовав 10-ю возвращаюсь на 8-ку (как основную).
Столько памяти и проца даже виртуальная тачка не жрет.
ИМХО.

Как добавить в 8-ку распознавание экзотики типа DJV?
Автор: boss911
Дата сообщения: 21.01.2010 21:20
Всем привет. Скажите, плиз, за что отвечают эти опции в инсталляторе:

Цитата:
Запускать ABBYY Screenshot Reader при загрузке системы
Я согласен на передачу информации об используемых настройках ABBYY FineReader в компанию ABBYY

Вторая это понятно, отключает в опциях программы участие в программе улучшения качества FR. Но вот что отключает первая опция? Я думал это:

Код: [HKEY_LOCAL_MACHINE\Software\Microsoft\Windows\CurrentVersion\Run]
"Bonus.SSR.FR10"="\"C:\\Program Files\\ABBYY FineReader 10\\Bonus.ScreenshotReader.exe\" /autorun"
Автор: Astra55
Дата сообщения: 22.01.2010 06:20
NickOnToluca

Цитата:
Столько памяти и проца даже виртуальная тачка не жрет.

Так отож! У ABBYY пухнет все, от программ до финансового аппетита. Зато худеет удобство, скорость, точность и все прочее, что отличает хороший софт от дерьма. Сделал я портабельную сборку 10-ки, но так, на всякий случай, сам тоже пользуюсь 8-кой.

Цитата:
Как добавить в 8-ку распознавание экзотики типа DJV?

Это невозможно, зато ИрфанВью и другие инструменты конвертят djvu в tif без проблем. Ну будет чуть дольше, но не по тыще же книг каждый день OCR-ить.
Автор: NickOnToluca
Дата сообщения: 22.01.2010 08:53
Astra55

Цитата:
Так отож! У ABBYY пухнет все, от программ до финансового аппетита.

Это все:
1. Лень разработчиков при оптимизации.
2. Лень разработчиков компиляторов.
3. Гонка мощного железа (втюхивание народу). Вот увидите - в ближайших версиях ридера будет "суперская поддержка ресурсов видеокарты при распознавании"
(хорошо оптимизированная XP cо всеми программами вполне может вместиться в сотни метров и летать на допотопном железе). Пример - KolibriOS, написанная на ассемблере.


Цитата:
Это невозможно, зато ИрфанВью и другие инструменты конвертят djvu в tif без проблем.

Дело в том, что, если не путаю шарики и ролики, видел какой-то файлик, который можно подбросить в FR8 для DJV.
Если не приснилось, нужно еще поискать.
Автор: Astra55
Дата сообщения: 22.01.2010 09:25
NickOnToluca

Цитата:
Если не приснилось, нужно еще поискать.

Нет, не приснилось, но это только для 9-й версии. Начиная с какого-то там билда 9-ки, дллки идут по дефолту в дистрибутиве, но их можно подбросить в более ранние версии.
Автор: kerberosV5
Дата сообщения: 22.01.2010 09:28

Цитата:
ABBYY Screenshot Reader

Подскажите, это что за зверь? А то я его побоялся устанавливать, а вдруг это что-то нужное
Автор: bolvanchik
Дата сообщения: 22.01.2010 10:09
kerberosV5

ABBYY Screenshot Reader — программа для создания снимков любой области экрана
Автор: oshizelly
Дата сообщения: 22.01.2010 10:35
Astra55
Цитата:
Сделал я портабельную сборку 10-ки, но так, на всякий случай, сам тоже пользуюсь 8-кой.

Судя по заявлениям отдельных товарищей в этом топике, в некоторых редких ситуациях (например, при обработке сложных таблиц) 10-ка оказывается лучше предыдущих версий. Так что IMHO наиболее логичное решение: использовать в качестве основной версии 8-ку или 9-ку, а в параллель для особых случаев иметь в запасе портабельную 10-ку.
Кстати, нет ли желания поделиться сборкой с народом?
Автор: CRANK
Дата сообщения: 22.01.2010 10:57
NickOnToluca
Astra55
http://rghost.ru/871973
Для поддержки формата DjVu в девятке. Пробуйте, может и к восьмерке подойдет.
Автор: NickOnToluca
Дата сообщения: 22.01.2010 11:13
oshizelly
В принципе я сравнивал - обе без ручной правки ДО и ПОСЛЕ ничего хорошего из сложных таблиц после косорукого сканирования (а обычно с такой гадостью и приходится иметь дело) не сделают.

Знаете эти смешанные чувства, когда приходит "маленький человечек от большого начальника" с туалетной бумагой из факса неудачной ксерокопии после распечатки скана и говорит "А можно сделать, чтобы я могла в ворде редактировать ЭТО"?

Добавлено:
CRANK
Спасибо, попробуем.

Добавлено:
Как руки дойдут попробую подбросить эти и другие недостающие из 10-ки в 8-ку.

Сейчас нет дистрибутива 8-ки под рукой.
Автор: boss911
Дата сообщения: 22.01.2010 23:51
Мне жутко не нравится, что дистрибутив 10-ки распух до неприличных размеров, я его сравнил 9-й версией. Обнаружил в 10-ке не малый архив Bin.cab, в 9-ке его нет. Скажите, что в этом архиве, уж очень хочется от него избавится, ибо FR10 не влазит на DVD сборку моего софта.

Мне вот не понятно, если его нет в 9-ке, то, что такого надо было напихать в 10-ку, аж на 246Mb.
Автор: bolvanchik
Дата сообщения: 23.01.2010 07:34

Цитата:
Мне вот не понятно, если его нет в 9-ке, то, что такого надо было напихать в 10-ку, аж на 246Mb


Львиную долю Bin.cab (это архив) составляют 2 файла: Normal.fcjk и Normal.cjk
Автор: Astra55
Дата сообщения: 23.01.2010 07:46
bolvanchik
cjk = China Japan Korea
Автор: bolvanchik
Дата сообщения: 23.01.2010 08:51
Astra55

Цитата:
cjk = China Japan Korea

т.е. по сути половине народа "ненужные" языки ....

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.