Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: max0031
Дата сообщения: 13.06.2008 01:38
fr8 обнаружил косяк такого рода: после сканирования с помощью ластика зачищал сканы. При этом на одних картинках нормально получалось белый фон, а на других место подчистки получалось серым. После сохранения так и получились картинки с серой полосой. Выявить систему не удалось. Получается совершенно в случайном порядке.
Автор: Shulhan
Дата сообщения: 14.06.2008 05:04

Цитата:
Shangry


Shulhan

Цитата:Как вариант, могу предложить попробовать сохранять PDF в формате Text and pictures only с опцией Replace uncertain words with images



Есть еще один момент, который здесь надо учесть.
У FineReader есть дурная привычка распознавать символы одного языка, как символы другого языка и, притом, делать это со стопроцентной уверенностью. Тогда не спасает даже упомянутая установка "Заместить неуверенно распознанные символы их изображениями".

Так что, если и в PDF, сделанном по совету Goul, все равно пойдет мусор, то придется вручную размечать проблемные места с ивритом, как картинки.
Геморрой, конечно, но что поделаешь .
Я хорошо побился об стены в поисках решения и пришёл к выводу, что натыкаюсь именно на эти грабли -"привычка распознавать символы одного языка, как символы другого языка и, притом, делать это со стопроцентной уверенностью". При этом парочка конкурирующих программ распознавания текста оказалась вообще несравненно хуже, как и несколько перепробованных конвертеров. Пришлось идею временно похоронить, но поскольку это всё было средством решения проблемы,а не целью полиграфического уровня, то я это пережил. Видимо, дело движется к постраничной обработке.

Два формата документа, Word and PDF, требовались потому, что изначально скан был в формате DJVU, и в этом конкретном скане качество русских текстов хромало на одну ногу. Распознавание и сохранение результата в документ PDF решило проблему. Преобразование в формат word требовалось потому, что с книгами желательно было долго и серьёзно поработать, причём на разных мониторах, к тому же исходный формат книги несколько неудобен для механического его переноса на монитор.

Я очень благодарен тем, кто попытался мне помочь - как минимум, благодаря вам я не заработал комплекса неполноценности, обзывая себя круглым идиотом, неспособным даже с такой ерундой справиться. Как максимум - я начал кое-что понимать.
ВСЕМ СПАСИБА
Автор: MitrichID
Дата сообщения: 17.06.2008 22:51
Коллеги, подскажите, каким образом можно редактировать словари в FineReader'е?
Меня, к примеру, раздражает, что после распознавания и проверки криво распознанный предлог "на" FR воспринимает как существительное "па". Балетная тематика меня не интересует, посему хотелось бы выкинуть данное существительное из базового словаря.
Автор: vitaly1
Дата сообщения: 18.06.2008 11:49
ABBYY FineReader 9.0 овладел ивритом, китайским, тайским и японским языками
Автор: cracklover
Дата сообщения: 29.06.2008 18:25
vitaly1
Лучше бы он овладел сложноформатированными таблицами. После распознавания таких таблиц файнридер пакостит больше чем распознает.
Автор: vitaly1
Дата сообщения: 30.06.2008 09:35
cracklover
Напиши на оф форум, желательно с примером, может и сделают чего в след. версии.
Автор: karst
Дата сообщения: 05.07.2008 12:45
Где и с каким расширением 9-я версия хранит пользовательские словари?
И можно ли их сохранять с сохранением морфологии?
Потому как при экспорте словаря сохраняется просто текстовый файл со списком слов и цифрой " 100" возле слова.
Автор: karst
Дата сообщения: 05.07.2008 19:31
Сам разобрался

СЛОВАРИ

X:\Documents and Settings\UserName\Application Data\ABBYY\FineReader\9.00\UserDictionaries\
Изменить или посмотреть расположение словарей можно на вкладке: Сервис>Опции>Дополнительно>Проверка орфографии
Расширение словарей
*.pmd Portable Morphological Dictionary - текстовый файл с заголовком
!!!DO NOT EDIT THIS FILE!!!
Portable Morphological Dictionary
Language

*.ame бинарный файл с тем же именем, что и *.pmd

Экспорт словарей (простой текст: термин и рядом с ним 100)
Опции - Дополнительные -     Проверка орфографии - Просмотр словарей - Выбрать словарь - Выбрать словарь - Экспорт
или
Сервис - - Просмотр словарей - Выбрать словарь - Выбрать словарь - Экспорт

Импорт словарей
Текст или Unicode (*.txt;*.dic)
Portable Morphological Dictionary (*.pmd)
Автор: qroposat
Дата сообщения: 11.07.2008 21:43
Подскажите, куда в 9ке спрятана функция очистки изображения от мусора?
Автор: unreal666
Дата сообщения: 11.07.2008 22:58
qroposat
Сделали в виде кнопок/команд, только нифига их не вывели на панель.
См. в Сервис - Настройка - Панели инструментов - Категория "Изображение" и там есть команды "Очистить изображение" и "Очистить область от мусора" и еще кое-какие. Добавь их на желаемую панель
Автор: qroposat
Дата сообщения: 12.07.2008 09:28
unreal666
Спасибо
Автор: Andrey Petrov
Дата сообщения: 13.07.2008 08:12
Заметил одну особенность работы ABBYY Screenshot Reader в FineReader 9.0.0.724

Он лишь изредка распознаёт текст к ярлыкам на рабочем столе.
ABBYY Screenshot Reader из FineReader 8.0.0.706 распознаёт текст гораздо лучше и чаще.
Автор: munghauzen
Дата сообщения: 15.07.2008 14:19
А есть on-line сервис распознавания текста? Может кто видел, поделитесь плиз.
Автор: venya_iz_alupki
Дата сообщения: 15.07.2008 14:26
http://www.ocrgrid.org/online-ocr.html
не на русском разумеется...

Добавлено:
и вот еще https://my.ocrnow.com/account/login
принимает PDF, TIFF, JPG, PNG
выдает Word, Excel, Text, PDF, MHT или XML
Автор: munghauzen
Дата сообщения: 15.07.2008 17:00
venya_iz_alupki
нужен русский..

но полюбому в букмарки! спасибо!!
Автор: Vlimiik
Дата сообщения: 16.07.2008 14:03
Неполучаеться экспортировать подписи или печати с документов, народ подскажите как правильно это зделать??
Автор: abz
Дата сообщения: 16.07.2008 15:55
vitaly1

Цитата:
Напиши на оф форум, желательно с примером, может и сделают чего в след. версии.

А они сами этого не знают?!
Автор: Astra55
Дата сообщения: 16.07.2008 20:20
Vlimiik

Цитата:
Неполучаеться экспортировать подписи или печати с документов, народ подскажите как правильно это зделать??

Отбить сто поклонов перед монитором и сто раз прочитать молитву "ABBYY наш, иже еси на небеси", глядишь и поможет в части наставления на путь истинный
P.S. Забыл добавить - если не поможет, тогда выделить подпись и печать в виде картинок и так сохранить.
Автор: AVV_UA
Дата сообщения: 16.07.2008 22:21
Ох, и шапка у нас гла-а-муррррная стала! Из-за лени вместо форматирования скринов напихано... Жуть.
Автор: Astra55
Дата сообщения: 17.07.2008 06:33
AVV_UA
You want it, you get it.
Автор: LulumbaZ
Дата сообщения: 17.07.2008 09:10
Где в версии ABBYY FineReader 9.0 найти FineOCR.exe?
В версии 8.0 он лежит в C:\Program Files\ABBYY FineReader 8.0 Professional Edition\FineOCR.exe).
Автор: Gakmareba
Дата сообщения: 28.07.2008 14:16
Помогите оформить вид регулярного выражения

Подскажите, пожалуйста, как избежать распознанных слов типа "БежАть", "УзнавАть" (то есть в словаре было ударение, а нужно сделать обычные строчные "а")?
а еще - как избежать ошибок типа "ра8говаривать"? (то есть запретить цифры внутри слова)
почитал справку о регулярных выражениях, но толком ничего не понял
Автор: DimONtm
Дата сообщения: 28.07.2008 14:53
LulumbaZ
нет такого в 9-ке
Автор: popkov
Дата сообщения: 28.07.2008 18:01
Gakmareba

Цитата:
почитал справку о регулярных выражениях, но толком ничего не понял

Неудивительно. Описание, данное в разделе "Алфавит, используемый в регулярных выражениях" - ужасно убогое, тупое и даже местами ошибочное (из-за недомыслия составителей). Остаётся надеяться, что обработчик RegExp компания ABBY купила готовый, а не сама разрабатывала (легко представить, какое это было бы убожество - тогда вообще об этой фиче лучше забыть).
Тем не менее, судя по справке, FineReader поддерживает лишь какую-то весьма ограниченную реализацию RegExp. Нет многого, что есть в более приличных продуктах.
Из справки, например, совершенно неясно, можно ли в регулярном выражении указать начало/конец строки каким либо образом. А ведь это - одна из важнейших функций RegExp: слово может начинаться с символа конца строки (тогда оно стоит в начале новой строки), начинаться с начала текстовой области или же начинаться с пробела или табуляции. Есть ещё вариант, когда слово начинается цифры (специфический, чаще всего не нужен).
В хороших реализациях RegExp есть символы, соответствующие началу/концу слова! Эти символы совершенно необходимы и FineReader, но и слова в справке о них я не нашёл (хотя внутри самой программы стопудово выполняется деление на слова - только почему-то доступ к этой возможности через RegExp не реализован).
В общем, убожество нынешних программистов ABBY видно как на ладони: не сомневаюсь, что нынешняя "команда" разработчиков - сплошь блатные сынки, которые смогли совместным усилием добиться увольнения с ключевых постов в компании всех талантливых программистов, которые изначально создавали код программы! Теперь они мелкими "улучшениями" создают видимость развития программы. При этом 9-ка жрёт памяти в 20 раз (!) больше, чем 8-ка и работает заметно медленнее! Это и есть цена "улучшения"... Насколько оно велико? Почувствовать трудно, если не быть под гипнозом "новой версии"...
Автор: xenobiotic
Дата сообщения: 02.08.2008 14:53
sorry for me writing in english but one some forum i saw translated instructions how to get AutoTrialReset for finereader 9.0.0.882 , and there was writtent "Credits to Next_Generation / Ru-Board" , so the reason i write here is that this method actually does not work (or maybe i do something incorrectly) , so i just hope that somebody could help here , the translated in english looks like this (i took only part):

create file abbyy.bat:

CODE

net stop "ABBYY FineReader 9.0 PE Licensing Service"
del /f /s /q "C:\Documents and Settings\All Users\Application Data\ABBYY\FineReader\9.00\Licenses\Licensing.cnt"
del /f /s /q "C:\Documents and Settings\All Users\Application Data\ABBYY\FineReader\9.00\Licenses\Licensing.bin"
del /f /s /q "C:\Documents and Settings\All Users\Application Data\ABBYY\FineReader\9.00\Licenses\ProductLicensing.log"
regedit /s abbyy.reg
net start "ABBYY FineReader 9.0 PE Licensing Service"


where if necessary to change the way folders with the license:

for Windows XP:
C: \ Documents and Settings \ All Users \ Application Data \ ABBYY \ FineReader \ 9.00 \ Licenses

for Windows Vista:
C: \ Users \ All Users \ ABBYY \ FineReader \ 9.00 \ Licenses
for me on vista it looks quite different :
C: \ ProgramData \ ABBYY \ FineReader \ 9.00 \ Licenses

and create a file in the notebook abbyy.reg with such content, which must be put next to abbyy.bat that it automatically applied:

CODE

REGEDIT4

[-HKEY_LOCAL_MACHINE\SOFTWARE\Classes\CLSID\{F06524BB-5556-1C0E-7B87-EEFD5B614F56}\Implemented Categories\{703E2B5F-C7DD-38A4-2B74-18F162AC9619}]
[-HKEY_LOCAL_MACHINE\SOFTWARE\Classes\CLSID\{F06524BB-5556-1C0E-7B87-EEFD5B614F56}\Implemented Categories\{7F9476C4-C5EB-169F-EF8F-D4C2F5B2C2AE}]
[-HKEY_LOCAL_MACHINE\SOFTWARE\Classes\CLSID\{F06524BB-5556-1C0E-7B87-EEFD5B614F56}\Implemented Categories\{BF38C53A-3395-7C19-F1B7-CD707135F2D2}]
[-HKEY_CURRENT_USER\Software\Classes\CLSID\{B9D9D726-CEBB-A71E-7D43-4715D5DAC555}]

...and so on (i cut the last part because of not very proper translation into english) , but i believe i did everything as it was indicated (of course registry values are different) , but as i delete those registry entries and try to launch finereader.exe i get only this error msg :

hxxp://i36.tinypic.com/24cw404.jpg

i tried both on winxp sp2 and vista sp1 (32 bit) the same error msg appears , i believe i deleted right registry entries (if this method is trully working) , because i used regmon/filemon utilities from sysinternals to monitor finereader.exe at starting..

in Russian :

передача "Очумелые ручки: сделай сам, тема "Автовосстановление триала ABBYY FineReader 9.0.0.882 Professional Edition в вашем компьютере."
Итак, приступим:
в блокноте создаем такой файл abbyy.bat:
CODE
net stop "ABBYY FineReader 9.0 PE Licensing Service"
del /f /s /q "C:\Documents and Settings\All Users\Application Data\ABBYY\FineReader\9.00\Licenses\Licensing.cnt"
del /f /s /q "C:\Documents and Settings\All Users\Application Data\ABBYY\FineReader\9.00\Licenses\Licensing.bin"
del /f /s /q "C:\Documents and Settings\All Users\Application Data\ABBYY\FineReader\9.00\Licenses\ProductLicensing.log"
regedit /s abbyy.reg
net start "ABBYY FineReader 9.0 PE Licensing Service"
где при необходимости изменить пути папки с лицензией:

для Windows XP:
C:\Documents and Settings\All Users\Application Data\ABBYY\FineReader\9.00\Licenses

для Windows Vista:
C:\Users\All Users\ABBYY\FineReader\9.00\Licenses

и создать в блокноте файл abbyy.reg с таким содержимым, который надо положить рядом с abbyy.bat чтобы он применялся автоматически:
CODE
REGEDIT4

[-HKEY_LOCAL_MACHINE\SOFTWARE\Classes\CLSID\{F06524BB-5556-1C0E-7B87-EEFD5B614F56}\Implemented Categories\{703E2B5F-C7DD-38A4-2B74-18F162AC9619}]
[-HKEY_LOCAL_MACHINE\SOFTWARE\Classes\CLSID\{F06524BB-5556-1C0E-7B87-EEFD5B614F56}\Implemented Categories\{7F9476C4-C5EB-169F-EF8F-D4C2F5B2C2AE}]
[-HKEY_LOCAL_MACHINE\SOFTWARE\Classes\CLSID\{F06524BB-5556-1C0E-7B87-EEFD5B614F56}\Implemented Categories\{BF38C53A-3395-7C19-F1B7-CD707135F2D2}]
[-HKEY_CURRENT_USER\Software\Classes\CLSID\{B9D9D726-CEBB-A71E-7D43-4715D5DAC555}]
где вместо {B9D9D726-CEBB-A71E-7D43-4715D5DAC555} подставляем свое значение, найдя его
в редакторе реестра (ПУСК-Выполнить-regedit) по адресу [HKEY_CURRENT_USER\Software\Classes\CLSID] и где внутри этого значения есть ветка Implemented Categories
(Переименовать-Копировать-Вставить).
Там же сразу и открываем ветку Implemented Categories и видим 3(2) подветки со значениями,
которые подставляем заместо {703E2B5F-C7DD-38A4-2B74-18F162AC9619},{7F9476C4-C5EB-169F-EF8F-D4C2F5B2C2AE}и {BF38C53A-3395-7C19-F1B7-CD707135F2D2}.
Теперь осталось найти заменяемое значение {F06524BB-5556-1C0E-7B87-EEFD5B614F56}, которое ищем через поиск в [HKEY_LOCAL_MACHINE] по любому из 3(2) вышеуказанных ваших значений,
в нужном найденном результате должно быть все 3(2) значения + 1 лишняя, которая указывает на правильность нахождения
(если лишней нет, то ищем дальше нажатием F3, обычно находит со 2 раза).
Теперь готовый bat и reg файл положить рядом на рабочий стол и вы получите AutoTrialReset для вашего компа под программу ABBYY FineReader 9.0.0.882 Professional Edition.
КОНЕЦ.

also there's AutoTrialReset for ABBYY FineReader 9.0.0.882 Pro (Credits to NoAngel777 / Ru-Board) but still does not work as i saw comment of vista user who tested this one..

thanks for any help .
Автор: ghosty
Дата сообщения: 02.08.2008 16:10
popkov

Цитата:
В общем, убожество нынешних программистов ABBY видно как на ладони: не сомневаюсь, что нынешняя "команда" разработчиков - сплошь блатные сынки

Улыбнуло. Это уже второй раз, когда я слышу арию о блатных сынках в Вашем исполнении Совсем недавно то же было говорено об EndNote...
Автор: ghosty
Дата сообщения: 03.08.2008 11:52
Наконец-то посчастливилось убедиться в истинности слов Astra55 о том, что 9-я версия - полная туфта. Аж зло берет.
Попалась книга с плохой печатью. 8-ка на ней делает кучу ошибок. Особенно почему-то не воспринимает литеру "ж", хотя она пропечатывается вполне нормально. Решил поставить себе 9-ку. Получил в 2-3 раза больше ошибок на страницу, чем в 8-й!!! Особенно в случае с "ж" - если 8-ка хоть как-то справлялась, у 9-ки, похоже, полная идиосинкразия
А самое хреновое, что если бы я, как это многие делают, стер бы 8-ку, то никогда и не узнал бы об этой разнице...
НАРОД, НЕ СТАВЬТЕ 9-КУ - ЭТО ПОДСТАВА

Из распознанного:

Цитата:
Мальбранш отличался в высшей степени благородным и кротким характером и чистейшим, неизменным благочестием. Он умер в Парилке в 1716 г. на семьдесят шестом году своей жизни.
Автор: Astra55
Дата сообщения: 03.08.2008 13:02
ghosty
Иначе говоря, получается полная "Ж"
Автор: unreal666
Дата сообщения: 03.08.2008 19:48
ghosty

Цитата:
Парилке

Парилка - это город такой во Франции?
Автор: Unnicked
Дата сообщения: 14.08.2008 09:40
Народ, подскажите, где скачать языки распознавания к Finereader 9.0? Ссылка в шапке ведет только к описанию языков, а ссылок на скачку там не видно...

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.