Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: Antonij72
Дата сообщения: 10.01.2012 14:08
Shangry
Спасибо.
Автор: ALEX666999
Дата сообщения: 10.01.2012 15:18
Shangry
Antonij72


Цитата:
делать оглашать такие перечни для очередных билдов общественности

Так как по одному из диалогов на том же оф. форуме, списки есть, но они для внутреннего пользования.
Автор: Shangry
Дата сообщения: 11.01.2012 17:50
ALEX666999

Цитата:
Так как по одному из диалогов на том же оф. форуме, списки есть, но они для внутреннего пользования.

Для внутреннего пользования они должны быть по определению - и утверждать их надо, и работу отделов координировать.

Ну,а нам-то с того толку? Получаем некий "черный ящик", потом сидим и разбираемся, что же в нем стоящего наваяли.
Автор: ezik58
Дата сообщения: 16.01.2012 22:46
Инсталировал FineReader Engine 10 (FRE10R4GM_part_681-31_build_10-0-8-109) на виндовс XP.
при попытке запустить JAVA пример получаю ошибку: java.lang.UnsatisfiedLinkError (установки по дефолту - только пас на JDK надо изменить, JDK 1.6)

C:\Documents and Settings\All Users\Application Data\ABBYY\SDK\10\FineReader Engine\Samples\Java\Hello>"C:\Program Files\Java\jdk1.6.0_10\bin\java" -classpath .;..\..\..\inc\Java\com.abbyy.FREngine.jar Hello
Initializing Engine...

C:\Documents%20and%20Settings\All%20Users\Application%20Data\ABBYY\SDK\10\FineReader%20Engine\Inc\Java\com.abbyy.FREngine.jar (The system cannot find the path specified)

Exception in thread "main" java.lang.UnsatisfiedLinkError: com.abbyy.FREngine.Engine.load(Ljava/lang/String;Ljava/lang/String;Ljava/lang/String;Ljava/lang/String;Ljava/lang/String;Ljava/lang/String;)Lcom/abbyy/FREngine/IEngine;
at com.abbyy.FREngine.Engine.load(Native Method)
at com.abbyy.FREngine.Engine.Load(Engine.java:12)
at Hello.loadEngine(Hello.java:40)
at Hello.Run(Hello.java:28)
at Hello.main(Hello.java:20)zapustit'

C:\Documents and Settings\All Users\Application Data\ABBYY\SDK\10\FineReader Engine\Samples\Java\Hello>pause
Press any key to continue . . .

Что в кофигурации инкорент ?
Автор: ezik58
Дата сообщения: 17.01.2012 17:07
Кто напорется на ету пробему - надо двинуть демо в директории без пробелов
Автор: Brother_Micro
Дата сообщения: 20.01.2012 16:03
Господа, а можно как-нибудь распознать китайские иероглифы?
Автор: Shangry
Дата сообщения: 20.01.2012 16:11
Brother_Micro

Цитата:
Господа, а можно как-нибудь распознать китайские иероглифы?

В FineReader это уже не первую версию есть.
Только вот вычитывать и редактировать в нем иероглифический текст, м-да... То еще удовольствие.
Автор: klaus65
Дата сообщения: 29.01.2012 10:38
junior64
Различие заложено в само название. Одна версия позволяет работать в триальном режиме, вторая просто не запустится без активации.
Автор: Dima555555
Дата сообщения: 30.01.2012 12:49
только у меня в последних версиях при галочке "Пауза между страницами 0 секунд" сканер ждет около 1,5 минут после сканирования и только после этого начинает сканировать? С 9 или 10-ой линейкой такого не было, сканировал моментально без пауз. Из-за этого приходится пользоваться VueScan и отдавать pdf в FineReader на распознание...
Автор: Shangry
Дата сообщения: 31.01.2012 15:09
Dima555555

Цитата:
только у меня в последних версиях при галочке "Пауза между страницами 0 секунд" сканер ждет около 1,5 минут после сканирования

Попробуйте поставить не 0 секунд, а что-то реальное, допустим 1 секунду. Иногда такой трюк помогает.


Цитата:
Из-за этого приходится пользоваться VueScan и отдавать pdf в FineReader на распознание...

Vuescan - это понятно, но зачем перемещать сканы между ней и FineReader в виде PDF? Проще было бы в TIFF, на худой случай в JPEG.
Автор: Dima555555
Дата сообщения: 31.01.2012 15:34
Shangry

Цитата:
Попробуйте поставить не 0 секунд, а что-то реальное, допустим 1 секунду.

само собою пробовал, не помогает.


Цитата:
но зачем перемещать сканы между ней и FineReader в виде PDF

Vuescan отдает все отсканированные страницы одним файлом PDF. По мне так это очень даже удобно.


Цитата:
Проще было бы в TIFF, на худой случай в JPEG

да ну, куча файлов будет, а от PDF собственно качество особо и не теряется.

жалко только там нет настройки автоматического сканирования по интервалу, приходится жать всего кнопку, зато ждать после предыдущего сканирования не приходится не секунды.
Автор: Astra55
Дата сообщения: 31.01.2012 15:47
Dima555555

Цитата:
куча файлов будет, а от PDF собственно качество особо и не теряется

Есть многостраничный tif. Что до pdf, то в обиходе не существует векторных сканеров, поэтому этот самый pdf - всего лишь контейнер с растровыми файлами внутри. Поэтому никаких преимуществ применение pdf не дает и дать не может в принципе.
P.S. В шапке лежит пакет Scanitto Pro с автосканом, сам пользуюсь, никаких проблем
Автор: Shangry
Дата сообщения: 31.01.2012 17:21
Dima555555

Цитата:
... да ну, куча файлов будет, а от PDF собственно качество особо и не теряется.

Сначала время на сборку во Vuescan PDF, из исходных сканов. Затем время на разборку этих же PDF в FineReader, которому нужен именно растр. Можно конечно и так, но по мне только лишнюю работу делать.
Сказать Vuescan "сохранять в растровый формат такой-то", а потом FineReader "взять данные из папки такой-то" - вот и все хлопоты.

Что же до качества сканов, то его потери при переводе в PDF (а точнее в JPEG) малокритичны только если на страницах чистая текстовка. Если там есть изображения, то при JPEG-сжатии может сойти, а может и посыпаться.

Автор: Astra55
Дата сообщения: 31.01.2012 17:49
В шапку добавлена ссылка на топик Электронные текстовые книги - OCR, вычитка, оформление, поскольку основным инструментом OCR был и остается FineReader, возможно кто-то найдет для себе что-то полезное.
Автор: Fafy
Дата сообщения: 04.02.2012 11:52

Цитата:
только у меня в последних версиях при галочке "Пауза между страницами 0 секунд" сканер ждет около 1,5 минут после сканирования и только после этого начинает сканировать? С 9 или 10-ой линейкой такого не было, сканировал моментально без пауз.

Попробуйте отключить антивирусный сканер и опять сканировать! У меня тоже были задержки когда стоял антивирь комодо, при отключении антивирусного сканера стало летать.
Автор: Dima555555
Дата сообщения: 04.02.2012 18:39

Цитата:
Попробуйте отключить антивирусный

подтверждаю, проблема решена. спасибо.
Автор: Shangry
Дата сообщения: 06.02.2012 13:30
Fafy

Цитата:
Попробуйте отключить антивирусный сканер и опять сканировать!

Или в антивирусе отключить проверку расширений .TIF, .JPG, .BMP и прочего подобного. В растровых форматах вирусности отродясь не водилось, так что нечего на них время тратить.
Автор: SergiuZ
Дата сообщения: 06.02.2012 18:48
Можно ли как-нибудь изменить путь сохранения файлов? Чтобы пихал в нужную папку, а не в Мои документы. Если важнf версия - у меня: FR9, win2008 x64. Thank you.
Автор: Shangry
Дата сообщения: 07.02.2012 12:50
SergiuZ
Задать фиксированную папку для сохранения, как в том же Word, здесь нельзя. Обычно FineReader сначала идет по последнему использоваввшемуся пути, а если его уже нет (переименовано, стерто), то лезет в Мои документы.
Автор: Asite3000
Дата сообщения: 08.02.2012 15:37
Есть простой вопрос. Искал ответ в шапке, на форуме Abbyy ... не нашел.
В общем, какие опции сохранения pdf надо выставить в FR 11, чтобы картинки не отличались от оригинала?
Выставлял "Высокое разрешение(качество оригинала)", "Размер бумаги оригинала", "Не выполнять предобработку" - не помогает, картинки заметно мылятся.
Процесс такой:
1.Оригинал - PDF(состоит только из сканированных картинок).
2.Через PDF-XChange_Viewer_PRO сохраняются страницы в BMP(300dpi). Замыливания нет.
3.Открываю в FR11, ставлю разные опции(см.выше) - результат мыло и в несколько раз меньший размер PDF(что объяснимо при сильных потерях качества).

Помогите пожалуйста советом!
Автор: Uraanfgh56
Дата сообщения: 09.02.2012 18:21
Доброго !

Какую лучше версию взять - для распознавания рукописного текста ? - с тетради - написано в принципе нормальным почерком, есть немного формул , в т.ч химических ,но не структурных, а брутто.
Автор: ComboFZ
Дата сообщения: 09.02.2012 19:10
Asite3000
http://s018.radikal.ru/i508/1202/e7/23edaf20599c.jpg
Автор: Asite3000
Дата сообщения: 10.02.2012 07:20
ComboFZ
Да, это так. Но при этом размер получается в 2 раза больше оригинала.
Я пошерстил инет и нашел, что единственный выход - делать из pdf "псевдо djvu". Размер при этом остается 1:1 от оригинала + OCR.
Автор: Andy_Urb
Дата сообщения: 10.02.2012 10:01
Может стоит добавить в шапку это

Добавлено:
Чутка ошибся - не глянул что там нету ссылок на скачивание этих языков.
Автор: Astra55
Дата сообщения: 10.02.2012 10:20
Andy_Urb
Список языков распознавания добавлен в шапку, только ссылка на русскую страницу. Скачивать дополнительно ничего не нужно, все языки уже входят в дистрибутив.
Автор: ComboFZ
Дата сообщения: 10.02.2012 12:06
Asite3000

Цитата:
Да, это так. Но при этом размер получается в 2 раза больше оригинала.

Там картинки с беспотерьным сжатием, PDF потом можно оптимизировать в том же Акробате, больше настроек.
Автор: Shangry
Дата сообщения: 10.02.2012 15:48
Asite3000
В настройках сохранения PDF:
1. Размер бумаги - "Использовать размер оригинала".
2. Качество изображения - "Пользовательское".
3. Внутри "Пользовательского"
- разрешение - исходное
- цветность - не менять цветность
- качество - потеря качества запрещена

Если получаются слишком большие размеры, разрешите потерю качества и подвигайте ползунком между 80% и 100%. Изображения при этом если и ухудшаются, то не очень.
Сторонними программами для уменьшения объема пользуйтесь с оглядкой. Бывает так, что после переужатия слетает текстовая подложка PDF .
Автор: Asite3000
Дата сообщения: 13.02.2012 09:33
Shangry
Именно так и делал. Но размер уж очень большой получался.
Поэтому попробую в Акробате оптимизировать(как предложил ComboFZ), а если не получится,то сделать псевдо-DJVU.
Автор: Shangry
Дата сообщения: 13.02.2012 14:50
Asite3000

Цитата:
Именно так и делал. Но размер уж очень большой получался.

Попробовал, как и вы, ставить запрет на потерю качества. Получались PDF, размера сравнимого со сканами в TIFF (раза в полтора поменьше). Так что наблюдаемое у вас удвоение размера оригинала вроде бы не должно получаться (на "беспотерьный" режим скорее всего навешено обычное LZW-сжатие).

Может быть выложите где-нибудь исходный PDF? Здесь явно надо оригинальный материал смотреть.


Цитата:
Поэтому попробую в Акробате оптимизировать(как предложил ComboFZ),

Акробатовская оптимизация обычно сводится к пересжатию картинок или в JPEG, или в JPEG 2000, плюс к манипуляциям с разрешением картинки. Это можно и без него сделать.
Разве что попробовать напустить на ваши сканы ClearScan, но тогда может слететь текстовый слой от FineReader.

Автор: Asite3000
Дата сообщения: 14.02.2012 08:57
Shangry
Исходный файл "Палеолит СССР. 1984.pdf" (109 Мб).
Полученный "беспотерьный" - 261 Мб.
Самое грустное, что при этом картинки все равно немного мылятся!


Разумеется, если пытаться привести размер к оригиналу, качество будет гораздо хуже.
Может есть какой-нибудь способ к исходному pdf прикрутить OCR без пережатия? Для DJVU это делается очень просто.


Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.