Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: Shangry
Дата сообщения: 15.02.2012 16:10
Asite3000

Цитата:
Может есть какой-нибудь способ к исходному pdf прикрутить OCR без пережатия?

Любой PDF-софт с движком распознавания, начиная с Акробата. Там исходный файл не переделывается, а к нему просто добавляется текстовая подложка.
Но вычитки при этом, увы, не сделаешь. Как получится, так и будет.


Цитата:
Исходный файл "Палеолит СССР. 1984.pdf" (109 Мб).

Что-то не везет мне с ним. Торренты у меня почему-то качаются с черепашьей скоростью, а на обычных ссылках то "Немедленно зарегистрируйтесь!", то Касперский панику поднимает.
Автор: Asite3000
Дата сообщения: 16.02.2012 11:42
Shangry

Цитата:
Любой PDF-софт с движком распознавания, начиная с Акробата. Там исходный файл не переделывается, а к нему просто добавляется текстовая подложка.

Открыл pdf(109Мб) в Adobe Acrobat Professional 10.1.2, распознал(300dpi), сохранил как pdf - размер 238Мб.
Значит все-таки переделывается файл. Или я что-то не так сделал?
Автор: Shangry
Дата сообщения: 16.02.2012 13:25
Asite3000
Может все-таки выложите где-нибудь этот PDF?
Здесь для половины ответов подопытный материал нужен, а его как раз и нету.
Автор: Asite3000
Дата сообщения: 16.02.2012 19:24
Выложил Ссылка
Автор: Astra55
Дата сообщения: 16.02.2012 20:07
Asite3000
Забудьте про переделки этого ужаса. То есть, убрать серый фон и сделать черно-белое проблем нет, но восстановить нормальный вид букв уже не получится, перемычки слиты. Можно попробовать распознать в FR, но потом придется очень долго вычитывать.
Если есть желание попробовать, тогда откладывайте в сторону FR, от него в данном случае толку не будет, извлекайте графику из pdf, ресэмпл, обработка (deskew, despeckle и прочее), потом pdf CS и т.д.
Автор: Asite3000
Дата сообщения: 17.02.2012 08:17
Astra55
Мне не надо его переделывать, улучшать, фон убирать и т.д. Мне нужно только одно - добавить к PDF слой OCR без изменения качества самого PDF. Но это никакая программа не умеет, в отличие от DJVU, в котором добавить или убрать OCR без пережатия - элементарное дело.
В любом варианте(распознавание исходного PDF или сконвертированного постранично в tiff) и любой программой(FR или Acrobat) при сохранении идет пережатие документа с заметной потерей качества. Если сохранять без потерь, то размер получается в 2 раза больше.
Автор: Astra55
Дата сообщения: 17.02.2012 09:11
Asite3000
Только что взял несколько страниц, распознал в FR, сохранил в pdf, исходный размер был 2 575 245, после сохранения 679 576. Не нравится изменение исходного качества? Открывайте pdf файл в Acrobat X, обрабатывайте с опцией ClearScan, будет кое-какный OCR и практически исходный вид. Размер в этом случае 1 888 339.

Цитата:
Но это никакая программа не умеет

Это не программа не умеет, а Вы не умеете работать с программами и не знаете основ растровой графики, не говоря про OCR, PDF и более высокие материи.
Автор: Asite3000
Дата сообщения: 17.02.2012 10:41
Astra55

Цитата:
Это не программа не умеет, а Вы не умеете работать с программами и не знаете основ растровой графики, не говоря про OCR, PDF и более высокие материи.


Цитата:
Не нравится изменение исходного качества? Открывайте pdf файл в Acrobat X, обрабатывайте с опцией ClearScan, будет кое-какный OCR и практически исходный вид. Размер в этом случае 1 888 339.

Не находите противоречий в своих высказываниях?
Несмотря на незнания основ растровой графики, я все-таки вижу, что в файл DJVU можно вставить OCR без изменения исходного качества, а с PDF такая штука не проходит никаким способом.
Наверное знание высоких материй позволяют считать, то исходный вид, и практически исходный вид - это одно и тоже.
Автор: Astra55
Дата сообщения: 17.02.2012 10:52
Asite3000
Ладно, что я буду пытаться доказывать очевидное? "Тогда сам выбирай колор и сам крась!" (с)
Автор: ComboFZ
Дата сообщения: 20.02.2012 19:14
Asite3000

Цитата:
Мне не надо его переделывать, улучшать, фон убирать и т.д. Мне нужно только одно - добавить к PDF слой OCR без изменения качества самого PDF.

FineReader 11: Original.pdf, в Опциях отключить предобработку изображений, распознанные области с картинками убрать, на выходе - OCR+изображение с сильным сжатием с потерями но "Сохранив размер оригинала" и "Исходное разрешение" в пользовательских настройках (текст под изображением) -> FR.pdf
Ес-но качество OCR от такой необработанной графики (

PDF-XChange Tools 4: получение "Перекрывающегося PDF" (FR.pdf + Original.pdf)

Adobe Acrobat X: удаление среднего "слоя" с графикой от FR, сохранение и оптимизация (не трогая изображения при оптимизации, убрав соответствующую галку)

50 первых страниц: http://rghost.ru/36625238 (ACRX_0-50_optimiz2.pdf)
Изображения jpeg совпадают побайтно и по CRC-суммам (md5) с вашим оригиналом: Палеолит СССР. 1984.pdf.
Оригинал из 50-ти страниц - 13.4MB, в итоге - 13.9MB
Автор: Shangry
Дата сообщения: 21.02.2012 17:46
К сказанному ComboFZ могу добавить Акробат 8 --> Распознать --> Разрешение 400.
Вид получается примерно тот же, размер даже немного поменьше (на несколько Мб).
Автор: doSSia
Дата сообщения: 22.02.2012 12:19
Есть вопрос по screenshot reader'у: нужна версия не сохраняющая файлы при работе (не использующая папку temp для временной записи, только буфер обмена) т.к. пользуюсь SSD-диском, важна так же высокая скорость обработки текста (сложность простая: четкие буквы русского-английского с цифрами). Что посоветуете? Может есть аналоги для этого дела? Сейчас пользуюсь 8 версией.
Автор: 2579
Дата сообщения: 28.02.2012 23:26
Очень помогите!!!



Windows 7 x64 Ultimate
Автор: Shangry
Дата сообщения: 29.02.2012 16:31
2579

Цитата:
Очень помогите!!!

Чему помочь?

Уточняю - телепатов и ясновидящих здесь в ближайшее время не ожидается.
Автор: 2579
Дата сообщения: 04.03.2012 23:29
А по скринам совсем не понятно?
Автор: Sjoe
Дата сообщения: 05.03.2012 11:30
Вопрос трехлетней давности, но применительно к ФР 10:

Цитата:

Цитата: Цитата:Пока 10ю версию не спёрли, есть несколько вопросов по поводу 9й версии.
1. Как увеличить масштаб страницы в "Редактировании изображения"? (надо аккуратно подчистить мусор ластиком, а изображение очень мелкое)

Если так нужен ластик - добавьте кастомайзом эту команду на тулбар и пользуйтесь ей в не в редакторе изображений а в окне изображение.
Автор: DIMKA12
Дата сообщения: 05.03.2012 20:23
Добрый вечер!
Такая ошибка на 7 x64
ABBYY FineReader 11.0.102.583 Professional
Сигнатура проблемы:
Имя события проблемы: APPCRASH
Имя приложения: FineExec.exe
Версия приложения: 11.0.102.583
Отметка времени приложения: 4f174de7
Имя модуля с ошибкой: DL91CoolType.dll
Версия модуля с ошибкой: 9.1.0.20
Отметка времени модуля с ошибкой: 4e8f1895
Код исключения: c0000005
Смещение исключения: 0008cd97
Версия ОС: 6.1.7601.2.1.0.256.1
Код языка: 1049
Дополнительные сведения 1: 0a9e
Дополнительные сведения 2: 0a9e372d3b4ad19135b953a78882e789
Дополнительные сведения 3: 0a9e
Дополнительные сведения 4: 0a9e372d3b4ad19135b953a78882e789

Ознакомьтесь с заявлением о конфиденциальности в Интернете:
http://go.microsoft.com/fwlink/?linkid=104288&clcid=0x0419

Если заявление о конфиденциальности в Интернете недоступно, ознакомьтесь с его локальным вариантом:
C:\Windows\system32\ru-RU\erofflps.txt
Как исправить? пробовал 10тку ставить тоже самое...
Заранее спасибо!
Автор: zhe_zho
Дата сообщения: 05.03.2012 23:18
Удалён ответ на вопрос DIMKA12 из-за дубляжа вопроса в варезнике.
Автор: unreal666
Дата сообщения: 06.03.2012 01:18

Цитата:
Quick Access Bar'e! (Как это по-russku?)

панель быстрого доступа
Автор: s_host
Дата сообщения: 06.03.2012 18:51
Друзья, помогите пожалуйста с такой проблемой



Win x64SP1, ABBYY FineReader 11.0.102.583 (так же пробовал и 10 версию), CanoScan LIDE 25 (драйвер последней версии с оффсайта). Буду благодарен за любую помощь.

PS: в FR драйвер сканера определяется. Сканер, при подключении к компу, производит характерный треск (готов к работе)
Автор: bolvanchik
Дата сообщения: 06.03.2012 19:51
s_host

Цитата:
... характерный треск ...

ну если уж так, то снизу у этого сканера есть, так называемый, "замок". используется при транспортировании. "откройте" его
вторая причина - кабель (либо подключаете в фронтальный усб)
Автор: s_host
Дата сообщения: 06.03.2012 20:39
bolvanchik
Замок открыт, кабель менял, переподключил в тыловые usb (ошибка та же).
ЗЫ: примерно 2 месяца назад он работал норм.
Автор: bolvanchik
Дата сообщения: 07.03.2012 12:34
s_host
попробуйте подключить к другому компу. если ситуация будет такой же- то 100% дело в сканере )
Автор: s_host
Дата сообщения: 07.03.2012 19:22
bolvanchik
На днях попробую. Спасибо за всё.
Автор: zveroyacher
Дата сообщения: 11.03.2012 17:11
Интересная ситуация. Отсканировал документ. Сохраняю как pdf размера A4. Результат - видно только 12% изображения.
Посмотрел в irfan view размер отпечатка по dpi 69.8 x 100.3 cm в то время когда мне нужно A4 21/29.
Интересно как это получилось при том что бумага с которой сканировали физически меньше A4

И как это править? Не то что бы документ надо было печатать, но вдруг...

Добавлено:
разобрался. Спасибо за глубокомысленное молчание..
Автор: Shangry
Дата сообщения: 13.03.2012 16:17
2579

Цитата:
А по скринам совсем не понятно?

Понятно что что-то произошло. Непонятно - где, в какой момент и вообще по какому поводу все это произошло.
Я ж говорю - телепаты на технических форумах вещь очень редкая.

zveroyacher

Цитата:
Посмотрел в irfan view размер отпечатка по dpi 69.8 x 100.3 cm в то время когда мне нужно A4 21/29.
Интересно как это получилось при том что бумага с которой сканировали физически меньше A4

Скорее всего была включена предобработка изображений. А там на выходе еще и не такие чудеса возможны.

Автор: 2579
Дата сообщения: 14.03.2012 16:59

Цитата:
2579

Цитата:
А по скринам совсем не понятно?

Понятно что что-то произошло. Непонятно - где, в какой момент и вообще по какому поводу все это произошло.
Я ж говорю - телепаты на технических форумах вещь очень редкая.
 

Значит ABBYY Fine Reader v11.0.102.583 Professional Edition:
Запускаю Setup.exe, появляется меню выбора языка. Выбираю "Русский". Появляется окошко Windows Installer "Идет подготовка к установке"... Потом появляется окошко - первый скрин...


Нажимаю "ОК"...

Опять появляется окошко "Идет подготовка к установке"... Дальше лицензионное соглашение... Далее... Выбираю Режим "Выборочная", убираю "Руководство пользователя"... Далее... Убираю везде галочки... Установить... Появляется окошко процесса установки, и через пол секунды выпадает окошко - второй скрин...


Нажав "повторить" окошко это все равно выпадает.
Если "Отмена" то процесс установки переходить в конец ...

Вот.
На что грешить? Windows 7 x64 Ultimate (ставил 12.01.2011)... Остальные программы устанавливаются и работают.

Автор: Maikl65
Дата сообщения: 14.03.2012 18:20

Цитата:
На что грешить?

Возможно, что это "работа" антивируса. Или из-за недостатка прав.
Для начала можно попробовать следующее:
1) Временно отключить антивирус (или выгрузить его из памяти вообще) на момент установки.
2) Запустить установку с правами администратора (щелчок на Setup.exe правой кнопкой мыши, выбрать пункт "Запуск от имени администратора".
добавлено
Да, сначала попробуй "укоротить" путь к файлу setup.exe, путем копирования дистрибутива, например, в папку C:\1. Иногда инсталлятор "не любит" длинные пути к файлам.
Автор: Shangry
Дата сообщения: 15.03.2012 13:45
2579
Или же так - создаете в любом разделе (кроме системного) папку c коротким названием (допустим, TMP), распаковываете в нее содержимое дистрибутива (но еще не запускаете инсталляцию), заходите в эту папку и запускаете установку FineReader.
При этом в случае чего можно посмотреть на месте ли файл на пропажу которого жалуется инсталлятор. Может быть там действительно с MSI-файлом что-то не в порядке.
Автор: WhiteFalcon
Дата сообщения: 16.03.2012 00:36
А Engine есть? Нужен целенаправленно именно он, даже если и старая версия. Операционная система значения также не имеет

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.