Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: Astra55
Дата сообщения: 24.05.2012 06:44
oshizelly
Вспомнил - Лапута! Ну конечно же, эксперименты, достойные лапутян! Если бы Вы экспериментировали, а потом результаты предоставляли публике, тогда я согласился бы с конструктивным подоходом. Но Вы пытаетесь переложить осмысливание происходящего на других, а это уже не эксперименты, а нечто другое. Вчера не поленился и просмотрел архив подписки руборда. Ваши посты, чуть менее, чем полностью заканчиваются теми или иными вопросами. Не замечали?
Автор: Shangry
Дата сообщения: 29.05.2012 15:07
oshizelly

Цитата:
Собс-но, как раз про это я и спрашивал: почему в результате описанных мной выше бессмысленных действий возникает два текстовых слоя, хотя логично было бы ожидать, что Acrobat PDF просто заменит ранее созданный текстовый слой своим.

Ответ на этот вопрос IMHO очевиден.
Акробат получает задание "распознать имеющиеся в файле изображения, результат разместить в виде текстового слоя", которое задание он и выполняет. Поскольку в спецификации формата видимо нет ограничений на количество одновременно присутствующих текстовых слоев, то вы получаете то, что просили - и результаты работы FineReader, и результаты работы Акробата одновременно.

А поскольку создателям внутренней "дуракозащиты" PDF похоже такой выверт "творческой фантазии" в голову не приходил, то и подстраховки на этот счет тоже не предусмотрели.
Автор: bluesbreaker
Дата сообщения: 20.06.2012 10:46
Кто-нибудь занимался настройкой Finereader для распознавание изображений фигур на шахматной диаграмме?
Задача состоит в следующем: нужно каждую клеточку шахматной диаграммы представить в виде лигатуры символов.

Например, изображение "Черный слон на черной клетке" нужно представить в виде лигатуры символов "Bbb" (Bishop black on black), "Пустая черная клетка" - "Eb" (Empty black) и т.д.

Конечная цель - получить шахматную позицию в формате FEN, пригодном для анализа в шахматной программе.

Основная проблема при этом: как заставить Finereader считать каждую клетку шахматной диаграммы отдельным графическим символом?
Автор: AABB
Дата сообщения: 20.06.2012 14:46
Win 7 x64 при открытии графического файла выдает ошибку - Прекращена работа программы "ABBYY FineReader background executor ". Со сканера сканирует, но при выводе изображения выдает ту же ошибку. Может кто-то знает в чем причина?
Автор: Astra55
Дата сообщения: 20.06.2012 20:14
bluesbreaker
Еще один шахматист Может все же прочитаете про возможности FineReader и не будете задавать подобных вопросов? На руборде, во всяком случае, форум ABBYY открыт для желающих невозможного.
Автор: Shangry
Дата сообщения: 21.06.2012 14:05
Astra55

Цитата:
На руборде, во всяком случае, форум ABBYY открыт для желающих невозможного.

Судя по аналогичной тамошней теме задача с шахматными диаграммами проходит по разряду "в полном объеме не решаема, но какими-то отдельными кусками - почему бы и нет".

А если серьезно, то за время, потраченное на поиски способов распознавания, можно было их не раз вручную набить.
Автор: Astra55
Дата сообщения: 21.06.2012 14:47
Shangry
Задача решаема и даже в полном объеме, ничего сложного или суперзаумного там нет. Количество вариантов отображения доски с фигурами конечно, обучение по эталонам есть в FR, на случай каких-то необычных вариантов. Другое дело, что это нужно крайне ограниченному количеству людей, и у ABBYY не вызывает никакого желания тратить время и силы.
Автор: Shangry
Дата сообщения: 22.06.2012 16:49
Astra55

Цитата:
Задача решаема и даже в полном объеме, ничего сложного или суперзаумного там нет.

Здесь основная головная боль не само распознавание, а разметка на блоки. Как-то попробовал разметить шахматную диаграмму в автоматическом режиме, без ручного вмешательства - получилась сплошная каша.
Единственный вариант, который хоть как-то спасал дело - выделить страницу целиком, как блок "Таблица", а потом приказать разметить ее.

Если же садиться делать разметку вручную, так быстрее и проще набить все в редакторе самому.
Автор: ivan76
Дата сообщения: 29.06.2012 11:56
Как можно сделать, что бы при пакетном распознавании сохранял распознанный документ в ту же папку, откуда взял.
При создании пакетного режима в опциях сохранения возможен выбор только в одну папку.
Никто не сталкивался?
Автор: Shangry
Дата сообщения: 04.07.2012 13:20
ivan76
Какая версия?
Автор: ivan76
Дата сообщения: 04.07.2012 16:16
[q][/q]
FineRead 11
Автор: Shangry
Дата сообщения: 05.07.2012 14:44
ivan76
Если обрабатывать изображения, разложенные по отдельным папкам, то никак.
А если их предварительно собрать в PDF (еще лучше в многостраничный TIFF), то просто кладем результаты в ту же папку, где лежали исходники.
Автор: krserv
Дата сообщения: 28.07.2012 11:51
Samsung МФУ SCX 4100

При запуске сканирования Fine Reader 11 Pro - предсканирование зависает при выборе интерфейса в настройках Fine Reader и выдает ошибку TWAIN - сервер не загружен если используется оригинальный (native) интерфейс сканера.
OC Windows 7-64 Pro; драйвер сканера вер. 2.02.17
Автор: tatyana mark
Дата сообщения: 04.08.2012 19:41
при активации прог ABBYY FineReader запрашивается какой-то серийный номер. Хотелось бы узнать серийный номер чего?
Автор: Sjoe
Дата сообщения: 04.08.2012 20:04

Цитата:
при активации прог ABBYY FineReader запрашивается какой-то серийный номер. Хотелось бы узнать серийный номер чего?

Лицензионного дистрибутива, надо полагать.
Автор: Sjoe
Дата сообщения: 07.08.2012 01:38
Коллеги
Полгода назад я писал (применительно к FR10)

Цитата:
Кстати о птичках. (с) У меня птицы на Кеер header and footers тоже не стоит, а прога тем не менее и верхние колонтитулы распознает, и нумерацию страниц. Приходится сначала имидж от них чистить. Может, ещё где чего убрать? ЗБД
Добавлено:
Блин, будете смеяться, но и эта проблема решилась!

Но не решается на FR11.
1. На основном тулбаре кнопка "Сохранять колонтитулы" ОТЖАТА (неактивна).
2. В меню "Опции" птицы опции "Сохранять колонтитулы" НЕ СТОИТ.
Верхний колонтитул, зараза, все равно таки сохраняется, распознается и передается в Ворд.
(Нумерация страниц, правда, не сохраняется).
Что делать? Ластиком на 5000-страничном словаре не намахаешься.
ЗБД.

Автор: ALEX666999
Дата сообщения: 08.08.2012 00:49
Sjoe
nic советовал какую-то программку для редактирования изображений,
типа «кромсатор». Если сканы одинакового размера, то может это выход.
Да-да, «через попу», как обычно, но хоть какое-никакое предложение.
Автор: Sauron_zombie
Дата сообщения: 14.08.2012 10:53
Часто приходится сканировать и сохранять получившееся изображение в PDF (оттенки серого) без распознавания.
Можно как-то научить FR сразу предлагать мне именно PDF, а не TIFF, который там по умолчанию?

Добавлено:
Или может подскажет кто программу (легковесную желательно), которая растровые изображения (распознавать не нужно, в основном, это сканы писем) переводит в многостраничный PDF?
Автор: Shangry
Дата сообщения: 16.08.2012 15:21
Sauron_zombie

Цитата:
Или может подскажет кто программу (легковесную желательно), которая растровые изображения (распознавать не нужно, в основном, это сканы писем) переводит в многостраничный PDF?

Image2PDF. Собирает PDF из растровых изображений. Но собирает "как есть" - что и в каком виде в папке лежит, в таком же точно виде в PDF и попадет.

Если же нужен сборщик а-ля Акробат, с попутным преобразованием/сжатием, то сейчас такой есть в Irfan. В нем же, кстати, теперь имеется и модуль пакетного сканирования.
Автор: Sauron_zombie
Дата сообщения: 16.08.2012 15:26
Shangry
Irfan раньше не мог сохранять в PDF. Неужели научился?
Стоит сейчас не самая последняя версия, но не такая уж и старая - там нет возможности такой.
Погляжу сейчас.
Автор: ALEX666999
Дата сообщения: 17.08.2012 15:38

Цитата:
ABBYY FineReader 11
---------------------------
Ошибка при вызове OpenClipboard

С чем сие может быть связано и как лечить?
Автор: Sauron_zombie
Дата сообщения: 20.08.2012 17:24

Цитата:
Sauron_zombie

Цитата:
Или может подскажет кто программу (легковесную желательно), которая растровые изображения (распознавать не нужно, в основном, это сканы писем) переводит в многостраничный PDF?

Image2PDF. Собирает PDF из растровых изображений. Но собирает "как есть" - что и в каком виде в папке лежит, в таком же точно виде в PDF и попадет.

Если же нужен сборщик а-ля Акробат, с попутным преобразованием/сжатием, то сейчас такой есть в Irfan. В нем же, кстати, теперь имеется и модуль пакетного сканирования.



Image2PDF - не прокатило. Как и IrfanView. Они собирают изображения уже отсканированные из какой-то определённой папки в один PDF.
Мне нужно, чтобы прога взаимодействовала с TWAIN сканера и преобразовывала растр в PDF на лету.
Есть идеи?

Добавлено:

Цитата:
Часто приходится сканировать и сохранять получившееся изображение в PDF (оттенки серого) без распознавания.
Можно как-то научить FR сразу предлагать мне именно PDF, а не TIFF, который там по умолчанию?


Знает кто, как так сделать?
Автор: 73
Дата сообщения: 21.08.2012 09:21
Sauron_zombie
http://forum.ru-board.com/topic.cgi?forum=35&topic=47798&start=20#1
Автор: inapht
Дата сообщения: 22.08.2012 10:03
Какие возможности по распознаванию текста у ABBYY FineReader 11?
У меня например на этой картинке очень плохо распознает те слова которых видимо нет в словаре. Наверное любая антикапча на порядок эффективнее распознает.

Например у меня левый нижний текст:

Цитата:
Seismic Imat^s shew fotso* subducting plate    '

have iiPix’trjlGi) deep into I lie mantle


http://science.compulenta.ru/upload/iblock/201/28781601.jpg

В ABBYY Screenshot Reader маленько по другому.

Цитата:
Seismic Im392sshcw
tots of subducting plate
how iiPiK’trjlGi) deep
into I lie mantle


Надо как то настроить что бы распознавало нормально или другую прогу искать.
Автор: Eric Lazzy
Дата сообщения: 22.08.2012 10:11
камрады, подскажите пожалуйста
меня попросили найти Qi FineReader, вроде как это плагин к ридеру
поиском облазил всё и ничего подобного не нашёл, может слышал кто про такую приблуду?
Автор: 73
Дата сообщения: 22.08.2012 10:44
Eric Lazzy
К FR нет плагинов. Может это был Adobe Reader? Или вообще Акробат? К Акробату есть Quite Imposing (QI) Plus 3 плагин.
Автор: Kolderon
Дата сообщения: 22.08.2012 17:10
Подскажите, как в FineReader 11.0.102.583 заменить графический tiff файл в проекте? У меня есть уже распознанный проект, но некоторые сканы я почистил постфактум и хочу их подпихнуть в этот проект, но чтобы распознанная информация сохранилась и не пришлось распознавать эти листы снова. То есть мне надо подсунуть файлы tiff так, чтобы они только экспортировались из проекта при сохранении, и не выполнять над ними повторно работу по распознаванию и правке.
Автор: Astra55
Дата сообщения: 22.08.2012 17:42
Kolderon
BW tif файлы FR 11 хранятся в папках с номерами страниц и именем bwPage.frdat. Попробовал слегка подредактировать Irfan View и восстановить опять в папке. Работает. Но менять будет трудно, все имена файлов одинаковые, отличаются только папками.
Автор: Kolderon
Дата сообщения: 22.08.2012 17:48
Astra55
Спасибо, попробую. Дружу со всякими скриптами, регулярными выражениями и прочим. Поэтому набросать какой-нибудь скрипт или нечто подобное для подпихивания - не проблема.

А что значит BW? Черно-белые? Посмотрел эти файлы, там действительно черно-белые изображения. Но у меня некоторые сканы с иллюстрациями в градациях серого. Похоже они хранятся в grayComponent.frdat, только вот почему-то они меньше размером чем оригинальные tiff файлы сканов. Получается, что FR11 их перед сохранением в проект как-то обрабатывает. Попробую подменить, посмотрим сработает ли...
Автор: Eric Lazzy
Дата сообщения: 22.08.2012 18:56
73
буду знать, спасибо

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.