Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: Astra55
Дата сообщения: 12.04.2012 16:04
Liliac
Я же в ПМ все рассказал.
Автор: Liliac
Дата сообщения: 13.04.2012 12:17
Astra55
Вы не поняли. Я о другом выше : как правильно надо было сделать pdf, чтобы Astra55 не назвал его
Цитата:
Типичное УГ, вышедшее из кривых ручонок.
?

Автор: Astra55
Дата сообщения: 13.04.2012 21:19
Liliac
1. Сканировать серое 300 dpi и выше или 600 черно-белое.
2. Правильно выставлять соотношение между dpi и линейными размерами в pdf.
3. Прежде чем сканировать, думать головой, а не задницей.
Автор: ostaprest
Дата сообщения: 14.04.2012 13:48
как заблокировать (в FR-11) автоматическое формирование списков? Только строчка начинается с тире, дефиса или цифры, сразу FR видит в этом список, при этом часто при конвертировании в MSWord появляются цифры, которых нет в оригинале.
Автор: Liliac
Дата сообщения: 15.04.2012 21:51
Astra55
Спасибо за пояснение.
1. А почему сканировать в сером или в ч/б, а не в цвете ?
2. Где выставляется это соотношение ?
Автор: Astra55
Дата сообщения: 16.04.2012 06:55
Liliac
Может Вам сначала почитать какой-нибудь простенький материал на тему сканирования растровых изображений? Хотя бы вот этот - http://nrsda.narod.ru/graph/Howtoscan/32.html
Начните с 4-й части. А то Ваши многочисленные "почему" с интервалами в несколько дней, да еще и не по теме топика могут вызвать недовольство администрации и посетителей. Здесь обсуждают ФайнРидер, а не ликвидируют неграмотность по широкому кругу вопросов.
Автор: Sjoe
Дата сообщения: 16.04.2012 13:29
Коллеги,
Не подскажете ли, как убрать из переданного в Word текста цветную (изумрудную) заливку неуверенно распознанных символов?
Я делаю проверку и исправление ошибок распознавания текста не в ФР, а в Ворде. И в нем эта "заливка" ни отменой выделения текста, ни отменой заливки (в меню Форматирование/Границы и заливка) не устраняется.
Заранее большое спасибо.
Автор: ALEX666999
Дата сообщения: 16.04.2012 14:44
Sjoe
Странно, я работаю в 11-м FR и копипащу периодически в 2000-й, 2003-й офис.
Не помню, чтобы был такой «изумрудный» эффект.

А вы в какой версии работаете и каким образом экспортируете в Word?
То есть сначала сохраняете в файл, либо CTRLC+CTRLV из FR?

«Через попу» способ: выбрать белый цвет заливки неуверенно распознанных символов при экспорте.

P.S. Совсем забыл: у меня в настройках, кроме «сохранять колонтитулы» и картинки, все кряжики отжаты!
Автор: Sjoe
Дата сообщения: 16.04.2012 15:20
ALEX666999

Цитата:
А вы в какой версии работаете и каким образом экспортируете в Word?
То есть сначала сохраняете в файл, либо CTRLC+CTRLV из FR?

В 10-й.
Экспортирую просто: Сразу после распознавания без вычитки тыкаю на тулбаре "Передать в МS Word" и всё.

Цитата:
«Через попу» способ: выбрать белый цвет заливки неуверенно распознанных символов при экспорте.

СПС. Я птицу с Highlight uncertain charaters убрал. Посмотрю, что получится.
Добавлено:
Получилось! СПС.

Цитата:
P.S. Совсем забыл: у меня в настройках, кроме «сохранять колонтитулы» и картинки, все кряжики отжаты!

Кстати о птичках. (с) У меня птицы на Кеер header and footers тоже не стоит, а прога тем не менее и верхние колонтитулы распознает, и нумерацию страниц. Приходится сначала имидж от них чистить. Может, ещё где чего убрать? ЗБД
Добавлено:
Блин, будете смеяться, но и эта проблема решилась!
Зато напомнила о себе другая: Размеченные в поле имиджа таблицы после распознания все как одна оказались в текстбоксах, из которых их не выдрать, т.к. копипастятся они вместе с тарой упаковкой - текстбоксами. В восьмерке этого нету. Если вы с этим сталкивались, как это обойти?
Автор: Liliac
Дата сообщения: 17.04.2012 11:41

Цитата:
А то Ваши многочисленные "почему" с интервалами в несколько дней

Нет возможности круглосуточно сидеть на форумах.

Цитата:
Здесь обсуждают ФайнРидер, а не ликвидируют неграмотность по широкому кругу вопросов.

Я не против, если перенесете сообщения отсюда в более подходящую тему
http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=520#10
Astra55
Круг вопросов один и тот же. Кроме того форумы на то и существуют, чтобы делиться инфомацией и узнавать что-то новое. Поменьше звездности и больше культуры в общении желаю Вам.
Автор: Astra55
Дата сообщения: 17.04.2012 12:11
Liliac

Цитата:
Я не против, если перенесете сообщения отсюда в более подходящую тему

Вы меня ни с кем не путаете?

Цитата:
форумы на то и существуют, чтобы делиться инфомацией

Адназначна! Но на форумах существуют правила, которые не рекомендуется нарушать, в частности, тематику топиков. Ну и самообразование путем чтения соответствующей литературы никто не отменял. Сделайте милость, чуток поднимите свой уровень знаний по интересующему вопросу. Сначала читать, думать, потом задавать конкретные вопросы по прочитанному. Иначе любой топик превратится в пережевывание азбучных истин, ответы на которые давным-давно даны и доступны буквально всем и каждому. Это не звездность, а та самая методика обучения, которая начинается в начальных классах.
Автор: Shangry
Дата сообщения: 17.04.2012 13:25

Цитата:
Сначала читать, думать, потом задавать конкретные вопросы по прочитанному.

Можно сформулировать требуемое еще и так:
- определить для себя темы, с которыми надо разобраться
- разобраться что из этого тебе уже известно, а что нет
- составить перечень вопросов, на которые надо найти ответы
- хорошенько пошарить в Сети в поисках ответов (литература, статьи, целевые форумы по данной проблеме, где на искомые вопросы уже давно сформулированы ответы)
- когда и если по какому-то вопросу нигде ничего нет и/или он сугубо практический, тогда уже появляться в соответствующей ветке соответствующего форума и разбираться именно с ним.

В общем классики решения рабочей задачи.

Автор: Uranum
Дата сообщения: 17.04.2012 19:38
Доброе время суток! Возможно я непрофесионально обрисую проблему, но суть вот в чём: сканирую в пдф формат методичку по деталям машин. Сохраняет он его как фото, т.есть видны повреждения в в виде всяких складок, замятин, теней, пятен и т.д. Весь брак переносится в копию. Как неастроить так, что-б передавало только суть. Строго прямоугольная форма листа а в ней данные(формулы, текст, схемы и т.д.) Спасибо.
Автор: sancher
Дата сообщения: 25.04.2012 12:49
Вопрос знатокам файнридера
Распознаю pdf-файл размером около 150 Мб (электронная книга)
После распознавания (которое длилось часа 4 на двухядерном Core i3 c 4Гб оперативки в 4 потока и сохранения, файл стал занимать один Гб )
Так и не понял почему
Раньше такого не замечал (файл увеличивался незначительно)
Ах да, использовал AFR_11.0.102.536_portable
Автор: Astra55
Дата сообщения: 25.04.2012 13:25
sancher

Цитата:
файл стал занимать один Гб

В каком формате, тоже pdf? Исходный файл приватный или есть в Инете?
Автор: sancher
Дата сообщения: 25.04.2012 13:42
Astra55
спасибо за очередное внимание к моим вопросам
файл сохранил тоже в pdf
файл приватный
сейчас попробую повторить в FR_CE11.583
если останутся проблемы, напишу в личку


Автор: Archisai
Дата сообщения: 25.04.2012 14:29
Может кто поможет справиться с проблемой?
Использую FineReader 11 Corporate, внезапно в окне редактирования начала происходить такая непонятная ересь: курсор стоит строго на знаке, не справа от него не слева, а заменяет именно какую-то букву, не давая дополнить слово, заменяет собой последующие знаки. Очень неудобно, можно ли как-то справиться с этой проблемой? Переустановка и перезагрузка не помогли
Автор: sancher
Дата сообщения: 25.04.2012 21:57
Перераспознал свой файл размером 150 мегабайт
По времени получилось примерно то же: часа 4 распознавал, ещё час-полтора сохранял
Но вот размер уменьшился, он стал весить 110 мегабайт, что и требовалось
Похоже с AFR_11.0.102.536_portable был какой-то глюк
Единственное, что я не указал: в тот раз я сохранил не в чистый PDF, а
в PDF/A. Но по-моему это не могло дать такого значительного увеличения размера файла
Автор: Astra55
Дата сообщения: 26.04.2012 07:47
sancher

Цитата:
сохранил не в чистый PDF, а в PDF/A. Но по-моему это не могло дать такого значительного увеличения размера файла

Могло и дало PDF/A обычными людьми не используется, а для сканов ваще не имеет смысла.
Автор: sancher
Дата сообщения: 26.04.2012 09:09
Astra55
я расстроен )
мой ноут напряжённо пропахал 5 часов впустую )
я думал, что PDF/A поновее PDF, и что он мало чем отличается
а вот и нет
"Так как документ формата PDF/A должен включать все шрифты, которые он использует, файл PDF/A часто будет большего размера, чем его PDF-эквивалент, не содержащий внедренные шрифты."
в топку его ))
Автор: Denni
Дата сообщения: 26.04.2012 11:56
Возможно я что-то не допонял или делаю не так, но у меня такое ощущение что в FR_9 нельзя сохранить распознанный текст с правками в формате самого FR. При загрузке ранее сохраненного FR принялся заново анализировать и распозновать уже наполовину вычитанную книгу. Т.е. вся предыдущая работа по вычитке была проигнорирована и все пришлось делать с начала =(
Автор: Shangry
Дата сообщения: 27.04.2012 15:54
sancher

Цитата:
я думал, что PDF/A поновее PDF, и что он мало чем отличается

Основное отличие здесь в том, что PDF/A полностью самодостаточен и в отличие от обычного PDF, не пользуется шрифтами из текущего компа.
Само по себе это такого прыжка в размере давать не должно - не с чего лишнему объему браться. Так что смотрите настройки сохранения этого формата, причина д.б. там.


Добавлено:
Denni

Цитата:
Возможно я что-то не допонял или делаю не так, но у меня такое ощущение что в FR_9 нельзя сохранить распознанный текст с правками в формате самого FR

Что есть "формат самого FR"?
Если речь идет о пакете, то он вполне сохраняем, в менюшке "Файл" для этого есть пункт. Результаты рабочего процесса тоже сохраняемы - для этого даже никаких дполнительных усилий прикладывать, все само собой делается.
Автор: vat3000
Дата сообщения: 17.05.2012 15:41

Цитата:
Добрый вечер!
Такая ошибка на 7 x64
ABBYY FineReader 11.0.102.583 Professional
Сигнатура проблемы:
Имя события проблемы: APPCRASH
Имя приложения: FineExec.exe
Версия приложения: 11.0.102.583
Отметка времени приложения: 4f174de7
Имя модуля с ошибкой: DL91CoolType.dll
Версия модуля с ошибкой: 9.1.0.20
Отметка времени модуля с ошибкой: 4e8f1895
Код исключения: c0000005
Смещение исключения: 0008cd97
Версия ОС: 6.1.7601.2.1.0.256.1
Код языка: 1049
Дополнительные сведения 1: 0a9e
Дополнительные сведения 2: 0a9e372d3b4ad19135b953a78882e789
Дополнительные сведения 3: 0a9e
Дополнительные сведения 4: 0a9e372d3b4ad19135b953a78882e789


Цитата:
Удалён ответ на вопрос DIMKA12 из-за дубляжа вопроса в варезнике.

Можно ссылку на ответ, а то не могу найти!!! Очень надо, уже третий день мучаюсь с такой же проблемой
Автор: gdaylight
Дата сообщения: 20.05.2012 17:52
Вышла новая система оптического распознавания текста SunnyPage v1.0
www.sunnypage.ge/ru
Автор: Astra55
Дата сообщения: 20.05.2012 18:51
gdaylight
А каким боком эта кривая грузинская поделка касается ABBYY FineReader? Юзает фреймворк 3, в дистрибутиве отсутствует VC++, но даже после инсталляции всего необходимого, так и не может ничего распознать, просто падает с какой-то ошибкой и на этом процесс заканчивается. Фтопку! И софт, и афтаров с этим глюкодромом!
Автор: Skillachi
Дата сообщения: 22.05.2012 06:20
Други, подскажите как настроить в Fine Reader v.11 пакетное сканирование документов в PDF-формат с минимальным размером файла на выходе (чтобы нажав один-два клика, получить сжатый PDF на выходе) ???
Автор: bolvanchik
Дата сообщения: 22.05.2012 20:41
Astra55

добавлю.

негоже программе OCR иметь такие казусы
Автор: oshizelly
Дата сообщения: 23.05.2012 21:04
В порядке эксперимента взял 1-страничный документ PDF, распознанный и сохраненный из FineReader 8.0, и открыв его в Acrobat Professional 8.1, запустил встроенный инструмент распознавания. Ожидал, что при этом текстовый слой, добавленный в FineReader, будет заменён новым. Вместо этого получил совершенно неожиданный результат: размер файла увеличился примерно вдвое (с 50 до 100 Kb), а изображение стало двоиться, как в бинокле при неправильном наведении на резкость. Попробовал то же самое ещё на нескольких файлах - результат повторился.

Кто-нибудь может объяснить механизм этого явления?
Спасибо!


Автор: Astra55
Дата сообщения: 23.05.2012 21:25
oshizelly
Если Вы когда-нибудь доживете до персонального татла, очень советую взять себе такое богатое слово, как Деструктор У Вас ко всем программам, судя по задаваемым вопросам, совершенно деструктивный подход. Делаете заведомо бессмысленные действия и потом задаете совершенно бессмысленные вопросы. Зачем в документе два текстово-графических слоя и из двух разных программ??? Ну вот объясните мне, что Вы хотели добиться своими действиями и каких объяснений ожидаете, учитывая, что к теме топика это не имеет ни малейшего отношения.
Автор: oshizelly
Дата сообщения: 23.05.2012 21:56
Astra55 21:25 23-05-2012
Цитата:
У Вас ко всем программам, судя по задаваемым вопросам, совершенно деструктивный подход. Делаете заведомо бессмысленные действия и потом задаете совершенно бессмысленные вопросы... Ну вот объясните мне, что Вы хотели добиться своими действиями и каких объяснений ожидаете

Объясняю. Некоторый намёк на ответ уже содержался в моем предыдущем посте: "в порядке эксперимента"... То есть, это не совсем деструктивный подход, а любознательность, которая вообще-то по природе своей тоже деструктивна, но это как бы обычно считается простительным. Типа, если вот этой загогулиной подцепить вот эту штуковину, то что из этого получится? Если бы наши предки не совершали подобных "бессмысленных действий", то мы бы до сих пор сидели в темных пещерах. И, может, это было бы не так уж и плохо


Цитата:
Зачем в документе два текстово-графических слоя и из двух разных программ???

Собс-но, как раз про это я и спрашивал: почему в результате описанных мной выше бессмысленных действий возникает два текстовых слоя, хотя логично было бы ожидать, что Acrobat PDF просто заменит ранее созданный текстовый слой своим.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.