Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: smersh2012
Дата сообщения: 10.09.2013 07:29
Valeriy2008
че за помои ты тут на наши уши и глаза вываливаешь ... про своих цыган, детский горшок и синтезатор .. в личке друг другу пишите, хоть убейтесь
Автор: Valeriy2008
Дата сообщения: 10.09.2013 10:35
Навсегда Продвинутому СМЕРШу

Я и не надеялся, что Продвинутые и Задвинутые меня поймут и увидят среди горшков и цыган СУТЬ ДЕЛА. Не каждому это дано.
Я готов извиниться ещё раз, что писал без требуемого гламура.
I,m sorry, please !

ALEX666999, прошу, ответь, дорогой, на мои вопросы и я покидаю эту ветку
Здесь хорошо обучены лаять, но ответы на вопросы давать не умеют!
Автор: ALEX666999
Дата сообщения: 10.09.2013 13:52
Valeriy2008
Про ядра: поддержка многоядерников добавлена только в 9-ке.
Короче говоря, будет работать медленнее. Не на таких операциях, как запуск/выход, а там,
где идёт нагрузка на ЦП, то есть распознавание и, возможно, сохранение большого объёма материала.

Цитата:
что такое "затестил на XPVLKSP2 x86"

«Volume License Key VLK Volume License Key. A single license key which can be used on a number of computers to install a given product.» SP2 = Service Pack 2, x86 = 32 бит, x64 = 64 бит.
Короче на твоей стороне глюк. У меня была чистая винда, там только если отсутствует msxml6_x86.msi
при запуске выдаётся ошибка. Но этот компонент должен ставиться при инсталляции всего пакета FR.
Автор: Valeriy2008
Дата сообщения: 10.09.2013 22:33
ALEX666999
"...поддержка многоядерников добавлена только в 9-ке"

А в 10-ке, в 11 что, тоже не поддерживается?
И 9, и 10 перелопатил многоверсий, все они ставились без проблем, но ошибок было...

"...У меня была чистая винда, там только если отсутствует msxml6_x86.msi
при запуске выдаётся ошибка. Но этот компонент должен ставиться при инсталляции всего пакета FR."

Так значит, нужно на другом диске посадить чистую винду XP SP3 и только
то добавить, что нужно для работы F_R !!!
Ну конечно и Офисный Ворд, а также ABBYY PDF Transformer 3.0, и A-PDF Scan Optimizer portable.
Так этот вариант мне вполне подходит! Да, ещё Universal Document Converter и всякие читалки.
Тогда скажи, У меня Ворд офисный 2003, а от Офиса 10-го будет работать с хрюшей SP3?
А то старый Ворд 2003 часто виснет без причины?

"...при инсталляции всего пакета FR."

А где ж его взять, пакет? В сети только один эксюшник!
Или я что-то не понял опять?
Автор: ALEX666999
Дата сообщения: 10.09.2013 22:43

Цитата:
А в 10-ке, в 11 что, тоже не поддерживается?

Не исключительно в 9-ке, а начиная с 9-ки.
Думаю, это вполне было понятно.

Цитата:
Так значит, нужно на другом диске посадить чистую винду XP SP3 и только

Повторяю: на такой же винде, как у тебя, FineReader работает нормально.
А ковырять ли свою винду на предмет конфликтов или пробовать ставить SP3 - дело хозяйское.

Цитата:
а от Офиса 10-го будет работать с хрюшей SP3?

Без понятия.

Цитата:
А где ж его взять, пакет?

http://fr7.abbyy.com/fr11/ABBYY_FineReader_11_PE_Trial.exe
http://fr7.abbyy.com/fr11/ABBYY_FineReader_11_CE.exe

«Вопросы по доставанию и лечению - в Варезнике»
Автор: Valeriy2008
Дата сообщения: 11.09.2013 17:12
ALEX666999

Благодарю Вас за совет.
Теперь он исчерпывающий для меня.
Всего доброго.
Автор: Shangry
Дата сообщения: 16.09.2013 12:18
За потоком бурных эмоций с обеих сторон как-то почти прошло мимо, что у Valeriy2008
исходная проблема была не с инсталлированным вариантом FineReader, а с portable. А это все-таки две большие разницы.

Если все еще обсуждается именно этот затык, то для разбирательства с ним нужно:
- точное название portable-сборки;
- в меру полное описание возникших при работе проблем. Пока удалось понять только то, что с этой сборкой "облом".

От себя могу сказать, что пользовался и инсталлированными вариантами, и portable, как на XP SP2, так и на SP3. Чего-либо фатального и совершенно не дающего работать с FineReader пока не замечалось.
Автор: Astra55
Дата сообщения: 16.09.2013 13:44
Shangry
Проблем у него не одна, а целая куча. От словесного недержания до мозаичного мЫшления. Не надо тревожить эту "кучу", а то опять весь топик будет загажен бессвязным флудом.
Автор: Shangry
Дата сообщения: 16.09.2013 14:16
Astra55
Тоже верно.
Но если он еще со своей проблемой не разобрался, то решается это IMHO достаточно быстро и в минимум словесности. После чего ситуация закроется окончательно, а это здесь все-таки наиболее оптимальный вариант.
Автор: Userrr
Дата сообщения: 19.10.2013 07:30
как добиться подобного эффекта как у My Scans жёлтый фон страницы делает белым


или это настройки TWAIN, и FineReader ни при чём (есть что-нибудь похожее для Windows?)

Добавлено:
задача - распечатать сфотографированную страницу, не распознавая, на белый лист
Автор: Maikl65
Дата сообщения: 19.10.2013 08:09
Userrr

Цитата:
как добиться подобного эффекта

Если требуется только черно-белое изображение, то перед сканированием в настройках FineReader достаточно включить опцию "приводить цветное/серое изображение к черно-белому" - тогда любой фон (не только желтый) исчезнет. Правда рисунки и фотографии, если они есть, превратятся в подобие гравюр.
Ну а если используется FineReader 11, то там есть встроенный редактор изображений, который позволит за счет изменения яркости/контрастности/уровней убрать желтизну фона даже с цветных изображений.
Автор: Userrr
Дата сообщения: 19.10.2013 08:27
Maikl65 09:09 19-10-2013
Цитата:
перед сканированием

я не сканировал, уже готовые фотографии документов, надо распечатать, хотел бы запихнуть в сабж сотню фоток, а он вывел бы мне их на печать, в 'чистом' виде (жутко много расходуется тонера в принтере)
Автор: Shangry
Дата сообщения: 21.10.2013 11:06
Userrr

Цитата:
задача - распечатать сфотографированную страницу, не распознавая, на белый лист

Если не надо распознавать, то нет и необходимости печатать именно через FineReader.
А если просто распечатать, убрав при этом фон, то такое умеет делать делать любой граф. редактор. Хоть через бинаризацию, хоть через снижение уровня яркости фона до почти невидимого.
Автор: Maikl65
Дата сообщения: 21.10.2013 12:04
Userrr

Цитата:
я не сканировал, уже готовые фотографии документов, надо распечатать, хотел бы запихнуть в сабж сотню фоток, а он вывел бы мне их на печать, в 'чистом' виде (жутко много расходуется тонера в принтере)

Тогда вместо сканирования надо использовать пункт "Открыть изображение" , в диалоговом окне выбрать все нужные файлы изображений и загрузить в программу (вроде можно до 999 изображений за раз). При опциях для преобразования к ч/б изображению из моего предыдущего поста произойдет очистка от фона точно так же, как если бы изображения сканировались.
Автор: inapht
Дата сообщения: 31.10.2013 21:44
Какая последняя версия, которая без проблем распознает текст?
До смешного доходит, не может распознать почти идеальные для распознавания скриншоты с основным шрифтом винды. То слова как картинку определяет, разбивка на области, то делает ошибки на ровном месте.
Автор: ALEX666999
Дата сообщения: 01.11.2013 06:44
inapht
9-ка и 11-я одинаково, по мне. 11-я просто жрёт больше ресурсов, и так, вроде,
и не исправили появившееся в 10-ке замедление сохранения группы результатов распознавания.
Ну хоть косяк с буфером обмена в SR пофикшен + субъективно стабильней рабтать стало, и то ладно.

Насчёт разбивки на области — это же машина. У меня тоже бывает, что текст,
вполне себе читабельный человеком, помечается как изображение.
Автор: Shangry
Дата сообщения: 01.11.2013 10:59
inapht

Цитата:
... не может распознать почти идеальные для распознавания скриншоты с основным шрифтом винды.

Дык, скриншоты же. С ними при распознавании всегда головная боль.
Разрешение 72 точки, фон - сплошные цветные заливки (вместо обычного нейтрально-незаметного). Вот и проблемы вроде бы на пустом месте.
У меня даже, когда они из книжных иллюстраций (с разрешением все нормально) и то сплошь да рядом ошибки разметки сыплются - хоть какую версию ставь.
Автор: inapht
Дата сообщения: 01.11.2013 12:30
Shangry

Цитата:
Дык, скриншоты же. С ними при распознавании всегда головная боль.
Разрешение 72 точки, фон - сплошные цветные заливки (вместо обычного нейтрально-незаметного). Вот и проблемы вроде бы на пустом месте.


Фон как раз нейтральный, это скрины удаленных столов. Почему-то в AFR 11 pro, процент правильно распознанных файлов больше, когда отключена предобработка и включен режим быстрого распознавания вместо тщательного. Вот пример, где текст в центре распознается как картинка:

У этой в любом случае не распознает как текст - имя пользователя Logged on.
Автор: ComboFZ
Дата сообщения: 01.11.2013 15:39
inapht
Что касается снимка Рабочего стола приведенного вами.
ABBYY ScreenReader 8.1126 распознал всё и без ошибок.
ABBYY FineReader 8.1126 распознал всё с двумя ошибками в слове Business
ABBYY FineReader 11.0.110.122 CE + Screenshot Reader, в данном случае, уступает восьмёрке.
Автор: antz13
Дата сообщения: 01.11.2013 17:13
FR 11 и SR 11 распознал все без ошибок
Автор: Maikl65
Дата сообщения: 01.11.2013 17:46

Цитата:
Какая последняя версия, которая без проблем распознает текст?

Последняя версия ABBYY FineReader, в которой качество распознавания обеспечивалось именно за счет фирменной "фонтанной" технологии от ABBYY была 8.1126.
В дальнейших же версиях процесс повышения качества распознавания стали проводить за счет анализа строки уже распознанного текста и частичной автоматической замены неправильно распознанных слов на слова из постоянно увеличивающегося словаря (как это делают орфографические модули программ, предлагая заменить неправильно набранный текст).
Именно поэтому качество распознавания различных текстов на разных версиях OCR варьирует очень сильно - для текстов со стандартным набором типовых слов и фраз даже при невысоком качестве картинки лидируют новые версии программы, а вот на сложных специализированных текстах с большим количеством слов, отсутствующих в словаре (или на коротких текстах, где недостаточно информации для семантического анализа) лидирует 8.1126.
Автор: VitRom
Дата сообщения: 01.11.2013 20:04
Однако ЕМНИП для желающих работать с иероглифами особого выбора нет: часть языков поддержана только начиная с 10 и ещё часть только с 11. Поправьте, если не прав (или появился способ подключения языков и словарей из 11 в 8).
Автор: o4frb
Дата сообщения: 01.11.2013 21:07
ABBYY забила на FineReader? 11 версии уже 2 года как.
Автор: inapht
Дата сообщения: 01.11.2013 23:03
В интернете нагуглил мнение, что для массового распознавания, как раз мой случай, лучше подходит версия 7.0. Придется пробовать разные версии.
Автор: ALEX666999
Дата сообщения: 01.11.2013 23:22
Maikl65
У меня как раз упомянутый билд «чудил»: вроде махом обработал,
а потом смотришь текст — вместо «рыба» — «селёдка», то есть совершенно «левое» слово.

Цитата:
VitRom: Поправьте, если не прав

В 9-ке китайский/японский, 10-ке — корейский, 11-й — арабский, навскидку.
Насчёт подключения языков ничего не слышал.

o4frb
В качестве развития — хз, но обновлённые билды клепают.
Последний — за 7 месяц этого года.

Цитата:
inapht: лучше подходит версия 7.0

Можно, конечно, затестить, чем чёрт не шутит.
Только если машина с несколькоядерным процем, процесс будет идти медленней,
так их как поддержку добавили только начиная с 9-ки.
Ну и к гугломнениям нужно с отсторожностью относиться, там, чтобы по их тубобитовой
ссылке скачали и не такое понапишут...
Автор: Dunkeshu
Дата сообщения: 02.11.2013 21:49

Цитата:
ABBYY забила на FineReader? 11 версии уже 2 года как
Не забила, так как даже на 9-й Sprint выпустила обновление, от 25 апреля 2013, а ему уже 4 года как

Программа обновлений для ABBYY Finereader 9 Sprint содержит следующие изменения:
Обновлены технологии распознавания;
-Исправлена проблема совместимости 32битных ОС Windows с MS Office 2010 и 2013;
-Исправлена ошибка в определении ориентации страницы для документов с выбранными языками распознавания "английский, китайский";
-Исправлена ошибка, возникающая при сканировании в серый цвет (greyscale).
Автор: Uraanfgh56
Дата сообщения: 09.11.2013 15:21
Доброго.

1).Как научить распознавать рукописный текст ?
2).Как игнорировать распознование круглый печатей т.е мне не нужно чтобы печать распозновалась , а нужно чтобы вставлялась на том же самом месте как картинка - круглая печать.

также интересует как сделать так чтобы при распозновании некоторые области оставились как есть - без распознавания ?

3). Можно ли научить программу не распозновать всякие чёрточки, галки и т.п артефакты на изображении (особенно это касается ксерокопии) , т.е грубо говоря игнорировать и не включать в распознанный текст ?
Автор: Shangry
Дата сообщения: 11.11.2013 10:22
Uraanfgh56

Цитата:
1).Как научить распознавать рукописный текст ?

На данный момент - никак. И вряд ли здесь что-то изменится в ближайшие лет 10.

Единственное, что хоть как-то может быть пропущено через обучение - рукопись с хорошим каллиграфическим почерком, где буквы прорисованы более или менее одинаково и не сливаются друг с другом, а идут каждая в отдельности. Плюс строчки д.б. ровные, без изгибов и перекосов.


Цитата:
2).Как игнорировать распознование круглый печатей т.е мне не нужно чтобы печать распозновалась , а нужно чтобы вставлялась на том же самом месте как картинка - круглая печать.

Только ручная переразметка блоков после разметки автоматической.


Цитата:
3). Можно ли научить программу не распозновать всякие чёрточки, галки и т.п артефакты на изображении (особенно это касается ксерокопии) , т.е грубо говоря игнорировать и не включать в распознанный текст ?

Опять же только ручная переразметка.
Автор: sti2008
Дата сообщения: 14.11.2013 15:33
Здравствуйте! У меня такой вопрос:
после распознавания в FineReader и передачи текста в MS Word неуверенно распознанные символы отображаются голубым цветом. А вот как снять этот голубой цвет в MS Word не знаю. Прошу помощи форумчан.
Автор: smersh2012
Дата сообщения: 14.11.2013 16:13
sti2008
выдели текст и жми эту кнопку - очистить форматирование

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.