Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: ComboFZ
Дата сообщения: 21.07.2010 03:15
XATAXAMA

Цитата:
Это начиная с какой-то версии, или во всех?

ABBYY FineReader 9.0/10.0 Professional и Corporate Edition, в версиях ниже не знаю.
Автор: Shangry
Дата сообщения: 21.07.2010 15:13
XATAXAMA

Цитата:
*Проблема* - FineReader создаёт огромное количество стилей (уже до тысячи дошло), а я хочу использовать свои названия, чтобы работала структура документа. Сейчас приходится для каждого абзаца переназначать и перенастраивать стиль в Word, это огромное количество ручной работы.

Головная боль, которая как есть IMHO решения не имеет. Из всего, что я перебрал, наименее трудоемкий вариант это снести полностью всю свалку стилей от FineReader и расставить везде свои собственные.
Тем более, что такое количество различных стилей (до тысячи) нигде, никому и никогда для работы не требуется.

ComboFZ

Цитата:
В FR есть простой редактор стилей: меню Сервис > Редактор стилей…, в нём можно только изменять, просматривать, создавать или удалять стиль(ли)

Кошкины слезы это, а не "Редактор стилей". Прикиньте сколько переменных стиля регулируется в том же Word и сколько имеется здесь.
Автор: ComboFZ
Дата сообщения: 22.07.2010 08:29
Shangry
WORDу - WORDово...

Автор: Shangry
Дата сообщения: 22.07.2010 14:13
ComboFZ

Цитата:
WORDу - WORDово...

Если бы...
Система стилей FineReader все эти переменные использует в полном объеме. Причем иногда такой винегрет умудряется сотворить одновременной перенастройкой десятка с хвостиком переменных, что сидишь и в голове чешешь - как бы эту ахинею во что-то нормальное превратить.
Автор: XATAXAMA
Дата сообщения: 23.07.2010 01:18
Shangry

Цитата:
Головная боль, которая как есть IMHO решения не имеет. Из всего, что я перебрал, наименее трудоемкий вариант это снести полностью всю свалку стилей от FineReader и расставить везде свои собственные.

Это было реально осуществлено? Снос свалки и т.д. В какой версии, каким способом?
Если нет, то, заранее извиняясь за крамолу и
Кто-нибудь знает другие OCR продукты, которые можно заставить присваивать распознанному тексту пользовательские стили?


Добавлено:
ComboFZ

Цитата:
Цитата:
Это начиная с какой-то версии, или во всех?
ABBYY FineReader 9.0/10.0 Professional и Corporate Edition, в версия ниже не знаю.

Спасибо, поставил 10-ку, что-то такое вижу, появилась надежда...
Автор: U235
Дата сообщения: 23.07.2010 01:32
XATAXAMA

Цитата:
Кто-нибудь знает другие OCR продукты, которые можно заставить присваивать распознанному тексту пользовательские стили?

MS Word + VBA можно попробовать для для работы с зоопарком стилей.
Автор: Shangry
Дата сообщения: 23.07.2010 14:55
XATAXAMA

Цитата:
Это было реально осуществлено? Снос свалки и т.д. В какой версии, каким способом?

Берем Word, открываем в нем продукт работы FineReader, подбираем необходимые настройки стиля "Основной" (или как он у вас называется), накладываем этот стиль на весь документ, для надежности прибиваем свалку стилей доставшуюся от распознавания, делаем стили необходимого вида для структурных элементов текста (заголовки, цитаты, подписи под рисунками и т.д.), форматируем ими в нужных местах.

Геморрой конечно изрядный, но другие варианты съедают еще больше времени и сил.
Автор: boy999
Дата сообщения: 28.07.2010 17:03
Ставить и осваивать сабж ради 3х страничек - считаю чрезмерным.
Надо перегнать в текст 3 странички из хэлпа в виде фоток.
http://sderni.ru/12918

ПЛЗ!
Автор: ALEX666999
Дата сообщения: 28.07.2010 17:29
boy999
[more=страница-1]Armour все виды защитны* подпрограмм
UtiJuy глужрйн^ frrjflfipofpcjMMKi Power Hltii;k IiutiiqtiluUi, У Amp
СВЕТОЦИКЛЫ
(ОДИНОЧНАЯ 1Л СЕТЕВАЯ ИГРА)
Саетоциклы: одиночная игра
Д'к-iytit- ри*имуоди ничнои игры iiscaaio
НИКЛИ* НШОДИТСЯ В М&ОД
Single Ptoyer Именно здесь иачнагси наша борьба за гитулч&мпио ни *Итровой решагки" Г>рпн одиночной игры Р»лдолрн ни четыре за к/мдки Circuit Play, [_ф{ C/fJp.Gj'.tfjmPlay и Custom Settings
Закладка Circuit Play (гонки-заезды)
- 6 эгам режиме вам предсюя! победить а 16 зааздах, чтобы отхры'ь доступ к саатоциклам и гиперциклам на болт высот* уровнях
• В^овигре'шыреэоны.кв^деяетсгаиг из трех карт
- Каждый заезд включает два пять раундов (волн) на одной "решетке*. Благодаря различи** в параметрах гяждыи заезд уникален (число участников, типы сеет циклов и уровень мастерства соперников, общая строен, т ры, длина знаргети -чешзго следа. wwv&rBQ жизней, резные виды боиусда и препятствий!
' К участию е реэмш заездах допускаются различные гиоы еввтоциклов Вы мо жеге выбрать любой звезд, какой пожелаете {при условии, что к участию а нем допущен ваш светоцикл}. Если «акрй-лиОо звезд оказался слишком сложный, еы можете перейти к следующему Зв победу в двух заездах вы получаете новый свегацйкя По мере того к» расширяется ваш парк еввтоциклов, вы сможете ^вствоввть в новых заездах, опертая умения и выигрывая более мощные г/ д^саегодиклов
■ После победы в звезде, где впервые появился новый бонус он станет доступным
е режиме лольэоввгелкжой игры ' 0 закледка Oraat Яву неводятся обучающэя мисс*ад и список яэстулнь» зааздоа
р"--'озйденнж заезды выделены серый, непрощенные - синим цветом Чтобы .■• -мъ учкт с выбранном звезде, нажмите толк у (Л** if f 1 Of'Jrt.[/more] | [more=страница-2]Пользовательский ражий игры
Если вы благополучна лроц*ли зону &#9632; рышме оСм>«< , зоны сп»<ут доступны** &#9632; по/ъз<жагвльсвдй «рв Г)и:, -
вкладка Custom Settings
ю неограничен** чцсю MttdwZ?
яяощии акранять сделанные аами и 1
Hanpotout полмомтвяьского режиме игры
• Мм Oppenente - 1Дб«&#163;нмальнг#е 4исло соперников 1 &#9632; Opponent ШкШ девнь умений соперников: Meed [ем- ...,., чек! Normal (обычный), AoVanced (бывалый) или Expert [эьсаерт| Смешвим уреввнь означает. *ло игра выберет уровень /пении каждого из соперник.
Opponent Cycle Туре гип машин ваших соперников; Standard Cyt*f еает&#163;***л4 Super Cycle (суперделы) или Mixed (смешенный} г 0*гаг Speed - (жороегь игры, это эи»*ение одинаково для вес и ья^, /
f о-чвнь едасевзя}
. Ми МГ Unatfe -максимальная длине *-ejww>rc к*/ п*.т»...л га Доступмввриаипс Short fcopoiv/ Ыгет*. (очень деминый} &#9632; -;д§ша*1 можете *1Швллш^ : подраздел "Бон^оЛ
Бонусы
.;Свегацикяа





- лайм
а
с &#9633; &#9633;
(>; ..котороевремя Ум*
Ззквэт кредо? бо^С у 6лилшиш& G 1. м#ле н&1 Сонмов, он берет бпихлйо
Force U— inf*Wf*iit**vo)
Trwl EjOerid«r :,b . .
V- Лрвпитсткия
-,/- т*. ыпшшщ щиом абоэмв^
- - ^ t,ttevc mow[/more] | [more=страница-3]ШшШШШ
11 f m ИИ
яри»
-Qmiltat-WKI - ЩкщЩЩ
- ЙЙЦ^"' шТ ЩЯ Ш**"Т* if д ГО i rnnj Ш| ' ЩMowsi Lawyer Ssnrj- jjw I ищи
р**1ИН
-
&#9632;n—яги nщщ Пттц1\}Щ\\\щлщтшт*ш
aarifgiiOiimi шми^аиЦш it iimpw ци ми i &#9632; _ 11 -дэериае Нас рано? зе-зэа» «гэ* э ^^^^^^^^^^^^^^ |
Щ*твшшШ.Ц'г 11 мчнпдеЁввяанзш мшиасш pwjmu |«арооьиркммпи . Pjjiu|[f"rjirri 11тмдц1М1 жязгыялсвт, иб «ерексмэ-фш зэтгц-
^ДЖДЕВНЫЕ ПРОГРАММЫ
Intrusion Countsrmtosurs Programs (ICPs) {Сгооожовме программы - СП J
ругавшим* ояспмм* меда» тяюящют
finder (Поясковнч]
&#9632;s6WWfc»ciBB»(№iWM» woo 15 Яя мо^юСмстаю.
Thorot (Торн}
Наавреоим» трсцеос Осзифроаш привал < орьазиму. i <армд»«м>
* иржрдмме эта» тп&тъ/т. Корпомцж to отцариу** о" чу&
• шщрьИЬрн шшшиавт ««прыгнины мест Намин-юг,- лзт —ггщ-пч||1мгттоМ11|[|1М1И10 mini »ii»;hjmhihmsiiii.h щяжзрыткл, по они И1 (цмтмшУк>щвт
Z4ots (Z-aomJ В
&#9632; —й мшжяыс они дм act Уи|ч»саома»< ЗЯ
&#9632;НЦ Rector Scripts (йоаство^эфмигы]
&#9632; ги1М " гсбо*** щпт1 моим Таре» 1Ь **еъ т«в***
&#9632; В in 11ИМ11 ИИ JQJpjS«<l|OTI J' HI i HOI Ull ЦДИД II I МРМ,[/more]

Как видишь, результат неутешительный. Нужно лучше снимать...
(лапшу с ушей, которую ABBYY про цифровые снимки вешает)

На будущее: http://finereaderonline.ru
Автор: Shangry
Дата сообщения: 28.07.2010 17:46
boy999
В том виде, в котором это сделано, IMHO проще (и быстрее) набрать вручную, чем пытаться вычитать полученную абракадабру.

ALEX666999

Цитата:
Нужно лучше снимать... (лапшу с ушей, которую ABBYY про цифровые снимки вешает)

А что, существуют программы, которые способны выжать из этого кошмара ходячего заметно больше чем FineReader?

Изображения из разряда "посмотреть и выкинуть" (не удивлюсь если их на мобильнике снимали ).
Автор: ALEX666999
Дата сообщения: 28.07.2010 17:58

Цитата:
Shangry: А что, существуют программы, которые способны выжать из этого кошмара ходячего заметно больше чем FineReader?

Я о том, что они (пиарщики ABBYY) ещё с 8-й версии баснями про оптимизацию для изображений, сделанных с цифровых фотиков, кормят. А на практике, как вы говорите "посмотреть и выкинуть", не более...
Автор: Shangry
Дата сообщения: 28.07.2010 18:16
ALEX666999
"Оне преувеличивают, но не врут-с".
Попробуйте подсунуть это на вход кому угодно другому и я изрядно удивлюсь, если правильно распознается хотя бы четверть символов. А FineReader на первой, относительно сносной, страничке выдал процентов где-то 40 с хвостиком.

А то, что из изображений подобного качества в принципе нельзя получить ничего вменяемого, так это классика: "Мусор на входе - мусор на выходе". Если уж оценивать работу, то на чем-нибудь более съедобном.
Автор: JekaKot
Дата сообщения: 28.07.2010 19:22
boy999
Цитата:
Надо перегнать в текст 3 странички из хэлпа в виде фоток.
Да там и визуально фиг прочитаешь, а OCR и подавно не справится... Проще напечатать самому будет...

ALEX666999
Цитата:
Я о том, что они (пиарщики ABBYY) ещё с 8-й версии баснями про оптимизацию для изображений, сделанных с цифровых фотиков, кормят. А на практике, как вы говорите "посмотреть и выкинуть", не более...
Угу... Условия съемки должны очень хорошими и качество (четкость, тип бумаги) источника как минимум выше среднего. Если есть возможность - лучше сканировать (причем в серых тонах и с разрешением не менее 300 dpi) - тогда еще что-то можно "вменяемое" получить...

Из личного опыта - только простейший текст (научный, с формулами - можно тушить свет) на 10 MPx-камеру в светлом помещении и распознавать только 8-кой...

Shangry
Цитата:
А то, что из изображений подобного качества в принципе нельзя получить ничего вменяемого, так это классика: "Мусор на входе - мусор на выходе".
Всегда можно попробовать "подкорректировать" полученное в графических редакторах (от Paint до Photoshop) - но это еще тот геморрой...
Автор: U235
Дата сообщения: 28.07.2010 20:13
Shangry

Цитата:
не удивлюсь если их на мобильнике снимали ).

Nokia N73 если судить по по EXIF
Автор: boy999
Дата сообщения: 28.07.2010 23:11
ALEX666999

Увы и ах.....
Автор: Shangry
Дата сообщения: 29.07.2010 13:34
JekaKot
Может вы знаете, где можно разжиться образчиками книг, журналов и т.д., сделанных на ЦФК? Так чтобы на материалах различного рода, с отсъемкой разного качества (и хорошей, и не очень) - в общем представительная подборка для анапиза.

Давно хочется прикинуть конкретику - где и на чем валится фотосъемка, сравнительно со сканированием и сделать сопоставление. Но сам я фото не занимаюсь, поэтому рабочего материала почти что нет.


Цитата:
Всегда можно попробовать "подкорректировать" полученное в графических редакторах (от Paint до Photoshop) - но это еще тот геморрой...

Тогда уж стоит брать специализированный софт для зачистки подобных вывихов.
Хотя чем можно спасти представленные здесь сканы - это очень сильно пофантазировать надо.
Автор: paspas
Дата сообщения: 31.07.2010 16:32
Есть pdf файл на 10 страниц размером 300 кб.

Открываю его fineReader 9, он минут 10 полностью грузит компьютер.

Когда наконец, файл открыт - сохраняю Save as FineReader document. Размер 1 гб.


Что это такое и как с этим бороться?
При любом действии тормоза, естественно, такими размерами ворочать. Но откуда этот размер появляется?
Автор: ALEX666999
Дата сообщения: 31.07.2010 16:40

Цитата:
paspas: Но откуда этот размер появляется?

Залей куда-нибудь, проверим...
Скорей всего какой-то программный локальный глюк, не связанный с FR.

Добавлено:

Цитата:
Shangry: Хотя чем можно спасти представленные здесь сканы

Я и разворачивать пробовал и с контрастом играть, всё равно результат - Г...
Автор: paspas
Дата сообщения: 31.07.2010 16:47
Сам пдф файл - http://bkrs.info/tmp/61_yufa.pdf
Результат залить сейчас не получится.

Может его как-то проанализировать можно, что там место столько занимает?
Автор: ALEX666999
Дата сообщения: 31.07.2010 17:13

Цитата:
paspas: Результат залить сейчас не получится.

И не нужно.

Цитата:
paspas: Может его как-то проанализировать можно, что там место столько занимает?

Потому что изображение одной страницы 5100 x 7300, сохраняет в формат сжатия без потерь tif, одна страница выходит около 100 МБ, от этого и такой разбухший проект получается.
Автор: U235
Дата сообщения: 31.07.2010 17:34
ALEX666999

Цитата:
Потому что изображение одной страницы 5100 x 7300

А такие пиксельные размеры получаются из-за того, что физические размеры страницы в pdf 43x61 см.
Автор: paspas
Дата сообщения: 31.07.2010 19:08
Почему же тогда pdf такой небольшой? Где он эти пикселы хранит?


Но для распознования это, наверное, хорошо. Трогать не буду, пусть лучше компьютер поработает, чем я потом править буду.
Автор: U235
Дата сообщения: 31.07.2010 19:16

Цитата:
Почему же тогда pdf такой небольшой?

В pdf ч/б картинка вставлена с разрешением 96 dpi + G4 Fax сжатие.
Самое простое: извлекайте tiff из pdf и распознавайте.
Автор: AntonVII
Дата сообщения: 31.07.2010 21:31
Кто - нибудь знает, на windows7 можно поставить fine reader 10 с русским интерфейсом?
Автор: ALEX666999
Дата сообщения: 31.07.2010 21:36
AntonVII
Да : [more=>>требования к системе]
ПК с процессором семейств Intel® Core™/Pentium®/Celeron®/Xeon™, AMD K6/AMD Opteron/AMD Phenom/Turion™/Athlon™/Duron™/Sempron™ или совместимым с ними процессором, тактовая частота которого составляет не менее 1 ГГц, или более мощным.
Операционная система Microsoft® Windows® 7, Microsoft® Windows® Vista, Microsoft® Windows® Server 2008, Microsoft® Windows® Server 2003, Windows XP.
Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память - 512 Мб.
При работе в многопроцессорных системах требуется дополнительно 256 Мб оперативной памяти для каждого дополнительного процессора.
Свободное место на диске: 650 Мб для установки всех компонент программы, 650 Мб для работы программы.
Видеоплата и монитор с разрешением не менее 1024x768 точек.
Клавиатура, мышь или другое указательное устройство.
Замечание: Для того чтобы вы могли открывать файлы изображений или PDF-файлы непосредственно из Microsoft Word, Microsoft Excel и Microsoft Outlook на вашем компьютере должны быть установлены соответствующие приложения Microsoft Office.

[/more]
Автор: AntonVII
Дата сообщения: 31.07.2010 21:44
ну всё это есть, у меня на ХР стоял русский, на 7 уже где-то раз 5 ставил с разных установок(везде написано RUS), а он английский...
Автор: ALEX666999
Дата сообщения: 31.07.2010 22:45

Цитата:
AntonVII: а он английский...

Нажать CTRL+SHIFT+O, последняя вкладка справа, "Advanced" (вроде так на английском), в центре экрана, в выпадающем меню, будет выбор языка интерфейса программы "Interface Language" (вроде так на английском), выберешь там Русский (Russian). Дерзай!
p.s. это по идее можно сделать правкой реестра, но мне копаться лень : )

Добавлено:
Да, и может понадобиться перезапуск программы после этой манипуляции.
А почему FR на английском запускается, предположу, что это из-за 7-ки: она у тебя либо на английском, либо с MUI.
Автор: AntonVII
Дата сообщения: 31.07.2010 23:24
Помогло!!! Спасибо. А всё так просто оказалось. Ну вот откуда я мог это знать!!?
Автор: cuneiform
Дата сообщения: 03.08.2010 11:01
Ребята, помогите плиз посрочнее как можно: отсканировал работу, распознал, надо сдавать, а портабельная версия 10-ки не сохраняет в форматах ворда --

Internal program error: .\Src\WordExporter\RtfWriter.cpp, 101.

Не могу вывести работу... Спасиб!

Знаю, есть специфика работы с портабельными версиями, особенно при сохранении, читал, но не могу вспомнить.
Автор: Shangry
Дата сообщения: 03.08.2010 16:12
IMHO будет быстрее поставить обычный вариант, чем искать причину сбоев в неизвестно как и неизвестно из чего сделанном portable.


Цитата:
Знаю, есть специфика работы с портабельными версиями,

Один из существенных моментов запуска portable-софта - нежелательно, чтобы на компе до этого стояло что-то, родственное запускаемой программе.
Так что попробуйте сделать сохранение на другом компе.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.