Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: andrex
Дата сообщения: 06.09.2003 02:50
Vjaces



Официально преобрести всегда проще, но ты посчитай на своем компе сколько у тебя жизненноважных программ и сколько они стоят! Тут на тысячи долларов речь пойдет... Если для тебя это не деньги, то даже и не думай - покупай официально!!!
Автор: trie
Дата сообщения: 07.09.2003 18:43
TO RSV

После сканирования зайдите в папку FR (Batches по умолчанию) с отсканированными файлами и конвертируйте их в формат tif CCITT G4. Дело в том, что FR делает двухстраничные файлы tif, они больше по размеру. В IrfanView эта операция называется "Пакетное преобразование/переименование" и находится в меню "Файл". После конвертации в tif CCITT G4 нужно откорректировать полученные изображения, удобнее всего это делать таким образом - откройте первый файл в IrfanView, выделите мышкой нужную часть изображения, чтобы вырезать грязь и лишние поля, нажмите Ctrl+Y, затем клавишу S, укажите имя файла и папку, куда будут сохранены файлы, нажмите Enter, а затем Space, чтобы перейти к следующему файлу. Нудно? Долго? Неудобно? Да, все это имеет место быть!

Более подробно описана твоя проблема здесь:
hттp://hamradio.online.ru/m2_solo.htm

Добавлено
TO RSV

После сканирования зайдите в папку FR (Batches по умолчанию) с отсканированными файлами и конвертируйте их в формат tif CCITT G4. Дело в том, что FR делает двухстраничные файлы tif, они больше по размеру. В IrfanView эта операция называется "Пакетное преобразование/переименование" и находится в меню "Файл". После конвертации в tif CCITT G4 нужно откорректировать полученные изображения, удобнее всего это делать таким образом - откройте первый файл в IrfanView, выделите мышкой нужную часть изображения, чтобы вырезать грязь и лишние поля, нажмите Ctrl+Y, затем клавишу S, укажите имя файла и папку, куда будут сохранены файлы, нажмите Enter, а затем Space, чтобы перейти к следующему файлу. Нудно? Долго? Неудобно? Да, все это имеет место быть!

Более подробно тут о твоей проблеме:
hттp://hamradio.online.ru/m2_solo.htm
Автор: Uncle KILLER
Дата сообщения: 19.09.2003 16:23
Запостю здесь, дабы не разводить... При сохранении распознанного русского текста в FR 7 Pro получаются не буквы, а квадратики, причём от выбранного формата сохранения ничего не зависит - Word, Excel, файл - чёрные квадратики... Дошло до переустановки Виндов - то же самое... В чём траблы? У кого-нибудь похожее было?

PS При сохранении английского и немецкого (больше не пробовал) всё ОК - нормальный текст...
Автор: Widok
Дата сообщения: 19.09.2003 23:58
название темы скорректировал
Автор: Slimer
Дата сообщения: 20.09.2003 11:21
7Ка не сохраняет настройки сканера. с каждым новым запуском появляется всегда твэйн-диалог сканера, 300 дпи, автояркость. где она хранит установки?
Автор: Getsig
Дата сообщения: 21.09.2003 08:14
2 Slimer
По этому поводу ABBY пишет:

"Используйте разрешение 300 dpi для стандартных текстов (размер шрифта 10pts. и больше) и разрешение 400-600 dpi для текстов с меньшим шрифтом (9pts. и меньше). Сканирование в сером режиме рекомендуется для повышения качества распознавания. При сканировании в сером режиме яркость регулируется автоматически. Если Вы хотите, чтобы диалог Настройки сканера открывался каждый раз перед сканированием при работе в режиме Использовать интерфейс FineReader, отметьте опцию Запрашивать опции перед началом сканирования на закладке Сканирование/Открытие диалога Сервис>Опции."


Автор: renreg
Дата сообщения: 21.09.2003 08:43
Uncle KILLER
У меня все идеально. Windows XP+SP1 с английским интерфейсом.
Русский текст отлично. Сканировался плохо отпечатанный журнал на газетной бумаге, многоколонный текст. Тект, в основном, набран курсивом, кегль 8.
Автор: AITL
Дата сообщения: 21.09.2003 09:20
Поделитесь впечатлениями, как у семерки по сравнению с шестой версией, качество распознавания улучшилось?
Автор: Slimer
Дата сообщения: 21.09.2003 14:28

Цитата:
2 Slimer
По этому поводу ABBY пишет:

ты не понял вопроса. не натройки твэйна не сохраняются, а настройки файнредер. т оесть сперва вылазит стандартная сканерная прога, в которой сначала превью потом экспорт в файнреедр, а в 6й у меня все это было нормально, сохранялись настройки и я всегда пойльзовался твэйн интерфейсом через файнредер, без посторонней "помощи"
Автор: albel
Дата сообщения: 21.09.2003 21:08
AITL
субъективно - не очень заметно
Автор: NordWest
Дата сообщения: 22.09.2003 08:16

Цитата:
Цитата:2 Slimer
По этому поводу ABBY пишет:

ты не понял вопроса. не натройки твэйна не сохраняются, а настройки файнредер. т оесть сперва вылазит стандартная сканерная прога, в которой сначала превью потом экспорт в файнреедр, а в 6й у меня все это было нормально, сохранялись настройки и я всегда пойльзовался твэйн интерфейсом через файнредер, без посторонней "помощи"


Млин, такая же бодяга... Каждый раз при запуске 7-й фаньки приходится залазить на вкладку и выставлять "Использовать интерфейс FR".... Бр-р-р-р...

А еще эта сволочь в и-нет периодически стучится... Хотя от новостного канала при установке отказался.
Автор: AITL
Дата сообщения: 22.09.2003 13:57
albel

Цитата:
субъективно - не очень заметно

Вычитал только что в PCWEEK про семерку:
"По словам разработчиков, благодаря усовершенствованию используемых технологий распознают хорошие и средние тексты (книги высокого качества, листы, отпечатанные на лазерных или струйных принтерах, плоды работы современных копировальных аппаратов и т. д.) в среднем на 25% лучше, а плохие (например, газеты, напечатанные в плохой типографии и на плохой бумаге) — даже на 35%."
О как!
Автор: NordWest
Дата сообщения: 22.09.2003 15:19
Про "стук" в и-нет: при инсталяции проги в автозагружаемые процессы прописывается файл AbbyyNewsReader.exe
Автор: Slimer
Дата сообщения: 22.09.2003 15:26

Цитата:
Млин, такая же бодяга... Каждый раз при запуске 7-й фаньки приходится залазить на вкладку и выставлять "Использовать интерфейс FR".... Бр-р-р-р...

ну и что мы собираемся по этому поводу делать?
Автор: NordWest
Дата сообщения: 22.09.2003 18:35

Цитата:
Цитата:Млин, такая же бодяга... Каждый раз при запуске 7-й фаньки приходится залазить на вкладку и выставлять "Использовать интерфейс FR".... Бр-р-р-р...

ну и что мы собираемся по этому поводу делать?


А фиг его знает.... Долбить поддержку - имхо бесполезно :

"Добрый день, Андрей!
Спасибо, что Вы пользуетесь программным обеспечением нашей компании.

Для того чтобы дать Вам квалифицированные рекомендации, сотрудникам Группы
технической поддержки необходима следующая информация:
1. Серийный номер Вашей программы ABBYY FineReader 7.0.

С уважением,
Группа технической поддержки,
Отдел исследований и разработок
+7(095) 234-4400"

Подождём, пока народ себе МАССОВО поставит седьмую Фаньку
Потом сервис-пак от ABBYY, потом 8-ю фаньку и т.д.
Автор: Uncle KILLER
Дата сообщения: 22.09.2003 21:55
renreg, я уже разобрался... Документацию прочитал...
Автор: andrex
Дата сообщения: 23.09.2003 02:41
Uncle KILLER
Автор: Alexpal
Дата сообщения: 23.09.2003 02:44
Народ, прошу помощи!
Установил ABBYY FineReader 7.0 Professional Edition(русская версия). Работает без проблем:
сканирует, распознает и.т.д.
Но как доходит дело до сохранения в Worde или Exel - пропадает русский текст!!! Короче в смешенном тексте (англ. и русский) остается только английский... Русский словарь есть, при распознавании выставляю русско-английский. Распознает, проверяет - все есть. Из FR принтер печатает без проблем оба языка. А вот, например при сохранении в Word смешенного текста на месте русского текста пишет .......разрыв колонки...... А редактировать-то нада! В чем-же проблема? Может Word настроить надо? Помогите разобраться!
Стоит WinXP Pro, Microsoft Office 2000
Автор: andrex
Дата сообщения: 23.09.2003 03:51
Alexpal

Иди в Варезник и там смотри решение своей проблемы - ты не тем патчем активировал FineReader
Автор: ZZmiy
Дата сообщения: 25.09.2003 10:53
Привет All!

(возможно кто-то это уже видел...)

Абзацем считается несколько предложений не разделенных переводом строки. Это видно в ФР или в Ворде, если включить отображение непечатаемых символов. Если есть перевод строки - это новый абзац.
Замечено, что ФР5/6/7 неверно распознают абзацы. Т.е. происходит либо склейка либо разделение абзацев. Самый простой пример - стихи - нет переводов строк... Другой пример - если абзац состоит из одного предложения, которое влезает в одну строку, т.е. заканчивается примерно на правой границе, то этот абзац непременно склеится со следующим. Есть еще другие варианты...

Для экспериментов скачайте тестовые TIFFы, на которых проявляются такие ошибки:
http://zpdd.chat.ru/files/test-tif.rar

Результаты моих исследований можно посмотреть тут:
http://zpdd.chat.ru/files/test-txt.rar

Пояснения: 4-5-6 - ФР4-ФР5-ФР6 (у ФР7 тоже самое что и в ФР6)

*.tx1 - сохранение из ФР в ТХТ с делением на строки
*.tx2 - сохранение из ФР в ТХТ без деления на строки, вот только test4.tx2 получен из test4.tx1 (на переносы не смотреть).
В test5.tx2 и test6.tx2 видно если смотреть по картинкам, где идет склейка абзацев!
*.tx3 - сохранение из ФР5/6 в *.rtf плюс пропуск через спец-программу. Видно, что абзацы, которые склеились в *.tx2 исправлены, но есть ложные срабатывания алгоритма - ложные абзацы...

И еще замечено следующее: если в ФР5 при сохранении в Word обычно используется выравнивание по ширине, то в ФР6/7 разработчики почему-то намудрили (наверное от слова "мудаки") и в тех же местах идет выравнивание влево, что я считаю вообще нонсенсом в DOC. Особенно это заметно на диалогах. Так еще ж в ФР6/7 появилось заполнение пробелами именно из-за того, что нужно же как-то растянуть строку, раз уж выравнивание влево... Два пробела подряд в файлах DOC - это тоже маразм!
Если в ФР5 на тех местах, где шла склейка абзацев, идет выравнивание влево, то такие склейки легко находятся полуавтоматически, например, в Wordе. То на ФР6/7 эти же склейки не отличишь от нормальных ситуаций...
У меня написана программа, которая из сохраненного в ФР специальным образом RTF файла, путем анализа этих самых выравниваний, делает текстовый файл с исправлениями склееных/разделенных абзацев. Так вот на ФР5 программа делает потрясающие результаты - в большинстве случаев после нее нет дополнительной правки абзацев. В то время как после ФР6/7 из-за таких заумностей, как выравнивание влево в нормальных абзацах, - делается много доисправлений...

Так вот, наконец, вопрос:
Есть ли у Allа какие-нибудь решения по этому поводу???

ФР4 не предлагать!
Это слишком просто (очень примитивно в век ФР5/6/7 и космических полетов).
Я знаю, что в ФР4 есть сохранение в TXT с сохранением форматирования при помощи пробелов. И видел, что там с абзацами таких проблем нету...

С уважением, Zmiy. --------------
http://zmiy.da.ru
Автор: ZZmiy
Дата сообщения: 25.09.2003 23:31
Сам написал - сам ответил...

Вот же блин невнимательность!
Показали мне в ФР7 возможность сохранения текста как было в ФР4 - с форматированием пробелами...
Опции-Распознование-Тип страницы-Форматированный пробелами текст, но нужно ставить эту опцию перед распознованием... Так, что интересно - эта опция есть и в ФР5 и в ФР6... А я тут пришел Вам мозги пудрить...
При таком варианте нет проблем с абзацами, которые остались при сохранении в вордовские форматы... Так что учтите , что если Вы делаете текст только в Ворде и не исправите ошибок выравнивания после ФР5/6/7, то при сохранении Вашего вордовского файла в TXT будет склейка/разделение абзацев!!!

P.S. Ушел писать прогу преобразования сохраненного из ФР текста форматированного пробелами в правильный(!) текст, готовый к вставке в Ворд...




Вопрос на засыпку :

Как в ФР найти символ "конец абзаца"???
(не путайте с символом разрыв строки!)
Автор: ProtoZz
Дата сообщения: 30.09.2003 15:08
FineReader нормально отсканировал и распознал документ на русском. Но после сохранения в любой формат - русские буквы съедаются :((( Однако, проблема... :( Что делать?

Я заметил, у Uncle KILLER та же фигня.

Стоит WinXP SP1 RUS
Автор: andrex
Дата сообщения: 01.10.2003 00:11
ProtoZz

Иди в Варезник - там найдешь ответ на свой вопрос. Он у тебя крекнут левым патчем...
Автор: Urist
Дата сообщения: 05.10.2003 11:53
Разница в использованиее Twain и WIA драйверов при использовании Finereader - какие драйверы предпочесть?

Интерфейс Finereader 6 и 7 позволяет выбирать тип драйвера сканера.
В чём разница и какие Вы предпочли? Почему?
Автор: albel
Дата сообщения: 05.10.2003 12:04
Urist
обычно использую twain. Интерфейс больше нравится, настройки удобные -- но это уже зависит от производителя сканера (UMAX, Canon меня вполне устраивают).
WIA предоставляет, imho, стандартный системный интерфейс для всех типов сканеров
Автор: A_Crow
Дата сообщения: 05.10.2003 18:11
Народ, а есть-ли спасенье для распознание текста, напечатаного на печатной машинке?
(Fine Reader 7)
Автор: sawamail
Дата сообщения: 06.10.2003 08:29
A_Crow
Опции / Распознавание / Тип печати / Пишущая машинка
Автор: A_Crow
Дата сообщения: 06.10.2003 16:14
sawamail
спасиб. стало намного лучше, но всеранво не так чтоб очень...
Автор: andrex
Дата сообщения: 06.10.2003 17:26
A_Crow

А чем он отличается от распечатанного на принтере? Старой лентой?
Автор: albel
Дата сообщения: 06.10.2003 19:22
andrex
неоднородность букв (разная интенсивность в разных местах буквы в зависимости от силы удара, типа и изношенности литеры), часто более расплывчатые очертания (в зависимости от типа ленты), специфичный шрифт (вот с этим многие ошибки связаны) ну и т.п.
Установка типа текста "печатная машинка" ввиду всего вышеперечисленного спасает где-то процентов на 60.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.