Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: vitaly1
Дата сообщения: 26.10.2005 11:47
xy
Для начала скачай и установи нужные тебе языки распознавания с офсайта. А дальше щелкаешь на панели там, где указан язык, выбираешь "Выбор нескольких языков" и ставишь галочки против нужных. Лучше больше 2-3 не выбирать.

Sish
Вопрос не совсем о том.
Автор: xy
Дата сообщения: 28.10.2005 09:08
vitaly1
ага, спасибо, т.е. опция Рус+Англ это уже пережиток времени :)
Автор: vitaly1
Дата сообщения: 28.10.2005 12:36

Цитата:
Рус+Англ это уже пережиток времени

Вроде бы в 7-ке была, а 8-ке уже нет.
Автор: mistx
Дата сообщения: 29.10.2005 15:04
помогите разобраться!
Установил Finereader 8.0, сканирует и распознает без проблем (рус-англ. сканирую словарь)
но как переганяю страницы в ворд, вместо русского шрифта
одни квадраты. в 7.0 все нормально было В чем дело?

Заранее спасибо!!!
Автор: vitaly1
Дата сообщения: 29.10.2005 15:38
mistx
8-ка взломана криво. Загляните в Варезник, там все это уже описывали.

P.S. А что за словарь?
Автор: BredBred
Дата сообщения: 30.10.2005 18:29
mistx
Пропатчить надо. Лезь в варез за патчем.
А взломана путем!
Автор: mistx
Дата сообщения: 31.10.2005 21:26
BredBred
Благодарю!
Автор: K V K
Дата сообщения: 04.11.2005 02:47
RSV
Irfanom попробуйте конвертнуть тиф в тиф.

Вот вопрос в верхней строчке один из индексов 0 в 7-ке распознался нормально, а в 8 как ,, правда тоже в нижнем индексе. Либо 8-ка хуже распознает, либо я не разобрался в ее настройках.
http://rapidshare.de/files/7126244/file1_.tif.html
Спасибо!
Удачи
Автор: memo
Дата сообщения: 07.11.2005 14:52
Где найти хорошее описание на русском ФР-ера? Проблемма в распознавании замысловатого шрифта-фонта. Как его научить?
Автор: pikvvik
Дата сообщения: 07.11.2005 15:49
2 memo
Так в справке по ФР на русском в разделе
Работа с ABBYY FineReader 8.0 --> Распознавание --> Распознавание с обучением все расписано
Цитата:
Режим "Распознавание с обучением" используется для:

распознавания текстов, для набора которых использованы декоративные шрифты;
распознавания текстов, в которых встречаются специальные символы (например, отдельные математические символы);
распознавания большого объема (более 100 страниц) текста плохого качества.
также посмотри раздел Создание новых языков
Автор: memo
Дата сообщения: 07.11.2005 17:27
pikvvik

спасибо, то, что нужно
Автор: VitK
Дата сообщения: 11.11.2005 14:46
А если FR8 нужно установить, например, на 5 машин - как быть?
Он же контролирует при запуске по сети серийные номера
Автор: vitaly1
Дата сообщения: 11.11.2005 14:52
VitK
Тебе сюда - http://forum.ru-board.com/topic.cgi?forum=35&bm=1&topic=25700&start=1380#lt
В шапке все написано.
Автор: YuraseK
Дата сообщения: 12.11.2005 14:35
To All
Может кто замечал в 8-й версии такой глюк: была отсканирована книга в ч/б цвете с разрешением 400 dpi. Затем с некоторыми страницами была проведена простейшая обработка (работа ластиком). Так вот, этот FineReader за версией 8 по какой-то неведомой причине начинает искажать картинку страницы. Это искажение похоже на то, когда берут страницу, разрезают пополам и слегка сдвигают в противоположные стороны. При всём этом степень искажения увеличивается при увеличении количества операций обрабоки.
В качестве примера две картинки:
Начальная картинка:
http:\\yurasek.narod.ru\01.png (11 Кб, 853x542x2)
Картинка после удаления небольшого участка при помощи ластика:
http:\\yurasek.narod.ru\02.png (11 Кб, 853x542x2)

Лечится ли это безобразие путём настроек?
Автор: Aresstokrat
Дата сообщения: 15.11.2005 00:43
Как завставить сабж работать с форматом DJVU ?
Автор: vitaly1
Дата сообщения: 15.11.2005 00:54
Aresstokrat
С самим дежавю - никак, он ведь не поддерживается как формат на входе. Но всегда можно преобразовать дежавю в tiff и загрузить получившиеся файлы в ФР.

Есть, кстати, возможность с помощью ФР добавить текстовый слой в дежавю и потом копировать этот текст из дежавю и осуществлять по нему поиск.
Автор: videoj05
Дата сообщения: 16.11.2005 01:05
в FR8/7 можно выбирать символы для своего языка из встроенной таблицы символов. Но там похоже используется строго шрифт TIMES NEW ROMAN. А в этом шрифте урезанный набор кириллицы (конкретно нет старо-русских символов ять, фита и т.д., вместо них - квадратики).

Вопрос такой: можно ли как-то принудить FR использовать в своей таблице другой шрифт, хотя бы ARIAL UNICODE MS.

пробовал в "опциях > 4. Сохранить" менять шрифты на ARIAL UNICODE MS, ничего не помогло.

скачал модуль otherlang, активировал russian (old spelling). FR стал распознавать эти символы, но мне нужно чтобы еще можно было добавлять в пользоват.словарь, а FR на этих символах спотыкается и выводит ошибку "Слово содержит символы не входящие в кодовую страницу языка". и вот я так понял, что он принудительно использует коды TIMES NEW ROMAN вместо шрифта который я указал.

Может кто пробовал бороться с этой принудиловкой?
Автор: alexicus
Дата сообщения: 16.11.2005 10:21
После установки 8ки твайн стал очень сильно тормозить - паузы между страницами затягиваются до 15 секунд. Причём ставил параллельно, v7 тоже осталась. Так вот, и в 7ой паузы между страницами такие же. Кто-нибудь сталкивался с подобным и способы решения?
Автор: pikvvik
Дата сообщения: 16.11.2005 18:05
2 alexicus
Давай уточним.

В опциях стоит так?
Медленнее сканера под ХР (под 98 и Ме - нормально) природа, наверное, не видела. Но вот что, а паузы между страницами - не более 2 сек, не успеваю страницы перелистывать
Автор: alexicus
Дата сообщения: 17.11.2005 00:56
pikvvik
спасибо, всё решилось.. перезагрузкой.. гы.. наверное система странно себя повела после установки (читай - глюкануло)

Цитата:
паузы между страницами - не более 2 сек, не успеваю страницы перелистывать

а обратного хода у сканера этого вообще нет чтоли? я за время обратного хода успеваю перевернуть..
Автор: pikvvik
Дата сообщения: 17.11.2005 01:16
2 alexicus

Цитата:
а обратного хода у сканера этого вообще нет чтоли?

Он его и делает, обратный ход - за 2 сек (Mustek 6000P, но под ХР драйвера только неродные примерял).
Автор: alexicus
Дата сообщения: 17.11.2005 09:18
pikvvik

Цитата:
Он его и делает, обратный ход - за 2 сек

Обалдеть! Неоценимая вещь для скана книжек!
Ну если не успеваешь, набавляй ещё пару секунд между страницами.
Автор: pikvvik
Дата сообщения: 17.11.2005 15:22
2 alexicus

Цитата:
Обалдеть! Неоценимая вещь для скана книжек!

Так я же писал:

Цитата:
Медленнее сканера под ХР (под 98 и Ме - нормально) природа, наверное, не видела.

Т.е. 1 проход сканирования где-то 2 мин , возврат - пресловутые 2 сек
ХР из-за этой беды сносить не хочу, под виртуалкой 98&Me сканер не работает...
Автор: rish
Дата сообщения: 18.11.2005 08:46
вопрос такой. после распознавания отсканированного текста пытаюсь его сохранить в word, acrobat и т.п. вместо русских букв одни квадраты. в чем проблема . Версия Finereader 8.0.0.706 #4605.
Заранее спасибо.

Все, вопрос отметается. Нашел ответ.

Автор: labret
Дата сообщения: 18.11.2005 12:15
2videoj05
В Readme видел про Армянский. Там и про "Arial Unicode MS" есть.
Может тебе поможет? про результат напиши, вруг пригодится...
Автор: Aresstokrat
Дата сообщения: 20.11.2005 04:40


Цитата:
Aresstokrat
С самим дежавю - никак, он ведь не поддерживается как формат на входе. Но всегда можно преобразовать дежавю в tiff и загрузить получившиеся файлы в ФР.

Есть, кстати, возможность с помощью ФР добавить текстовый слой в дежавю и потом копировать этот текст из дежавю и осуществлять по нему поиск.


Первое понял, вопрос чем конвертнуть.
По второму, ничего не понял.

Что хочу получить, есть книга в DJVU хочу её распечатать, соотв. перевести в word, потому как печатать DJVU довольно извращенный вариант да и книга не стандартного формата. Need help
Автор: Sish
Дата сообщения: 20.11.2005 05:38
Aresstokrat

Цитата:
Что хочу получить, есть книга в DJVU хочу её распечатать, соотв. перевести в word, потому как печатать DJVU довольно извращенный вариант да и книга не стандартного формата. Need help

Как вариант, можно попробовать следующее: распечатать книгу на виртуальный принтер pdfFactory, при этом мы получим книгу в формате pdf.
Затем с помощью того же сабжа или Abbyy PDF Transformer, к примеру, распознать pdf...
Sorry за
Автор: vitaly1
Дата сообщения: 20.11.2005 12:49
Aresstokrat
Конвертнуть можно Соло или DocumentExpress Pro. Весь нужный тебе софт здесь и здесь.

Цитата:
По второму, ничего не понял

Схема такая - распознаешь полученные тифы в ФайнРидере, ничего в них не правишь, берешь получившеся frf-файлы и дежавю и с помощью утилиты Генчо вставляеш этот распознаный текст в дежавю. В результате можно копировать текст из дежавю и искать по нему. Конечно, в тексте могут быть ошибки, поскольку ФР распознает не идеально, но это не страшно - всегда можно проверить по дежавю.

Цитата:
есть книга в DJVU хочу её распечатать, соотв. перевести в word

Не совсем понял, что именно нужно - то ли распечатать, то ли перевести в Ворд.

Sish
Можно и так. Только по моему опыту Abbyy PDF Transformer - это просто урезаный ФР с минимумом настроек. Качество распознавания у них одинаковое, даже ошибки на моем файле делали в одних и тех же местах. ФР лучше тем, что можно менять или удалять области, которые не нужно распознавать, - всякие там колонтитулы, номера страниц и т.д. Поэтому лучше всего загрузить пдф в ФР, запустить Анализ макета всех страниц, потом пройтись по ним и поправить границы областей, ну а дальше распознать.
Автор: Kiljes
Дата сообщения: 21.11.2005 04:39
А новый ФР 8 нормальный, глюков мало? Стоит ли переходить с 7-й?
Автор: Sish
Дата сообщения: 21.11.2005 06:39
Kiljes

Цитата:
Стоит ли переходить с 7-й?

Если 7-ой полностью устаривает, то ИМХО, не стОит, хотя каждый, как известно, проблему выбора решает сам...

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.