Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: matheiiv
Дата сообщения: 11.11.2009 13:05
bolvanchik

Цитата:

с учётом того, что текст уже сохранялся ранее в doc, получились следующие результаты
330 страниц
9-ка - 24 сек
10-ка - 11 сек


проверьте написанное!
какая 9-ка (лицензионная или крякнутая)?
какая 10-ка (лицензионная или крякнутая)?
10-ка что, быстрее?
Автор: bolvanchik
Дата сообщения: 11.11.2009 13:23
matheiiv

у меня лицензия
Автор: matheiiv
Дата сообщения: 11.11.2009 17:43
bolvanchik
1) не верю...
выставляйте скриншот "License Info"! Там ничего "секретного" нет!

2) что значит
"9-ка - 24 сек
10-ка - 11 сек"?
Автор: ALEX666999
Дата сообщения: 11.11.2009 19:29

Цитата:
matheiiv: что значит
"9-ка - 24 сек
10-ка - 11 сек"?

Значит сохраняет пакет из 330 файлов в режиме "с именами страниц в TXT" за указанное время.

Мой сегодняшний тест сохранения с именами страниц в TXT, 300 файлов, все версии FR "Medic-Edition"

9.1019 В память: 6 сек, на ЖД - 21 сек.

9.1042 В память: 7 сек, на ЖД - 19-20 сек.

10.56, В память: 42 сек, на ЖД - 47 сек.

Распознавание в 10-ке по тесту примерно на 20 сек дольше, чем во обеих версиях 9-ки. Дополнительные опции (развороты и т.д) везде были отключены, режим распознавания "тщательный", языки: русский, английский.
Автор: matheiiv
Дата сообщения: 12.11.2009 11:25
ALEX666999
Ваши данные противоположны данным bolvanchika. Комментарии?

ваш процессор P-IV может не работать с SSE3, а тем более SSE4 инструкциями, которые ускоряют процесс и которые реализованы в движке нового FR 10?
Автор: bolvanchik
Дата сообщения: 12.11.2009 12:18
у меня только до SSE3
Автор: ALEX666999
Дата сообщения: 12.11.2009 14:51
matheiiv


Цитата:
bolvanchik: я сам невнимательно прочитал ваши сообщения. я НИКОГДА не использовал сохранение именами исходных страниц . тот эффект, что на видео, присутствует


Вопрос снят.
Автор: Shangry
Дата сообщения: 13.11.2009 13:24
bolvanchik

Цитата:
В десятке, в режиме простой текст можно задать свой шрифт. на счёт стиля увы
это не так страшно - можно одним выделением в ворде привести к одному стилю.

Мне чаще всего требуется "Редактируемая копия". Она достаточно прилично дает таблицы и смысловые выделения форматом в основном тексте страницы.
Но именно из нее я и получаю в Word кучу приблудных стилей плюс невозможность переформатировать некоторые элементы стиля - разве что идти вдоль текста и вручную поштучно выгребать "мусор". Наложение своего стиля на большой кусок распознанного обычно дает результат "напополам" - что-то выправилось, что-то нет.

Ваш рецепт - зачистить стиль - тоже не всегда помогает. Во-первых такое есть не во всех версиях Word, а во-вторых, даже после него сохраняются кое-какие хвосты от Файридеровского форматирования. Анекдот, но именно так и есть. :-)
К тому же, как вы правильно заметили, при такой зачистке слетают некоторые "нужности" в форматировании.

Поэтому и любопытно - есть ли в 10.0 какие-либо улучшения в этом гармыдре или все осталось как и было.
Автор: bolvanchik
Дата сообщения: 14.11.2009 07:58

Shangry

Цитата:
Ваш рецепт - зачистить стиль - тоже не всегда помогает.



Интересно, какую версия офиса вы используете?
Автор: embrace909
Дата сообщения: 14.11.2009 10:21
Заметил баг интерфейса 10ки: если закрыть прогу с кнопочкой "Передать в ___", потом заново открыть, выбрать кнопочку "Сохранить как ___", то эта кнопочка блокируется (Win7), лечится изменением размера окна программы.
(Всё из-за того что кнопочка "передать" меньше по ширине и при открытии проги вырисовывается интерфейс по такой же ширине.
Автор: Lesmo
Дата сообщения: 15.11.2009 20:10
ALEX666999, zhe_zho спасибо!

Screenshot Reader из FineReader, да, не принципиален. Как-то предпочтение осталось на стороне специализированной проги.
Автор: Princeps
Дата сообщения: 15.11.2009 20:49
Все, разобрался.
Автор: Super Baby
Дата сообщения: 15.11.2009 23:11
Скажите, а есть ли китайский язык распознавания для Fine Reader 8? Здесь:
http://download.abbyy.com/addlang/build800677/default.aspx
нет. В пакет "Остальные языки распознавания (2,18 МБ)" он не входит.
Автор: ALEX666999
Дата сообщения: 15.11.2009 23:39

Цитата:
Super Baby: Скажите, а есть ли китайский язык распознавания для Fine Reader 8?

Он появился, если не ошибаюсь, в 9-й версии 882 билда. И в предыдущие подсунуть его нельзя.
Автор: Shangry
Дата сообщения: 16.11.2009 11:53
bolvanchik

Цитата:
Интересно, какую версия офиса вы используете?

Постоянно я работаю в 97-м, но ради интереса посмотрел и в более старших, вплоть до 2003.
Картина везде одна и та же - часть Файнридеровского форматирования меняется на то, что мне требуется, часть остается как и прежде. В зависимости от версии меняется только соотношение, что изменилось/что не изменилось.

Да и, действительно не выход это - полная очистка стиля. Часть стилевых настроек, которая мне не мешает, бы я не возражал оставить - там многое вполне по делу. Но наложить поверх полученного материала свой собственный базовый стиль не помогает.
Точнее вполне работало до 9-й версии и разладилось в 9-й и, если ничего не поменяли, в 10-й.
Автор: bolvanchik
Дата сообщения: 16.11.2009 15:15

Цитата:
Постоянно я работаю в 97-м, но ради интереса посмотрел и в более старших, вплоть до 2003.
Картина везде одна и та же - часть Файнридеровского форматирования меняется на то, что мне требуется, часть остается как и прежде. В зависимости от версии меняется только соотношение, что изменилось/что не изменилось.

Да и, действительно не выход это - полная очистка стиля. Часть стилевых настроек, которая мне не мешает, бы я не возражал оставить - там многое вполне по делу. Но наложить поверх полученного материала свой собственный базовый стиль не помогает.
Точнее вполне работало до 9-й версии и разладилось в 9-й и, если ничего не поменяли, в 10-й.



соглашусь, возни со стилями в 97 больше, чем в старших версиях офиса.
но FR10 создает похожие стили основного текста (н-р Основной текст(167), Основной тескт(177) и тп) которые похожи на один стиль - Основной текст. так что их можно удалить - проблем почти не будет. а можно изменить на один общий стиль - Обычный

кстати очень FR10 хорошо определят структуру заголовков (сегодня только заметил - в режиме редактируемая копия). у девятки стилей вообще целая куча (много больше чем у 10) . и с ними возни больше.

Загрузил в OpenOffice (3.1.1) - F11 - По иерархии - тут вообще красота. если текст выделен - то выбрать можно что угодно. попробуйте
Автор: domo22
Дата сообщения: 17.11.2009 08:49
Существует ли программа с помощью которой можно просмотреть картинки в папке проекта FR? Они в каком-то чудном формате.
Автор: Sish
Дата сообщения: 17.11.2009 09:21
domo22
Каринки, находящиеся в проекте 8-ки, лёгко открывает и ACDSee 6.0, и стандатный виндовый просмотрщик (Imaging)...
Автор: bolvanchik
Дата сообщения: 17.11.2009 10:48
domo22


Цитата:
Существует ли программа с помощью которой можно просмотреть картинки в папке проекта FR? Они в каком-то чудном формате.



в проекте каждое изображение лежит в \####\Image\
где #### - имя папки с номером изображения в пакете
само изображение - bwPage.frdat (это если черно-белое) - спокойно открывается Paint ом( Tif файл)
Автор: embrace909
Дата сообщения: 17.11.2009 20:34
Сейчас сравнил ABBYY FineReader 8.0.0.1095 Professional Edition
http://fr7.abbyy.com/fr80/FR80_474_3.exe

и ABBYY FineReader 10.0.101.56 Professional Edition
http://fr7.abbyy.com/fr10/ABBYY_FineReader_10_PE.exe

Результат - так себе...
Общее время работы 10ки ровно в 2 раза больше 8ки. (170 секунд против 85)
Сравнимое качество - одинаковое.
Для теста взял 5 фоток книжки с фотика, в настройках прог - тщательное распознование (по умолчанию), предобработка включена там и там, в 10ке автоматический анализ и распознование отключен, чтобы вручную обвести область распознавания.
8ка обрабатывает изображения только поворотами на градусы, а 10ка их выгибает в виде выпуклостей, что теоретически даст лучшее распознование на косых округленных страницах, на в данном тесте где фотографировалось старательно паралельно результаты оказались абсолютно одинаковыми.
10ка в 2 раза медлительнее 8ки, так что 8ка имеет большой приоритет. С виду эта последняя версия где не менялся движок с 4й версии и достиг максимального заточения. В 9ке же появился какой-то новый движок перешедший в 10ку...
Автор: domo22
Дата сообщения: 17.11.2009 23:49
Sish
bolvanchik
За попытку помощи спасибо, но это все не то: ACDSee у меня нет, виндовский Imagine эти двухтоновые файлы не берет, Paint не берет, XnView не берет, IrfanView пытается прочесть но говорит, что это файлы BMP 1x1 с неправильным расширением TIF, ImageEye не берет, Фотошоп не берет. Берет только создавший их FR 9. Еще есть предложения?
Автор: bolvanchik
Дата сообщения: 18.11.2009 06:16
domo22

Ниже приложены скрины.
Картинки по умолчанию - ч/б
Само изображение в формате Tif (bwPage.frdat)
Превью в формате BMP (preview.frdat)

Onlinedisk-284 кб
Автор: Sish
Дата сообщения: 18.11.2009 08:41
domo22

Цитата:
XnView не берет

Хм, странно, у меня XNView 1.96.5 лёгко всё открыл...

А не мог бы выложить файл картики на обменник? Прям интересно стало...
Автор: domo22
Дата сообщения: 19.11.2009 08:57
bolvanchik
Все точно так, включая предложение переименовать файлы в BMP. Единственная разница - файл после этого открывается не так как у вас, а в виде картинки 1х1 пиксел, т.е. никак.

Sish
Одна из страниц, случайная (http://www.onlinedisk.ru/file/271360/). На всякий случай включаю еще и *.frf, может пригодится. Другие страницы такие же, наверно нет смысла их все выкладывать, только место займут.
Автор: Sish
Дата сообщения: 19.11.2009 11:02
domo22
Думаю, разгадка тайны сей в нестандартном формате файла:



Мне открыть его тоже ничем не удалось...
Автор: Kosik1234
Дата сообщения: 19.11.2009 11:03
Получается что так и не нашли лекарство против выскакивающих окон ошибок при закрытии FineReader 9.0 под Windows 7?
Автор: bolvanchik
Дата сообщения: 19.11.2009 13:19
domo22

вы вероятно говорите про 9-ку.
файлы frf в ней - это результат распознавания крнкретного изображения
а сами изображения в 9-ке , вероятно, состоят из пакета (bmp и tif файлов)
Автор: barsch7
Дата сообщения: 19.11.2009 14:58
Прошу прощения, не смотрел толком, был ли тут такой вопрос:
в FR 9.0 при передаче данных (немецкий язык) в MS Word теряются свойственные языку символы (умлауты и эс-цэт), вместо них отображаются соответствующие русские "д", "?" и т.д.
Как подправить ситуацию?
Заранее спасибо.
Автор: domo22
Дата сообщения: 19.11.2009 19:11
bolvanchik
Ну да, это 9. А что с приложенным файлом tif? Вам удалось его открыть? Sish говорит, что не удалось.
Автор: bolvanchik
Дата сообщения: 19.11.2009 19:49
domo22

не удалось ничем.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.