Ru-Board.club
← Вернуться в раздел «Программы»

» ABBYY FineReader

Автор: igor32499
Дата сообщения: 23.01.2010 20:15
Ну они же не могут заранее угадать какие надо, какие нет.
Автор: boss911
Дата сообщения: 23.01.2010 20:37
Что-то я совсем запутался. Подскажите, пожалуйста, каике именно файлы нужно удалить, дабы полностью избавиться от группы азиатских языков, то есть от China, Japan и Korea. Удаление файлов Normal.* не дает нужного результата, в списке азиатских языков они все равно присутствуют.
Автор: bolvanchik
Дата сообщения: 23.01.2010 20:57

Цитата:
Ну они же не могут заранее угадать какие надо, какие нет.



Цитата:
Что-то я совсем запутался. Подскажите, пожалуйста, каике именно файлы нужно удалить, дабы полностью избавиться от группы азиатских языков, то есть от China, Japan и Korea. Удаление файлов Normal.* не дает нужного результата, в списке азиатских языков они все равно присутствуют.


запускаем повторную установку (можно из c:\temp, если не удаляли распакованный от предыдущей установки дистрибутив ). выбираем пункт изменить, где добавляем/убираем нужные/ненужные языки.

Автор: boss911
Дата сообщения: 23.01.2010 23:18
bolvanchik

Цитата:
выбираем пункт изменить, где добавляем/убираем нужные/ненужные языки.

Вообще-то я говорил о вырезании файлов из дистрибутива. Да и в выборе компонентов я не вижу пункта "азиатские языки".

Добавлено:

Цитата:
cjk = China Japan Korea

В момент установки я отключил эти три языка, тем не менее, данные файлы все равно были установлены (скопированы). Как это объяснить?
Автор: ALEX72KONIG
Дата сообщения: 24.01.2010 00:05
Всегда использовал для конвертации pdf-txt, scan-txt. А тут оказывается еще и бонус есть:
ABBYY Screenshot Reader - простое в использовании приложение для создания снимков экрана двух типов: "Изображение" и "Текст".
Да и дистрибутив FineReader 10 всего 371 метр....По моему не много...
Автор: bolvanchik
Дата сообщения: 24.01.2010 09:18

Цитата:
В момент установки я отключил эти три языка, тем не менее, данные файлы все равно были установлены (скопированы). Как это объяснить?


мне это и самому непонятно. я вообще всего 5 языков использую: русский, английский немецкий, греческий, простые химические формулы. другие за более чем 10 лет пользования FR мне не пригодились
Автор: ALEX666999
Дата сообщения: 24.01.2010 18:29
bolvanchik обнадёжил, однако тормозное сохранения в режиме "С именами исходных изображений" на билдах выше 10.56 сохранилось дёрганую анимацию только поправили. Привожу тест:


Пакет - 361 файл
Язык распознавания - английский
Предварительная обработка изображений отключена
Сохранение велось в TXT, в режиме "Сохранять с именами исходных изображений"
Все версии FR Ru-board edition

v10.0.102.105 Corp
время распознавания - дольше на 40% по сравнению с 9.1297
время сохранения результатов в память - 56 секунд
время сохранения результатов на ЖД - 61 секунда
- - - - - - - -
v10.0.102.95 Pro
время распознавания - дольше на 80% по сравнению с 9.1297
время сохранения результатов в память - 57 секунд
время сохранения результатов на ЖД - 62 секунды
- - - - - - - -
v9.1297 Pro
время сохранения результатов в память - 3 секунды
время сохранения результатов на ЖД - 8 секунд


При проверке результатов ошибки распознавания вылезали примерно на тех же местах.
Таким образом, кому важна скорость, особенно при работе с большими пакетами, советую юзать 9-ку последних билдов. 10-ку можно держать в запасе для восточных языков, цифровых снимков с текстом низкого качества и трапециевидными искажениями (тоже ещё нужно проверить, есть ли улучшения).
Автор: ALEX666999
Дата сообщения: 25.01.2010 12:40

Цитата:
JekaKot:
>совместимость по проектам 9-ки есть?
Угу...

Странно... А у меня, вроде, ни в прямую ни в обратную сторону совместимости не было. Ошибка импорта и превед.
Автор: pruss
Дата сообщения: 25.01.2010 23:25
у меня на 10ке преобразует девяткины в свой формат, а обратно нет.
Бесит другое, при распознании не отображаются номера областей на 10ке. и потом при работе в док приходится вручную ставить на свои места, а тексты обычно большие по 500 и более страниц в две-три колонки.
Автор: bolvanchik
Дата сообщения: 26.01.2010 05:03
pruss

Цитата:
Бесит другое, при распознании не отображаются номера областей на 10ке. и потом при работе в док приходится вручную ставить на свои места, а тексты обычно большие по 500 и более страниц в две-три колонки.


отображаются. правда только в свойствах области (нужно развернуть, если закрыто)
Автор: Andr31
Дата сообщения: 27.01.2010 21:34
У меня всегда при распознавании текста получается шрифт 32 размера (текст сфоткан мобилой). Как установить постоянный размер шрифта по умолчанию? Использую FR 10.
Автор: masgak
Дата сообщения: 28.01.2010 10:10
Скажите где можно скачать отдельно языки распознования? в шапке по ссылкам иду там че то не то.
нужен арабский язык, скиньте плиз у кого есть.
Автор: bolvanchik
Дата сообщения: 28.01.2010 11:13

Цитата:
Скажите где можно скачать отдельно языки распознования? в шапке по ссылкам иду там че то не то.
нужен арабский язык, скиньте плиз у кого есть.


Все дополнительные языки находятся по адресу
http://www.abbyy.ru/finereader/recognition_langauges/
Арабского пока среди них нет
Автор: Baggio5555
Дата сообщения: 30.01.2010 19:41
Счас провел мини тест распознавания странички в 8,9 и 10-ке. Всего 2092 символа.
Неуверенно распознанных:
8.0.0.11.26 Corp - 4 символа
9.0.0.10.42 Corp - 20 символов
10.0.102.105 Corp - 73 символа
Чё за херня?
В 10 выкинули моё любимое разрешение 200 dpi из настроек сканирования через интерфейс проги. И не могу найти опцию "Привести серые/цветные изображения к черно-белым". В топку, короче.
Автор: bolvanchik
Дата сообщения: 30.01.2010 21:14

Цитата:
Счас провел мини тест распознавания странички в 8,9 и 10-ке. Всего 2092 символа.
Неуверенно распознанных:
8.0.0.11.26 Corp - 4 символа
9.0.0.10.42 Corp - 20 символов
10.0.102.105 Corp - 73 символа


В принципе об это уже обсудили выше. У 8-ки сильная сторона - распознавание, даже на сканах с малым разрешением. а у 10-ки лучшее "понимание" структуры страницы
Автор: Antonij72
Дата сообщения: 31.01.2010 07:16
А 2 эти версии (8 и 10) можно одновременно установить как-нибудь?
Автор: bolvanchik
Дата сообщения: 31.01.2010 08:20

Цитата:
А 2 эти версии (8 и 10) можно одновременно установить как-нибудь?


можно. мешать друг другу не будут. это обсуждалось выше
Автор: Astra55
Дата сообщения: 31.01.2010 08:27
bolvanchik

Цитата:
У 8-ки сильная сторона - распознавание, даже на сканах с малым разрешением. а у 10-ки лучшее "понимание" структуры страницы

Значит, готовьте бабки на 11-ю и последующие версии В них опять улучшится распознавание и ухудшится анализ. Бесконечный цикл развода лохов.
Жил-был поп.
У попа был двор.
На дворе был кол.
На колу было мочало.
Не сказать ли все с начала?
Автор: bolvanchik
Дата сообщения: 31.01.2010 09:21

Цитата:
Значит, готовьте бабки на 11-ю и последующие версии...


свою лиц покупал только для использования на работе. что бы "добрые" проверяющие много вопросов не задавали.
Автор: JekaKot
Дата сообщения: 31.01.2010 14:44
bolvanchik

Цитата:
В принципе об это уже обсудили выше. У 8-ки сильная сторона - распознавание, даже на сканах с малым разрешением. а у 10-ки лучшее "понимание" структуры страницы

Вот сейчас и убеждаюсь в этом же: сижу распознаю отсканированные листинги (LISPы). Сами понимаете - это не ошибка в обычном документе, тут важна точность распознавания (отлов опечаток при трассировке готового LISP - занятие не для слабонервных).

Качество отсканированного материала - отличное (распечатка из Блокнота на хорошем принтере, четкость в внорме), но 10-ка категорически не различает "(" и "С", путает "1" и "l" (знаю, шрифт Lucida Concole не самый простой для распознавания, но 8-ка ошибается НАМНОГО реже). Да и создание ненужной мне структуры из блоков (кто, спрашивается, просил?) распознанного текста - не нужно...

9-ка, и, особенно, 10-ка - просто "стрижка купонов" - реальных улучшений НЕТ!
(Сложное редактирование отсканированного варианта проще решать, например, в ACDSee Pro 3.0 (повороты/искажения/цветности и пр.), в том же Paint некоторую мелкую ретушь наводить). Короче, поставил 8-ку и понял - "старичок" еще хоть куда ...

10-ка стоит лишь для сравнения (на всякий случай), но пока проигрывает в точности распознавания (скорость тоже хромает)
Автор: Antonij72
Дата сообщения: 31.01.2010 16:46

Цитата:
Цитата:А 2 эти версии (8 и 10) можно одновременно установить как-нибудь?


можно. мешать друг другу не будут. это обсуждалось выше

Прошу тыкнуть носом. Не нашел.
Автор: bolvanchik
Дата сообщения: 31.01.2010 18:15

Цитата:
Прошу тыкнуть носом. Не нашел.


точно не скажу. там где велся разговор о тестировании (о скорости распознавания и передачи), где я приводил данные по 8,9,10 версию (они у меня все установлены). я даже приводил скрины. можно открыть версию для печати и ввести мой ник или слово Onlinedisk - именно на него я выкладывал скрины с результатми тестирования по каждой версии

p.s. что бы окончательно поставить в этом вопросе точку, вот Скрин
Автор: Dashout
Дата сообщения: 31.01.2010 19:27
на всякий случай ссылка на восьмерку (8.0.0.731)
http://forum.ru-board.com/topic.cgi?forum=35&topic=43852&start=2000#4
Автор: Antonij72
Дата сообщения: 31.01.2010 21:55

Цитата:
Дополнительные языки распознавания для Abbyy FineReader 8.0

Ссылка из шапки не работает. Прошу поделиться.

Добавлено:

Цитата:
точно не скажу. там где велся разговор о тестировании (о скорости распознавания и передачи), где я приводил данные по 8,9,10 версию (они у меня все установлены). я даже приводил скрины. можно открыть версию для печати и ввести мой ник или слово Onlinedisk - именно на него я выкладывал скрины с результатми тестирования по каждой версии

Нашел. Но не нашел описания КАК УСТАНОВИТЬ одновременно 10 и 8-ю версии. 10 - стандартно, а 8 - портативную? Или как?
Автор: zhe_zho
Дата сообщения: 01.02.2010 00:34

Цитата:
Но не нашел описания КАК УСТАНОВИТЬ одновременно 10 и 8-ю версии

Очень просто, ставьте и всё. Ставятся то они в разные папки. Пробовал сам, работают обе версии.
Автор: Any_utka
Дата сообщения: 01.02.2010 00:44
Столкнулась с такой вот очень неприятной проблемой. При работе в Adobe Acrobat Professional 8.1.2 с любым (!) документом, созданным в FineReader 8.0, не удается извлечь 1-ю страницу: при вызове команды Document -> Extract pages выдается сообщение об ошибке "An incorrect structure was found in the PDF file".
Особенно странно, что трабл проявляется именно с 1-й страницей (почти во всех документах), а последующие страницы (кроме некоторых документов) извлекаются нормально.
Похожее сообщение выдаётся, если добавлять эти документы из FR 8.0 в качестве новых страниц к другому документу, заведомо корректному. Пишет, что "An incorrect structure was found in the PDF file", хотя страницы при этом все-таки добавляются. Но если после этого попытаться извлечь любую из добавленных страниц (не только ту, которая была 1-й в добавленном документе), то опять-таки выдается сообщение An incorrect structure was found in the PDF file.

Причем ошибка выдается именно в родном Acrobat, а, например, в PDF Xchange Viewer с этими же документами никаких проблем не возникает.

Что делать? Страницы извлекать нужно постоянно и именно в Adobe Acrobat, поэтому проблема очень напрягает. Заранее огромное спасибо за помощь!

З.Ы.
В данном случае используется портабельная версия, но вряд ли это имеет значение.
Автор: Antonij72
Дата сообщения: 01.02.2010 05:07

Цитата:

Цитата: Дополнительные языки распознавания для Abbyy FineReader 8.0

Ссылка из шапки не работает. Прошу поделиться.
Автор: bolvanchik
Дата сообщения: 01.02.2010 05:10

Цитата:
Нашел. Но не нашел описания КАК УСТАНОВИТЬ одновременно 10 и 8-ю версии. 10 - стандартно, а 8 - портативную? Или как?


Все версии установлены стандартным способом.
Автор: Antonij72
Дата сообщения: 01.02.2010 05:44
zhe_zho, bolvanchik, установил. Вроде, всё работает. Спасибо!
Автор: Astra55
Дата сообщения: 01.02.2010 06:23
Any_utka

Цитата:
используется портабельная версия

Портабельная версия чего - FR или Акробата? Выложите любой pdf файл с проблемами на обменник, погляжу.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104

Предыдущая тема: filesCatalog


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.