» ABBYY FineReader

Автор: igor32499
Дата сообщения: 23.01.2010 20:15

Ну они же не могут заранее угадать какие надо, какие нет.

Автор: boss911
Дата сообщения: 23.01.2010 20:37

Что-то я совсем запутался. Подскажите, пожалуйста, каике именно файлы нужно удалить, дабы полностью избавиться от группы азиатских языков, то есть от China, Japan и Korea. Удаление файлов Normal.* не дает нужного результата, в списке азиатских языков они все равно присутствуют.

Автор: bolvanchik
Дата сообщения: 23.01.2010 20:57

Цитата:

Ну они же не могут заранее угадать какие надо, какие нет.

Цитата:

Что-то я совсем запутался. Подскажите, пожалуйста, каике именно файлы нужно удалить, дабы полностью избавиться от группы азиатских языков, то есть от China, Japan и Korea. Удаление файлов Normal.* не дает нужного результата, в списке азиатских языков они все равно присутствуют.

запускаем повторную установку (можно из c:\temp, если не удаляли распакованный от предыдущей установки дистрибутив ). выбираем пункт изменить, где добавляем/убираем нужные/ненужные языки.

Автор: boss911
Дата сообщения: 23.01.2010 23:18

bolvanchik

Цитата:

выбираем пункт изменить, где добавляем/убираем нужные/ненужные языки.

Вообще-то я говорил о вырезании файлов из дистрибутива. Да и в выборе компонентов я не вижу пункта "азиатские языки".

Добавлено:

Цитата:

cjk = China Japan Korea

В момент установки я отключил эти три языка, тем не менее, данные файлы все равно были установлены (скопированы). Как это объяснить?

Автор: ALEX72KONIG
Дата сообщения: 24.01.2010 00:05

Всегда использовал для конвертации pdf-txt, scan-txt. А тут оказывается еще и бонус есть:
ABBYY Screenshot Reader - простое в использовании приложение для создания снимков экрана двух типов: "Изображение" и "Текст".
Да и дистрибутив FineReader 10 всего 371 метр....По моему не много...

Автор: bolvanchik
Дата сообщения: 24.01.2010 09:18

Цитата:

В момент установки я отключил эти три языка, тем не менее, данные файлы все равно были установлены (скопированы). Как это объяснить?

мне это и самому непонятно. я вообще всего 5 языков использую: русский, английский немецкий, греческий, простые химические формулы. другие за более чем 10 лет пользования FR мне не пригодились

Автор: ALEX666999
Дата сообщения: 24.01.2010 18:29

bolvanchik обнадёжил, однако тормозное сохранения в режиме "С именами исходных изображений" на билдах выше 10.56 сохранилось

дёрганую анимацию только поправили. Привожу тест:

Пакет - 361 файл
Язык распознавания - английский
Предварительная обработка изображений отключена
Сохранение велось в TXT, в режиме "Сохранять с именами исходных изображений"
Все версии FR Ru-board edition

v10.0.102.105 Corp
время распознавания - дольше на 40% по сравнению с 9.1297
время сохранения результатов в память - 56 секунд
время сохранения результатов на ЖД - 61 секунда
- - - - - - - -
v10.0.102.95 Pro
время распознавания - дольше на 80% по сравнению с 9.1297
время сохранения результатов в память - 57 секунд
время сохранения результатов на ЖД - 62 секунды
- - - - - - - -
v9.1297 Pro
время сохранения результатов в память - 3 секунды
время сохранения результатов на ЖД - 8 секунд

При проверке результатов ошибки распознавания вылезали примерно на тех же местах.
Таким образом, кому важна скорость, особенно при работе с большими пакетами, советую юзать 9-ку последних билдов. 10-ку можно держать в запасе для восточных языков, цифровых снимков с текстом низкого качества и трапециевидными искажениями (тоже ещё нужно проверить, есть ли улучшения).

Автор: ALEX666999
Дата сообщения: 25.01.2010 12:40

Цитата:

JekaKot:
>совместимость по проектам 9-ки есть?
Угу...

Странно... А у меня, вроде, ни в прямую ни в обратную сторону совместимости не было. Ошибка импорта и превед.

Автор: pruss
Дата сообщения: 25.01.2010 23:25

у меня на 10ке преобразует девяткины в свой формат, а обратно нет.
Бесит другое, при распознании не отображаются номера областей на 10ке. и потом при работе в док приходится вручную ставить на свои места, а тексты обычно большие по 500 и более страниц в две-три колонки.

Автор: bolvanchik
Дата сообщения: 26.01.2010 05:03

pruss

Цитата:

Бесит другое, при распознании не отображаются номера областей на 10ке. и потом при работе в док приходится вручную ставить на свои места, а тексты обычно большие по 500 и более страниц в две-три колонки.

отображаются. правда только в свойствах области (нужно развернуть, если закрыто)

Автор: Andr31
Дата сообщения: 27.01.2010 21:34

У меня всегда при распознавании текста получается шрифт 32 размера (текст сфоткан мобилой). Как установить постоянный размер шрифта по умолчанию? Использую FR 10.

Автор: masgak
Дата сообщения: 28.01.2010 10:10

Скажите где можно скачать отдельно языки распознования? в шапке по ссылкам иду там че то не то.
нужен арабский язык, скиньте плиз у кого есть.

Автор: bolvanchik
Дата сообщения: 28.01.2010 11:13

Цитата:

Скажите где можно скачать отдельно языки распознования? в шапке по ссылкам иду там че то не то.
нужен арабский язык, скиньте плиз у кого есть.

Все дополнительные языки находятся по адресу
http://www.abbyy.ru/finereader/recognition_langauges/
Арабского пока среди них нет

Автор: Baggio5555
Дата сообщения: 30.01.2010 19:41

Счас провел мини тест распознавания странички в 8,9 и 10-ке. Всего 2092 символа.
Неуверенно распознанных:
8.0.0.11.26 Corp - 4 символа
9.0.0.10.42 Corp - 20 символов
10.0.102.105 Corp - 73 символа
Чё за херня?
В 10 выкинули моё любимое разрешение 200 dpi из настроек сканирования через интерфейс проги. И не могу найти опцию "Привести серые/цветные изображения к черно-белым". В топку, короче.

Автор: bolvanchik
Дата сообщения: 30.01.2010 21:14

Цитата:

Счас провел мини тест распознавания странички в 8,9 и 10-ке. Всего 2092 символа.
Неуверенно распознанных:
8.0.0.11.26 Corp - 4 символа
9.0.0.10.42 Corp - 20 символов
10.0.102.105 Corp - 73 символа

В принципе об это уже обсудили выше. У 8-ки сильная сторона - распознавание, даже на сканах с малым разрешением. а у 10-ки лучшее "понимание" структуры страницы

Автор: Antonij72
Дата сообщения: 31.01.2010 07:16

А 2 эти версии (8 и 10) можно одновременно установить как-нибудь?

Автор: bolvanchik
Дата сообщения: 31.01.2010 08:20

Цитата:

А 2 эти версии (8 и 10) можно одновременно установить как-нибудь?

можно. мешать друг другу не будут. это обсуждалось выше

Автор: Astra55
Дата сообщения: 31.01.2010 08:27

bolvanchik

Цитата:

У 8-ки сильная сторона - распознавание, даже на сканах с малым разрешением. а у 10-ки лучшее "понимание" структуры страницы

Значит, готовьте бабки на 11-ю и последующие версии

В них опять улучшится распознавание и ухудшится анализ. Бесконечный цикл развода лохов.
Жил-был поп.
У попа был двор.
На дворе был кол.
На колу было мочало.
Не сказать ли все с начала?

Автор: bolvanchik
Дата сообщения: 31.01.2010 09:21

Цитата:

Значит, готовьте бабки на 11-ю и последующие версии...

свою лиц покупал только для использования на работе. что бы "добрые" проверяющие много вопросов не задавали.

Автор: JekaKot
Дата сообщения: 31.01.2010 14:44

bolvanchik

Цитата:

В принципе об это уже обсудили выше. У 8-ки сильная сторона - распознавание, даже на сканах с малым разрешением. а у 10-ки лучшее "понимание" структуры страницы

Вот сейчас и убеждаюсь в этом же: сижу распознаю отсканированные листинги (LISPы). Сами понимаете - это не ошибка в обычном документе, тут важна точность распознавания (отлов опечаток при трассировке готового LISP - занятие не для слабонервных).

Качество отсканированного материала - отличное (распечатка из Блокнота на хорошем принтере, четкость в внорме), но 10-ка категорически не различает "(" и "С", путает "1" и "l" (знаю, шрифт Lucida Concole не самый простой для распознавания, но 8-ка ошибается НАМНОГО реже). Да и создание ненужной мне структуры из блоков (кто, спрашивается, просил?) распознанного текста - не нужно...

9-ка, и, особенно, 10-ка - просто "стрижка купонов" - реальных улучшений НЕТ!
(Сложное редактирование отсканированного варианта проще решать, например, в ACDSee Pro 3.0 (повороты/искажения/цветности и пр.), в том же Paint некоторую мелкую ретушь наводить). Короче, поставил 8-ку и понял - "старичок" еще хоть куда ...

10-ка стоит лишь для сравнения (на всякий случай), но пока проигрывает в точности распознавания (скорость тоже хромает)

Автор: Antonij72
Дата сообщения: 31.01.2010 16:46

Цитата:

Цитата:А 2 эти версии (8 и 10) можно одновременно установить как-нибудь?

можно. мешать друг другу не будут. это обсуждалось выше

Прошу тыкнуть носом. Не нашел.

Автор: bolvanchik
Дата сообщения: 31.01.2010 18:15

Цитата:

Прошу тыкнуть носом. Не нашел.

точно не скажу. там где велся разговор о тестировании (о скорости распознавания и передачи), где я приводил данные по 8,9,10 версию (они у меня все установлены). я даже приводил скрины. можно открыть версию для печати и ввести мой ник

или слово Onlinedisk - именно на него я выкладывал скрины с результатми тестирования по каждой версии

p.s. что бы окончательно поставить в этом вопросе точку, вот Скрин

Автор: Dashout
Дата сообщения: 31.01.2010 19:27

на всякий случай ссылка на восьмерку (8.0.0.731)
http://forum.ru-board.com/topic.cgi?forum=35&topic=43852&start=2000#4

Автор: Antonij72
Дата сообщения: 31.01.2010 21:55

Цитата:

Дополнительные языки распознавания для Abbyy FineReader 8.0

Ссылка из шапки не работает. Прошу поделиться.

Добавлено:

Цитата:

точно не скажу. там где велся разговор о тестировании (о скорости распознавания и передачи), где я приводил данные по 8,9,10 версию (они у меня все установлены). я даже приводил скрины. можно открыть версию для печати и ввести мой ник или слово Onlinedisk - именно на него я выкладывал скрины с результатми тестирования по каждой версии

Нашел. Но не нашел описания КАК УСТАНОВИТЬ одновременно 10 и 8-ю версии. 10 - стандартно, а 8 - портативную? Или как?

Автор: zhe_zho
Дата сообщения: 01.02.2010 00:34

Цитата:

Но не нашел описания КАК УСТАНОВИТЬ одновременно 10 и 8-ю версии

Очень просто, ставьте и всё. Ставятся то они в разные папки. Пробовал сам, работают обе версии.

Автор: Any_utka
Дата сообщения: 01.02.2010 00:44

Столкнулась с такой вот очень неприятной проблемой. При работе в Adobe Acrobat Professional 8.1.2 с любым (!) документом, созданным в FineReader 8.0, не удается извлечь 1-ю страницу: при вызове команды Document -> Extract pages выдается сообщение об ошибке "An incorrect structure was found in the PDF file".
Особенно странно, что трабл проявляется именно с 1-й страницей (почти во всех документах), а последующие страницы (кроме некоторых документов) извлекаются нормально.
Похожее сообщение выдаётся, если добавлять эти документы из FR 8.0 в качестве новых страниц к другому документу, заведомо корректному. Пишет, что "An incorrect structure was found in the PDF file", хотя страницы при этом все-таки добавляются. Но если после этого попытаться извлечь любую из добавленных страниц (не только ту, которая была 1-й в добавленном документе), то опять-таки выдается сообщение An incorrect structure was found in the PDF file.

Причем ошибка выдается именно в родном Acrobat, а, например, в PDF Xchange Viewer с этими же документами никаких проблем не возникает.

Что делать? Страницы извлекать нужно постоянно и именно в Adobe Acrobat, поэтому проблема очень напрягает. Заранее огромное спасибо за помощь!

З.Ы.
В данном случае используется портабельная версия, но вряд ли это имеет значение.

Автор: Antonij72
Дата сообщения: 01.02.2010 05:07

Цитата:

Цитата: Дополнительные языки распознавания для Abbyy FineReader 8.0

Ссылка из шапки не работает. Прошу поделиться.

Автор: bolvanchik
Дата сообщения: 01.02.2010 05:10

Цитата:

Нашел. Но не нашел описания КАК УСТАНОВИТЬ одновременно 10 и 8-ю версии. 10 - стандартно, а 8 - портативную? Или как?

Все версии установлены стандартным способом.

Автор: Antonij72
Дата сообщения: 01.02.2010 05:44

zhe_zho, bolvanchik, установил. Вроде, всё работает. Спасибо!

Автор: Astra55
Дата сообщения: 01.02.2010 06:23

Any_utka

Цитата:

используется портабельная версия

Портабельная версия чего - FR или Акробата? Выложите любой pdf файл с проблемами на обменник, погляжу.

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104

Предыдущая тема: filesCatalog

Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.