Ну они же не могут заранее угадать какие надо, какие нет.
» ABBYY FineReader
Что-то я совсем запутался. Подскажите, пожалуйста, каике именно файлы нужно удалить, дабы полностью избавиться от группы азиатских языков, то есть от China, Japan и Korea. Удаление файлов Normal.* не дает нужного результата, в списке азиатских языков они все равно присутствуют.
Цитата:
Ну они же не могут заранее угадать какие надо, какие нет.
Цитата:
Что-то я совсем запутался. Подскажите, пожалуйста, каике именно файлы нужно удалить, дабы полностью избавиться от группы азиатских языков, то есть от China, Japan и Korea. Удаление файлов Normal.* не дает нужного результата, в списке азиатских языков они все равно присутствуют.
запускаем повторную установку (можно из c:\temp, если не удаляли распакованный от предыдущей установки дистрибутив ). выбираем пункт изменить, где добавляем/убираем нужные/ненужные языки.
bolvanchik
Цитата:
Вообще-то я говорил о вырезании файлов из дистрибутива. Да и в выборе компонентов я не вижу пункта "азиатские языки".
Добавлено:
Цитата:
В момент установки я отключил эти три языка, тем не менее, данные файлы все равно были установлены (скопированы). Как это объяснить?
Цитата:
выбираем пункт изменить, где добавляем/убираем нужные/ненужные языки.
Вообще-то я говорил о вырезании файлов из дистрибутива. Да и в выборе компонентов я не вижу пункта "азиатские языки".
Добавлено:
Цитата:
cjk = China Japan Korea
В момент установки я отключил эти три языка, тем не менее, данные файлы все равно были установлены (скопированы). Как это объяснить?
Всегда использовал для конвертации pdf-txt, scan-txt. А тут оказывается еще и бонус есть:
ABBYY Screenshot Reader - простое в использовании приложение для создания снимков экрана двух типов: "Изображение" и "Текст".
Да и дистрибутив FineReader 10 всего 371 метр....По моему не много...
ABBYY Screenshot Reader - простое в использовании приложение для создания снимков экрана двух типов: "Изображение" и "Текст".
Да и дистрибутив FineReader 10 всего 371 метр....По моему не много...
Цитата:
В момент установки я отключил эти три языка, тем не менее, данные файлы все равно были установлены (скопированы). Как это объяснить?
мне это и самому непонятно. я вообще всего 5 языков использую: русский, английский немецкий, греческий, простые химические формулы. другие за более чем 10 лет пользования FR мне не пригодились
bolvanchik обнадёжил, однако тормозное сохранения в режиме "С именами исходных изображений" на билдах выше 10.56 сохранилось дёрганую анимацию только поправили. Привожу тест:
Пакет - 361 файл
Язык распознавания - английский
Предварительная обработка изображений отключена
Сохранение велось в TXT, в режиме "Сохранять с именами исходных изображений"
Все версии FR Ru-board edition
v10.0.102.105 Corp
время распознавания - дольше на 40% по сравнению с 9.1297
время сохранения результатов в память - 56 секунд
время сохранения результатов на ЖД - 61 секунда
- - - - - - - -
v10.0.102.95 Pro
время распознавания - дольше на 80% по сравнению с 9.1297
время сохранения результатов в память - 57 секунд
время сохранения результатов на ЖД - 62 секунды
- - - - - - - -
v9.1297 Pro
время сохранения результатов в память - 3 секунды
время сохранения результатов на ЖД - 8 секунд
При проверке результатов ошибки распознавания вылезали примерно на тех же местах.
Таким образом, кому важна скорость, особенно при работе с большими пакетами, советую юзать 9-ку последних билдов. 10-ку можно держать в запасе для восточных языков, цифровых снимков с текстом низкого качества и трапециевидными искажениями (тоже ещё нужно проверить, есть ли улучшения).
Пакет - 361 файл
Язык распознавания - английский
Предварительная обработка изображений отключена
Сохранение велось в TXT, в режиме "Сохранять с именами исходных изображений"
Все версии FR Ru-board edition
v10.0.102.105 Corp
время распознавания - дольше на 40% по сравнению с 9.1297
время сохранения результатов в память - 56 секунд
время сохранения результатов на ЖД - 61 секунда
- - - - - - - -
v10.0.102.95 Pro
время распознавания - дольше на 80% по сравнению с 9.1297
время сохранения результатов в память - 57 секунд
время сохранения результатов на ЖД - 62 секунды
- - - - - - - -
v9.1297 Pro
время сохранения результатов в память - 3 секунды
время сохранения результатов на ЖД - 8 секунд
При проверке результатов ошибки распознавания вылезали примерно на тех же местах.
Таким образом, кому важна скорость, особенно при работе с большими пакетами, советую юзать 9-ку последних билдов. 10-ку можно держать в запасе для восточных языков, цифровых снимков с текстом низкого качества и трапециевидными искажениями (тоже ещё нужно проверить, есть ли улучшения).
Цитата:
JekaKot:
>совместимость по проектам 9-ки есть?
Угу...
Странно... А у меня, вроде, ни в прямую ни в обратную сторону совместимости не было. Ошибка импорта и превед.
у меня на 10ке преобразует девяткины в свой формат, а обратно нет.
Бесит другое, при распознании не отображаются номера областей на 10ке. и потом при работе в док приходится вручную ставить на свои места, а тексты обычно большие по 500 и более страниц в две-три колонки.
Бесит другое, при распознании не отображаются номера областей на 10ке. и потом при работе в док приходится вручную ставить на свои места, а тексты обычно большие по 500 и более страниц в две-три колонки.
pruss
Цитата:
отображаются. правда только в свойствах области (нужно развернуть, если закрыто)
Цитата:
Бесит другое, при распознании не отображаются номера областей на 10ке. и потом при работе в док приходится вручную ставить на свои места, а тексты обычно большие по 500 и более страниц в две-три колонки.
отображаются. правда только в свойствах области (нужно развернуть, если закрыто)
У меня всегда при распознавании текста получается шрифт 32 размера (текст сфоткан мобилой). Как установить постоянный размер шрифта по умолчанию? Использую FR 10.
Скажите где можно скачать отдельно языки распознования? в шапке по ссылкам иду там че то не то.
нужен арабский язык, скиньте плиз у кого есть.
нужен арабский язык, скиньте плиз у кого есть.
Цитата:
Скажите где можно скачать отдельно языки распознования? в шапке по ссылкам иду там че то не то.
нужен арабский язык, скиньте плиз у кого есть.
Все дополнительные языки находятся по адресу
http://www.abbyy.ru/finereader/recognition_langauges/
Арабского пока среди них нет
Счас провел мини тест распознавания странички в 8,9 и 10-ке. Всего 2092 символа.
Неуверенно распознанных:
8.0.0.11.26 Corp - 4 символа
9.0.0.10.42 Corp - 20 символов
10.0.102.105 Corp - 73 символа
Чё за херня?
В 10 выкинули моё любимое разрешение 200 dpi из настроек сканирования через интерфейс проги. И не могу найти опцию "Привести серые/цветные изображения к черно-белым". В топку, короче.
Неуверенно распознанных:
8.0.0.11.26 Corp - 4 символа
9.0.0.10.42 Corp - 20 символов
10.0.102.105 Corp - 73 символа
Чё за херня?
В 10 выкинули моё любимое разрешение 200 dpi из настроек сканирования через интерфейс проги. И не могу найти опцию "Привести серые/цветные изображения к черно-белым". В топку, короче.
Цитата:
Счас провел мини тест распознавания странички в 8,9 и 10-ке. Всего 2092 символа.
Неуверенно распознанных:
8.0.0.11.26 Corp - 4 символа
9.0.0.10.42 Corp - 20 символов
10.0.102.105 Corp - 73 символа
В принципе об это уже обсудили выше. У 8-ки сильная сторона - распознавание, даже на сканах с малым разрешением. а у 10-ки лучшее "понимание" структуры страницы
А 2 эти версии (8 и 10) можно одновременно установить как-нибудь?
Цитата:
А 2 эти версии (8 и 10) можно одновременно установить как-нибудь?
можно. мешать друг другу не будут. это обсуждалось выше
bolvanchik
Цитата:
Значит, готовьте бабки на 11-ю и последующие версии В них опять улучшится распознавание и ухудшится анализ. Бесконечный цикл развода лохов.
Жил-был поп.
У попа был двор.
На дворе был кол.
На колу было мочало.
Не сказать ли все с начала?
Цитата:
У 8-ки сильная сторона - распознавание, даже на сканах с малым разрешением. а у 10-ки лучшее "понимание" структуры страницы
Значит, готовьте бабки на 11-ю и последующие версии В них опять улучшится распознавание и ухудшится анализ. Бесконечный цикл развода лохов.
Жил-был поп.
У попа был двор.
На дворе был кол.
На колу было мочало.
Не сказать ли все с начала?
Цитата:
Значит, готовьте бабки на 11-ю и последующие версии...
свою лиц покупал только для использования на работе. что бы "добрые" проверяющие много вопросов не задавали.
bolvanchik
Цитата:
Вот сейчас и убеждаюсь в этом же: сижу распознаю отсканированные листинги (LISPы). Сами понимаете - это не ошибка в обычном документе, тут важна точность распознавания (отлов опечаток при трассировке готового LISP - занятие не для слабонервных).
Качество отсканированного материала - отличное (распечатка из Блокнота на хорошем принтере, четкость в внорме), но 10-ка категорически не различает "(" и "С", путает "1" и "l" (знаю, шрифт Lucida Concole не самый простой для распознавания, но 8-ка ошибается НАМНОГО реже). Да и создание ненужной мне структуры из блоков (кто, спрашивается, просил?) распознанного текста - не нужно...
9-ка, и, особенно, 10-ка - просто "стрижка купонов" - реальных улучшений НЕТ!
(Сложное редактирование отсканированного варианта проще решать, например, в ACDSee Pro 3.0 (повороты/искажения/цветности и пр.), в том же Paint некоторую мелкую ретушь наводить). Короче, поставил 8-ку и понял - "старичок" еще хоть куда ...
10-ка стоит лишь для сравнения (на всякий случай), но пока проигрывает в точности распознавания (скорость тоже хромает)
Цитата:
В принципе об это уже обсудили выше. У 8-ки сильная сторона - распознавание, даже на сканах с малым разрешением. а у 10-ки лучшее "понимание" структуры страницы
Вот сейчас и убеждаюсь в этом же: сижу распознаю отсканированные листинги (LISPы). Сами понимаете - это не ошибка в обычном документе, тут важна точность распознавания (отлов опечаток при трассировке готового LISP - занятие не для слабонервных).
Качество отсканированного материала - отличное (распечатка из Блокнота на хорошем принтере, четкость в внорме), но 10-ка категорически не различает "(" и "С", путает "1" и "l" (знаю, шрифт Lucida Concole не самый простой для распознавания, но 8-ка ошибается НАМНОГО реже). Да и создание ненужной мне структуры из блоков (кто, спрашивается, просил?) распознанного текста - не нужно...
9-ка, и, особенно, 10-ка - просто "стрижка купонов" - реальных улучшений НЕТ!
(Сложное редактирование отсканированного варианта проще решать, например, в ACDSee Pro 3.0 (повороты/искажения/цветности и пр.), в том же Paint некоторую мелкую ретушь наводить). Короче, поставил 8-ку и понял - "старичок" еще хоть куда ...
10-ка стоит лишь для сравнения (на всякий случай), но пока проигрывает в точности распознавания (скорость тоже хромает)
Цитата:
Цитата:А 2 эти версии (8 и 10) можно одновременно установить как-нибудь?
можно. мешать друг другу не будут. это обсуждалось выше
Прошу тыкнуть носом. Не нашел.
Цитата:
Прошу тыкнуть носом. Не нашел.
точно не скажу. там где велся разговор о тестировании (о скорости распознавания и передачи), где я приводил данные по 8,9,10 версию (они у меня все установлены). я даже приводил скрины. можно открыть версию для печати и ввести мой ник или слово Onlinedisk - именно на него я выкладывал скрины с результатми тестирования по каждой версии
p.s. что бы окончательно поставить в этом вопросе точку, вот Скрин
на всякий случай ссылка на восьмерку (8.0.0.731)
http://forum.ru-board.com/topic.cgi?forum=35&topic=43852&start=2000#4
http://forum.ru-board.com/topic.cgi?forum=35&topic=43852&start=2000#4
Цитата:
Дополнительные языки распознавания для Abbyy FineReader 8.0
Ссылка из шапки не работает. Прошу поделиться.
Добавлено:
Цитата:
точно не скажу. там где велся разговор о тестировании (о скорости распознавания и передачи), где я приводил данные по 8,9,10 версию (они у меня все установлены). я даже приводил скрины. можно открыть версию для печати и ввести мой ник или слово Onlinedisk - именно на него я выкладывал скрины с результатми тестирования по каждой версии
Нашел. Но не нашел описания КАК УСТАНОВИТЬ одновременно 10 и 8-ю версии. 10 - стандартно, а 8 - портативную? Или как?
Цитата:
Но не нашел описания КАК УСТАНОВИТЬ одновременно 10 и 8-ю версии
Очень просто, ставьте и всё. Ставятся то они в разные папки. Пробовал сам, работают обе версии.
Столкнулась с такой вот очень неприятной проблемой. При работе в Adobe Acrobat Professional 8.1.2 с любым (!) документом, созданным в FineReader 8.0, не удается извлечь 1-ю страницу: при вызове команды Document -> Extract pages выдается сообщение об ошибке "An incorrect structure was found in the PDF file".
Особенно странно, что трабл проявляется именно с 1-й страницей (почти во всех документах), а последующие страницы (кроме некоторых документов) извлекаются нормально.
Похожее сообщение выдаётся, если добавлять эти документы из FR 8.0 в качестве новых страниц к другому документу, заведомо корректному. Пишет, что "An incorrect structure was found in the PDF file", хотя страницы при этом все-таки добавляются. Но если после этого попытаться извлечь любую из добавленных страниц (не только ту, которая была 1-й в добавленном документе), то опять-таки выдается сообщение An incorrect structure was found in the PDF file.
Причем ошибка выдается именно в родном Acrobat, а, например, в PDF Xchange Viewer с этими же документами никаких проблем не возникает.
Что делать? Страницы извлекать нужно постоянно и именно в Adobe Acrobat, поэтому проблема очень напрягает. Заранее огромное спасибо за помощь!
З.Ы.
В данном случае используется портабельная версия, но вряд ли это имеет значение.
Особенно странно, что трабл проявляется именно с 1-й страницей (почти во всех документах), а последующие страницы (кроме некоторых документов) извлекаются нормально.
Похожее сообщение выдаётся, если добавлять эти документы из FR 8.0 в качестве новых страниц к другому документу, заведомо корректному. Пишет, что "An incorrect structure was found in the PDF file", хотя страницы при этом все-таки добавляются. Но если после этого попытаться извлечь любую из добавленных страниц (не только ту, которая была 1-й в добавленном документе), то опять-таки выдается сообщение An incorrect structure was found in the PDF file.
Причем ошибка выдается именно в родном Acrobat, а, например, в PDF Xchange Viewer с этими же документами никаких проблем не возникает.
Что делать? Страницы извлекать нужно постоянно и именно в Adobe Acrobat, поэтому проблема очень напрягает. Заранее огромное спасибо за помощь!
З.Ы.
В данном случае используется портабельная версия, но вряд ли это имеет значение.
Цитата:
Цитата: Дополнительные языки распознавания для Abbyy FineReader 8.0
Ссылка из шапки не работает. Прошу поделиться.
Цитата:
Нашел. Но не нашел описания КАК УСТАНОВИТЬ одновременно 10 и 8-ю версии. 10 - стандартно, а 8 - портативную? Или как?
Все версии установлены стандартным способом.
zhe_zho, bolvanchik, установил. Вроде, всё работает. Спасибо!
Any_utka
Цитата:
Портабельная версия чего - FR или Акробата? Выложите любой pdf файл с проблемами на обменник, погляжу.
Цитата:
используется портабельная версия
Портабельная версия чего - FR или Акробата? Выложите любой pdf файл с проблемами на обменник, погляжу.
Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104
Предыдущая тема: filesCatalog
Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.