Ну опередили меня
» DjvuOCR
gencho
Ты забыл в шапке указать новую верстю 2.3 - я исправил шапку.
Ты забыл в шапке указать новую верстю 2.3 - я исправил шапку.
После разпознования и ПРАВКИ текста столкнулся с проблемой внедрения OCR
версия 2.3
Invalid FRF format
offset = 00000049
На ВСЕХ страницах прошедших правку
При использовании версии 2.2 beta такой проблемы не обнаружено
То же самое и на другой книге
после правки текста версия 2.3 пишетInvalid FRF format
offset = 00000049
А версия 2.2 beta делает всё на ура
Да забыл сказать в версии 2.3 проблему можно решить по методу ghosty
http://forum.ru-board.com/topic.cgi?forum=5&topic=22673&start=60#21
Цитата:
версия 2.3
Invalid FRF format
offset = 00000049
На ВСЕХ страницах прошедших правку
При использовании версии 2.2 beta такой проблемы не обнаружено
То же самое и на другой книге
после правки текста версия 2.3 пишетInvalid FRF format
offset = 00000049
А версия 2.2 beta делает всё на ура
Да забыл сказать в версии 2.3 проблему можно решить по методу ghosty
http://forum.ru-board.com/topic.cgi?forum=5&topic=22673&start=60#21
Цитата:
Недавно добился желаемого путем написания специального скрипта, которы выделял на каждой странице маленький блок текста и распознавал его (спасибо octopus'у за идею).
BooBoo, подобные ошибки встречались мне как раз при использованиии версии 2.2 beta в режиме "Ручной OCR", а вот в версии 2.3, используя режим "Пакетный OCR", всё сработало хорошо. Возможно, дело в выборе режима? По-моему, где-то в справке я встречал совет от gencho - использовать режим "Пакетный OCR".
shalunov
Вот в том и дело, что ручной OCR в 2.2 beta прекрасно работает,
а в версии 2.3 ни ручной ни пакетный не хотят внедрять OCR "Invalid FRF format
offset = 00000049 "
P.S. ФР - восьмёрка
Вот в том и дело, что ручной OCR в 2.2 beta прекрасно работает,
а в версии 2.3 ни ручной ни пакетный не хотят внедрять OCR "Invalid FRF format
offset = 00000049 "
P.S. ФР - восьмёрка
BooBoo
Давайте FRF файлы на мыло, посмотрю.
Давайте FRF файлы на мыло, посмотрю.
Надо бы добавить немного места для количества страниц при раскодировании дежавюшек. Сейчас все цифры не помещаются, если в книге больше тысячи страниц:
gencho
Можно ли в пакетном режиме вставки текстового слоя указать несколько проектов ФР - по одному для каждой книги?
Если нет, то могли бы вы такую возможность добавить?
Можно ли в пакетном режиме вставки текстового слоя указать несколько проектов ФР - по одному для каждой книги?
Если нет, то могли бы вы такую возможность добавить?
gencho
Что там слышно по поводу версии для FineReader 9.0 724? Очень хотелось бы уже поюзать!
Что там слышно по поводу версии для FineReader 9.0 724? Очень хотелось бы уже поюзать!
Так, извините, долго здесь не был - хотел сказать добрые вести, а получалось наоборот.
Ну, воть, версия DjvuOCR 2.4 beta работающая с FineReader 9 вышла на сайт
Пока BETA версия, надо еще увеличить статистика, но работать можно - я разпознал около 40 книг, хотя однотипные, математические. Не пробовал проверка орфографии, редактирование текста после распознавания - пробуйте Вы. С орфографии впольне вероятно появятся проблемы.
Жду коментарии и файли с ошибки для пополнение статистики.
Там внутри есть файл - README для FR9, там я указал как надо настроить опции, поделился и впечатления. Пока мне вполне достаточно пользоваться FR8.
Ну, воть, версия DjvuOCR 2.4 beta работающая с FineReader 9 вышла на сайт
Пока BETA версия, надо еще увеличить статистика, но работать можно - я разпознал около 40 книг, хотя однотипные, математические. Не пробовал проверка орфографии, редактирование текста после распознавания - пробуйте Вы. С орфографии впольне вероятно появятся проблемы.
Жду коментарии и файли с ошибки для пополнение статистики.
Там внутри есть файл - README для FR9, там я указал как надо настроить опции, поделился и впечатления. Пока мне вполне достаточно пользоваться FR8.
http://forum.ru-board.com/topic.cgi?forum=35&topic=38865&start=1100#lt
Цитата:
gencho
Можно ли учесть это в будующих версиях DjVuOCR?
Цитата:
17 июня, 2008 г.
– Компания ABBYY представляет расширенную версию системы оптического распознавания текста ABBYY FineReader.
-В версию Abbyy FineReader 9.0.0.882 добавлена поддержка дополнительных языков.
Иврит,китайский (традиционный и упрощенного написания),тайский и японский языки.
gencho
Можно ли учесть это в будующих версиях DjVuOCR?
monday2000
если кодировка этих языков внутри FR9 сохраняется как UNICODE, то все должно работать как есть.
если кодировка этих языков внутри FR9 сохраняется как UNICODE, то все должно работать как есть.
gencho
Хочу перевести Хелп (сейчас он только рус. и англ., при чем выбирается галочкой ) как это сделать?
Хочу перевести Хелп (сейчас он только рус. и англ., при чем выбирается галочкой ) как это сделать?
Smokeer
Пока хелп переводится на английский, но дело движется медлено. Там место только для две галочки, вы на каком языке хотите перевести? Дайте мыло в Личное Сообщение, я дам исходник - .RTF файл.
Пока хелп переводится на английский, но дело движется медлено. Там место только для две галочки, вы на каком языке хотите перевести? Дайте мыло в Личное Сообщение, я дам исходник - .RTF файл.
gencho
см.приват
см.приват
Smokeer, принимайте файл.
gencho
Чем именно отличается версия DjvuOCR 2.4 bera R2 от версии DjvuOCR 2.3 - только поддержкой FineReader 9 и всё? Есть ли какие-то улучшения в DjvuOCR 2.4 bera R2 по сравнению с DjvuOCR 2.3 в плане работы с FineReader 8?
"DjvuOCR 2.4 bera R2" - на Вашем сайте опечатка, замените "bera" на "beta".
Чем именно отличается версия DjvuOCR 2.4 bera R2 от версии DjvuOCR 2.3 - только поддержкой FineReader 9 и всё? Есть ли какие-то улучшения в DjvuOCR 2.4 bera R2 по сравнению с DjvuOCR 2.3 в плане работы с FineReader 8?
"DjvuOCR 2.4 bera R2" - на Вашем сайте опечатка, замените "bera" на "beta".
Опечатка давно видел, пусть стоит. Раз вы догадались, то и другие догадаются.
DjvuOCR 2.4 отличается только тем, что добавлена поддержка FineReader 9. Никакое улучшение по отношение FR7/8 нет.
Пока готовится help на english, и через месяц-другой будеть финальная версия 2.4, пока надо еще статистика накопить. Но статистика пока очень положительная, все работает как надо.
DjvuOCR 2.4 отличается только тем, что добавлена поддержка FineReader 9. Никакое улучшение по отношение FR7/8 нет.
Пока готовится help на english, и через месяц-другой будеть финальная версия 2.4, пока надо еще статистика накопить. Но статистика пока очень положительная, все работает как надо.
Подскажите плиз, в DjvuOCR есть такая штука как "Damp picturure`s координаты" как этим пользоваться?
pavel_nik_563, эта штука только выводить координати картинок, если они вам не нужни, никак не можете этим пользоваться.
gencho
Эти данные можно как то вставьть в ScanKromsator?
Эти данные можно как то вставьть в ScanKromsator?
Пока нет.
pavel_nik_563
Цитата:
Попробуйте autoit3-скрипт: http://www.alexrey036.narod.ru/FR2SK_pictures_v1.au3
Цитата:
Эти данные можно как то вставить в ScanKromsator?
Попробуйте autoit3-скрипт: http://www.alexrey036.narod.ru/FR2SK_pictures_v1.au3
U235
Попробую, спасибо
Попробую, спасибо
U235
У меня не получилось, к сожалению. Все делал по инструкции.
У меня не получилось, к сожалению. Все делал по инструкции.
Скоректировал несколько проблем, улучшил работа с FineReader 9.
Release 3 на офф-сайт.
Благодарью всем, кто прислал проблемные файлы.
Release 3 на офф-сайт.
Благодарью всем, кто прислал проблемные файлы.
gencho
А с координатами не получилось? Хотя бы скрипт U235 реализовать, только так, чтобы он работал
А с координатами не получилось? Хотя бы скрипт U235 реализовать, только так, чтобы он работал
ghosty
Пока все с координатами нормально при использование FineReader 8 - настолько, насколько сам FR определяет правильно эти координаты. При файлы с FR 9 могут еще быть проблемы, поэтому и версия beta. Посмотрю как там.
Пока все с координатами нормально при использование FineReader 8 - настолько, насколько сам FR определяет правильно эти координаты. При файлы с FR 9 могут еще быть проблемы, поэтому и версия beta. Посмотрю как там.
gencho
Цитата:
FR9 не оправдал ожиданий И по качеству распознавания оказался хуже FR8.
Цитата:
Пока все с координатами нормально при использование FineReader 8Нет, я, на самом деле, имел в виду возможность прописывать координаты непосредственно в файл *.spt
FR9 не оправдал ожиданий И по качеству распознавания оказался хуже FR8.
Люди, подскажите пожалуйста, какой оптимальный путь для создания Djvu+OCR, если изначально имеются tiff файлы? то есть, надо ли мне сначала сделать из них djvu файл и потом идти "стандартным" путём (DjVu Decoder -> распознать файнридером -> внедрить результат в Djvu файл), или же можно сразу распознать tiff, а потом как-то использовать результат распознавания для создания djvu?
Заранее спасибо за помощь.
Заранее спасибо за помощь.
Предыдущая тема: Программа для проведения crash теста компьютера
Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.