Ru-Board.club
← Вернуться в раздел «Программы»

» DjvuOCR

Автор: StanFreeWare
Дата сообщения: 02.08.2011 20:21
denver 22
Разбирались полтора года назад в этой теме с FR9 - там несколько проблем нашлось. Одну - перетасовку страниц из-за многопоточности удалось даже решить (утилита FR9frfPatch в шапке). Но все равно какие-то еще косяки остались. Короче, я тоже на FR8 остановился в итоге.
Автор: antabu
Дата сообщения: 07.11.2011 06:36
У меня версия 8 портабельная, поэтому без хелпа. В пакете создаёт двухстраничные .tif, на второй странице - миниатюра. Для сборки .djvu приходится прогонять через IrfanView, хоть и быстрая операция, но явно лишняя. Как настроить на одностраничные тифы?
Автор: vladlen666
Дата сообщения: 14.11.2011 03:08
StanFreeWare
А что мешает
1. распознать Djvu-книгу в FR10 или FR11 и
2. сохранить в PDF (обязательно сохранив РАЗМЕР ОРИГИНАЛА, а тип выбрать ТОЛЬКО ТЕКСТ И КАРТИНКИ),
3. затем перегнать PDF в Djvu (не знаю как сразу извлечь OCR без пересохранения его в Djvu, программа для экспорта Pdftodjvu Light Edition),
4. Извлечь из полученного файла OCR с помощью DjvuOCR
5. и внедрить в первоначальную Djvu-книгу.

FR 11, вроде как умеет сохранять в DJVU, но я еще не пробовал эту версию. По отзывам делает он это через задницу.
Автор: ycheff
Дата сообщения: 14.11.2011 16:23

Цитата:
1. распознать Djvu-книгу в FR10 или FR11 и
2. сохранить в PDF

Получится полная ерунда. Так можно действовать только с текстами без формул.
Из-за подобных действий в сети часто появляются книги в крокозябликами в формулах и на рисунках.
Автор: vladlen666
Дата сообщения: 15.11.2011 10:57
ycheff
А я с вами не спорю. Я же говорю просто о внедрение OCR в DJVU-книгу. Есть к примеру DjVU книга, а вам хочется внедрить в нее OCR. Программа DjvuOCR стабильно работает только с FR8, в то время как качество распознавания у FR9,10 заметно лучше. Вот тут мне и приходит на помощь формат PDF, только затем чтобы выдернуть из него распознанный файнридером текст и вернуть его моей DJVU-книге.

Короче говоря я хотел обратить внимание как можно с помощью FR9 и 10 и DjvuOCR внедрить OCR в Djvu книгу. При этом если FR11 сохраняет DJVU c OCR, можно видимо вообще обойтись без PDF. Собственно Djvu книгу созданная FR11, как я слышал вызывает много нареканий. Но видимо ничто не помещает вытаскивать из этих файлов OCR и внедрять в Djvu-книги созданные в других программах.
Автор: U235
Дата сообщения: 15.11.2011 15:41
vladlen666
Вопрос переноса текстового слоя из pdf в djvu уже обсуждался на 10 странице топика..
И на форуме ФР http://finereader.abbyy.ru/forum/actualthread.aspx?bid=7&tid=344&pg=33
Автор: antabu
Дата сообщения: 20.12.2011 17:24
Как должна решаться проблема пустых страниц?
Автор: vladlen666
Дата сообщения: 17.03.2012 05:17
Подскажите как решить проблему.
У меня стоит FR11, с этой версией DjvuOCR не работает.
Поэтому до недавнего времени я поступал так. Распознавал созданный DjVU и сохранял новый файл. Так как создаваемый FR файл меня не устраивает я извлекаю из него OCR слой с помощью DjvuOCR и внедряю в предыдущий исходный файл.

Все казалось бы ОК. Но тут оказалось что OCR в создаваемом FR DjVU-файле имеет тип (так кажется это называется) СТРОКА. А мне кается оптимальным тип OCR - СЛОВО. При внедрении OCR из проекта FR в DjVU-файл в программе есть возможность выбора типа OCR (СТРОКА, СЛОВО, СИМВОЛ), а вот при внедрении OCR в виде txt файла этого пункта нет.

Можно ли что-то сделать. В настройках FR я ничего не нашел.
Автор: vladlen666
Дата сообщения: 09.04.2012 00:34
Говорят пословный OCR в последней версии fr11 то есть надо установить посл. версию.
Автор: Dimi7777
Дата сообщения: 12.02.2013 20:55

Цитата:
Как должна решаться проблема пустых страниц?

у меня тот же вопрос

Если в djvu файле попадаются пустые страницы, возникают проблемы, как с этим бороться?
Автор: ghosty
Дата сообщения: 12.02.2013 21:25
Dimi7777
Какого рода проблемы?
Автор: VadimirTT
Дата сообщения: 12.02.2013 21:33
Dimi7777
В случае пустой страницы, прога ругается и не извлекает страницу. Я тупо сохраняю пустую страницу из другой программы.
Может существует нормальное решение проблемы? Мелочь, а не приятно.
Автор: ghosty
Дата сообщения: 12.02.2013 23:01
VadimirTT
У меня никогда такого не было. Потом, что значит "пустая страница". Все страницы, включая пустые должны присутствовать в пакете FR, тогда все должно быть нормально. Пользоваться лучше 8-м FR.
Автор: VadimirTT
Дата сообщения: 13.02.2013 17:11
ghosty
Имелось ввиду роспуск книги на тифы с помощью DjvuOCR
Автор: mixail00003
Дата сообщения: 02.10.2013 22:24
Скиньте пож. ключ к abbyy finereader 9.0.724
Автор: Maikl65
Дата сообщения: 03.10.2013 06:50

Цитата:
Скиньте пож. ключ к abbyy finereader 9.0.724

С такими просьбами обращайтесь в Варезник, в программной ветке такие просьбы - моветон.
Оффтоп: Впрочем, и там вряд ли кто ключ даст в силу особенностей регистрации продукта. Максимум - патч.
Автор: donbaton
Дата сообщения: 11.09.2014 05:53
Здравствуйте. В справке есть такой текст:

Цитата:
Обязательно нажимаем пункт меню "File/Close batch", иначе не все файлы
правильно записываются на диск. А именно, если некоторая страница помечена
в окне thumbnails, то она не будет записана на диск. Тогда можно пометить
другую страницу и тогда первая будет записана.


Дело в том, что увидел этот текст через много месяцев (а может и лет) после начала пользования программой. К тому же множество документов, скачанных из интернета, то же возможно с частично урезанным текстом. Заметил, что потери могут достигать больших размеров.

Не существует ли программы, которая автоматически обойдет директории, и выявит страницы документов, к которым отсутствует распознанное содержимое?
Автор: renoex
Дата сообщения: 12.09.2014 23:33
Invalid FRF format
[22] offset=000000CF

FR9.0.724
djvuOCR 2.4bR4

реально проделал адский спеллчек
только для того чтобы так попасть на еррор..
help!
Автор: amaid
Дата сообщения: 13.09.2014 07:08
у меня тоже эта связка не сработала. Может, стоило бы выложить конкретно тот дистрибутив 9-го файна, который согласился сотрудничать с DjvuOCR, в обменник?

Добавлено:
впрочем, с выходом 12-й версии файна особого смысла париться с девяткой не вижу.
12-й научился делать отличные djvu (косяки текстового слоя мигом правит Crutch) и практически не уступает девятке в качестве OCR.
Автор: renoex
Дата сообщения: 13.09.2014 10:10
да это засада, грёбаные проприетарщики
в 11 импортируется только лишь растр
весь спелчек и рекогнайз делать once again??
есть реальная версия какая под эту софтину?
Автор: amaid
Дата сообщения: 13.09.2014 10:35
Плюнь на 11, это отстой, работай в 12 файне. Спелчек придется повторить заново, если только не найдешь версию девятки, совместимую с DjvuOCR.
Кстати в 12-м файне появилась опция ограничения OCR одним процессором. Если бы в девятке такая опция была, DjvuOCR работал бы без проблем.
Автор: donbaton
Дата сообщения: 22.09.2014 22:05
Подскажите, как работать с Finereader 9 в связке с OCRDJVU?
Автор: donbaton
Дата сообщения: 23.01.2015 12:49
Появились дополнительные справка и программы автоматизации к DjvuOcr
http://vedomo.ru/a/s/paketnaia/DjvuOCRspravka.html
Автор: donbaton
Дата сообщения: 31.05.2015 07:49
Вопросы по командной строке:
А как выглядит полная командная строка для создания пакета для Finereader 8?
И для прописывания распознанного текста в DJVU?
Автор: AlexeiKozlov
Дата сообщения: 27.06.2015 18:48
народ , поскажите мне в таком деле:
у меня djvu с ocr.
как мне выдрать этот ocr ?
потому что сам скан довольно не качественный и хочется почитать на нормальном шрифте.
Автор: VadimirTT
Дата сообщения: 27.06.2015 19:50
AlexeiKozlov
Так ведь в DjvuOCR есть кнопка Extract OCR layers
Автор: AlexeiKozlov
Дата сообщения: 27.06.2015 21:39
VadimirTT
спасибо. сейчас попробую.


попробовал. получаю txt файл с содержимым:
select; remove-txt
save


и все. ничего не извлекается.
Автор: VadimirTT
Дата сообщения: 27.06.2015 22:09
AlexeiKozlov
Попробовал, извлекается, но читать это невозможно, полностью потеряно форматирование.
Мой совет, перераспознайте вашу книжку файнридером.
Автор: AlexeiKozlov
Дата сообщения: 27.06.2015 22:12
VadimirTT
да уж пробовал им.
только вот как то долго и криво все выходит.
не понимаю, fr не видит ocr слоя?
он распознает с ошибками.\

может есть где инструкция как djvu в fr перевести ?
Автор: lemor
Дата сообщения: 11.01.2016 00:38
amaid

Цитата:
12-й научился делать отличные djvu

Качество изображения выходного djvu файла значительно хуже djvu оригинала.

Страницы: 1234567891011

Предыдущая тема: Программа для проведения crash теста компьютера


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.