Ru-Board.club
← Вернуться в раздел «Программы»

» Как выделить текст из книг в формате Djvu?

Автор: sanek1106
Дата сообщения: 24.03.2005 22:24
У меня есть книги, написанные в этом сканированном формате, нужно выделить текст из этого формата, но почему-то кнопка "выделить текст" всё время неактивна, хотя очень надо выделить текст для копирования его в word ( книга читалась из плагина Lizardtech), какую угодно книгу я бы не открыл, она всё время неактивна ( хотя я пытался открывать данные книги и с помощью даже другой проги Djvureader - всё равно ничего не помогает). Может кто знает в чём проблема данных граблей, как всё- таки выделить этот пресловутый текст, не применяя муторную операцию перегона каждой страницы книги-djvu в bmp, а затем распознавать Finereader
Автор: arsvrn
Дата сообщения: 24.03.2005 23:06
sanek1106
В файлах формата DjVu нет никакого текста. Там только графическая информация. А сильное сжатие достигается за счет того, что разделяются фон и все остальное. Затем фон сжимается с низким качеством (но сильно), а остальное (все похожее на текст) - с более высоким качеством (но с меньшим сжатием).
Автор: almedic
Дата сообщения: 14.06.2005 15:16
Делал только через ... через как обычно. Сохранял каждую страницу в .bmp, затем Finereader. Искал нечто для автоматизации этого процесса долго. Нашел. Пиши рецепт:
Отпечатываешь эту книжку, затем через сканер. По другому никак не получается. Такая бодяга.
Хорошо, если есть на работе доступ к лазернику (у меня был... недолго).
ИМХО, изврат, книжки в Djvu делать. Быстро, конечно, править не надо. Картинки сразу, то-сё. Но читать погано и вообще плохо. Только отпечатывать.
Автор: Blackbox7
Дата сообщения: 15.06.2005 19:29
sanek1106
Рекомендую сходить на _http://irodov.nm.ru/cgi-bin/ikonboard/topic.cgi?forum=3&topic=2&start=10.
Там есть даже: FRFGrab v.1.09 + Djvused - связка программ позволяющая подключать OCR (распознование) к файлам djvu на любом языке поддерживаемом FineReader.
Как работает - не знаю, за что купил, за то и продаю .
Еще можно попробовать IrfanView -> PDF Factory -> ABBY PDF Transformer. Что будет на выходе - не берусь предсказать, но первые 2 этапа работают.
Автор: bredonosec
Дата сообщения: 16.06.2005 09:48

Цитата:
Как работает - не знаю,
- Дык всё по технологии файнридера - распознает как картинку...
А вообще, согласен, книги в джвю гнать - изврат. Только для жадных варезников - чтоб слить, на болванки скинуть и забыть.. Читать мучение.
Автор: monday2000
Дата сообщения: 23.08.2006 13:59
http://forum.ru-board.com/topic.cgi?forum=35&topic=1478&glp

Страницы: 1

Предыдущая тема: Miranda и плагин MSN


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.