Ru-Board.club
← Вернуться в раздел «Программы»

» *.djvu с чем его едят

Автор: amaid
Дата сообщения: 26.11.2010 15:37
Имеется книжка, взятая с гуглбукс, вот из нее три странички
http://narod.ru/disk/351324001/experimental.djvu.html
djvu в черно-белом сжатии дает отвратительное качество, в фото сжатии (Djvu Small) размер файла зашкаливает за 60 mb (всего 370 стр.)
можно ли найти какой-то компромисс между качеством и размером? (20-30 мегов при среднем качестве)
Автор: oparapa
Дата сообщения: 29.01.2012 13:57
Здесь найдете все ответы
http://www.***.ru/kak-sozdat-i-chem-otkryt-djvu-fajl/
Автор: ComboFZ
Дата сообщения: 02.08.2012 17:36
DjVuToy 2.0.2

http://www.datafilehost.com/download-2f941c6f.html
Автор: ComboFZ
Дата сообщения: 13.10.2012 11:37
sergiokapone

Цитата:
Есть интересная програмка pdf2djvu из djvulibre, которая конвертирует pdf в djvu. В отличие от lizardtech'овской одноименной утилиты, первая преобразовывает практически всегда без каких либо танцев с бубном, но качество полученного djvu чуть больше, чем плохое.
Скажите пожалуйста, кто-нибудь знает, может ли pdf2djvu из djvuLibre вытаскивать лишь текстовый слой из pdf и преобразовать в текстовый слой, понятный для djvu, без конвертирования pdf-djvu?


Тоже хотелось бы упростить этот процесс. В сети полно djVu-книг без текстового слоя и закладок, но внедрение текста из pdf в оригинальный djVu без "танцев с бубном" пока не получается, хотя и возможно.
К примеру в эту книгу http://forum.ru-board.com/topic.cgi?forum=36&topic=2286&start=560#9, взятой из сети, был внедрён текстовый слой из pdf от FineReader 11.0 и добавлены закладки.
Могу описать свой процесс, может быть его где-то можно подрихтовать.
Автор: sergiokapone
Дата сообщения: 13.10.2012 11:50

Цитата:
Могу описать свой процесс, может быть его где-то можно подрихтовать.

Процесс понятен, я даже как-то давно придумал возможный вариант еще для 10 версии
http://www.djvu-scan.ru/forum/index.php?topic=321.0
Пока я пользуюсь так, как показано на видео, но это подходит лишь для FR8.

Если Ваш вариант отличается, то опишите его.
Автор: ComboFZ
Дата сообщения: 13.10.2012 13:25
Я не использую текстовый слой полученный из djvu от FineReader, а использую, как и вы, текстовый слой полученный из pdf от FineReader, он более корректный. Только загоняю в FR тифы. Про ваше описание не знал.

1. Беру из сети djvu книгу в которую нужно внедрить текстовый слой.
2. Немного редактирую djvu в Document Express Editor (удаляю пустые странички, исправляю их расположение, добавляю и т.д.)
3. С помощью WinDjView перевожу djvu в TIF LZW.
4. Загоняю TIF в FineReader 11, получаю PDF с текстовым слоем (текст под изображением, оригин. размер бумаги и картинок, кач. 60% по умолчанию).
5. Для получения только текстового слоя из PDF:
в Акробате 10 ручками или макросом (с помощью Easy Macro Recorder), удаляю графику. Не закрывая Акробата сохраняю результат (иначе не оптимизировать), оптимизирую: Сохранить как > Оптимизированный файл PDF... Получаю PDF только с текстовым слоем > OCR.pdf
6. С помощью Pdf To Djvu GUI преобразую OCR.pdf в промежуточный OCR.djvu
(Pdf To Djvu GUI с файлами PDF с большими по разрешению картинками не работает, именно поэтому из PDF удаляются картинки).
7. С помощью DjvuOCR внедряю текст из OCR.djvu в оригинальный Djvu.
Автор: sergiokapone
Дата сообщения: 13.10.2012 13:58
ComboFZ, спасибо, идея в общем, понятна. Но процесс многостадийный. Нужны другие способы.
Автор: rouzi
Дата сообщения: 22.11.2012 13:44
Приветствую всех,

Может кто из специалистов по djvu поможет разгадать вот такой ребус - в одной из китайских библиотек удалось найти в онлайн просмотре несколько нужных для работы старых книжек (на английском языке). Просмотр идет через флэш, но для каждой страницы есть файл с непонятным содержимым, путь к которому содержит намек, что это должен быть djvu.

К сожалению, никаких сведений о способах "декодирования" этих файлов в скриптах той самой китайской библиотеки найти не удается.

Есть предположение, что алгоритм "кодирования" не должен быть сложным (чтобы не занимать процессорное время). Возможно специалисты смогут "с первого взгляда" понять что хитрые китайцы сделали с этими djvu файлами.

Для примера я залил три файла вот по этому адресу: http://rusfolder.ru/33739723

Заранее большое спасибо за помощь




Страницы: 1234

Предыдущая тема: JPSoft 4DOS, 4NT, Take Command


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.