To
monday2000:
Цитата: 3). Нельзя ли сделать так, чтобы DjVu-файлы на CD-диске открывались в WinDjView, находящимся на этом же диске? Просто хотелось бы сделать такой подарочный CD-диск с DjVu-книгами, и чтобы у "клиента" не было с этим диском никаких проблем
Я в такой ситуации сделал индексный DJVU файл, в котором разместил список книг со ссылками на нужные DJVU. Ссылки реализованы как "hot area".
Для того, что бы не размечать их вручную, выработал следующий алгоритм:
1) создаём html файл со ссылками на нужные djvu файлы (можно даже со ссылками на нужные страницы внутри этих DJVU)
2) Конвертируем HTML в PDF с помощью Adobe Acrobat. При этом сохраняются ссылки на DJVU файлы. Вот только они становятся абсолютными (прописываются локальные пути к DJVU файлам)
3) Конвертируем PDF в DJVU с сохранением встроенных ссылок.
4) Исправляем ссылки внутри DJVU, так чтобы они опять стали относительными ссылками и заработали в WinDjview:
djvused.exe "all_authors.djvu" -e output-ant > "all_authors.djvu.txt"
replace_text.exe "all_authors.djvu.txt" "../g:\\NiZh\\read_excel\\" --delete
replace_text.exe "all_authors.djvu.txt" "../file:///G|/NiZh/read_excel/" --delete
replace_text.exe "all_authors.djvu.txt" "\\" "/"
djvused.exe "all_authors.djvu" -f "all_authors.djvu.txt" -s
replace_text.exe - простейшая программа для BAT процессинга, которая выполняет требуемое - замену или удаление подстроки в указанном файле.
Таким образом я создаю навигацию по архиву журнала Наука и Жизнь.
To
Griefin:
Цитата: Довольно часто в текстовом слое DjVu-книг встречаются слова с неправильно расставленными пробелами. Хотелось бы в одной из следующих версий видеть опцию поиска без учета пробелов.
Более того - практически во всех DJVU книгах, полученных из сканов с настоящим OCR текстом присутствуют специфические ошибки распознавания. И для того, чтобы ошибки в распознанном тексте не мешали поиску есть множество всевозможных хитростей.
Например, fussy поиск - поиск по неполному совпадению, когда при поиске слова "собака" будет найдено "с0бака" или "с^бака" .
Кстати, ещё одно свойство сильно увеличивающее полезность поиска - анализ морфологии. А ещё более крутой поиск - поиск по возможным синонимам.
Но всего этого требовать от программы-просмотрщика DJVU несколько опрометчиво.
А попробовать подключить всё это в виде
внешней библиотеки анализа морфологии - было бы оптимальным выходом из положения. Вот только существуют ли такие библиотеки под GPL или другой совместимой лицензийей - это вопрос.
UPD: Такие библиотеки есть -
http://www.aot.ru - лингвистические библиотеки под лицензией LGPL. Живой проект, результаты которого задействованы в таких компаниях как mail.ru, например.
To
AndyZ:
Большое спасибо за версию 0.4.2, в особенности за "складные" закладки.