Ранее уже хвалил, теперь попробую выступить с критикой и конструктивными предложениями.
Несмотря на удобство, качество выхода со СТ желательно улучшить, концепцию - оставить!
На мой взгляд, существенным сдвигом могло бы быть пояснение понятий в триаде: сырье-процесс-продукт.
Допустим, функция процесса в СТ, обеспечивающая качество выходного продукта реализована. Эта функция опирается на ряд допущений: 1) сырье (сканы) должны быть некоего нормального качества; 2) формат А4.
При обеспечении этих требований к сырью функция обеспечит выход продукта некоего нормального качества!
Проблема в том, что вариаций в отношении качества сырья может быть бесконечное множество, а следовательно и критики, и ожидания хорошего результата.
Для того, чтобы неким образом унифицировать качество сырья нужны некие правила, действия, подготовительные процессы.
До СТ, напрашивается некая новая стадия анализа сырья, обеспечивающая возможность его унификации (приведения к приемлемому уровню качества для конвейера (СТ).
Рассматривая варианты унификации, необходимо опираться на конечный продукт СТ.
Вопрос - что является конечным продуктом в СТ, соответствующий неким качественным критериям?
Ответ - читабельная страница с текстом в формате А4.
Читабельная, это значит страница с упорядоченными символами, каждый из которых имеет ровный контрастный фону цвет и толщина отображения этого символа имеет зависимость от его размера и количества знаков на странице. Одновременно, края отображения символа должны иметь максимально ровную грань (желательно векторную). (В технике есть такой термин: чистота поверхности, определяющий высоту микрозазубрин на поверхности материала).
Отсюда, условная страница имеет некую площадь, на которой упорядоченно располагаются символы. Имеется зависимость между размером этой площади, количеством расположенных на ней символов, их высотой и толщиной (а также чистотой) их отображения.
При этом, отображение площади в целом фиксировано - это страница А4 минус поля.
Именно эта страница должна быть отображена в 21*29 (или чуть меньше!).
Давайте введем понятие ИНФОРМАЦИОННОЙ ПЛОЩАДИ (ИП) - это та же самая полезная площадь в СТ, за исключением что она всегда (в книге) постоянна не зависимо от наполнения страницы символами.
т.е. ИП - это А4 (21*29) минус фиксированные поля (пусть 1,5 см).
качественно подготовленная ИП - это конечный продукт СТ
Достаточно ли существующих понятий DPI для получения качественной ИП? Нет! есть еще размер холста и т.д. свои зависимости.
Пример,
обрабатываю книжку из DJVU к СТ, реальный размер в DJVU со сдвоенной страницей 26,5*18,5 см.
пробую подготовить на FR 10
получается, увеличивая разрешение я уменьшаю размер (в см) ИП
понятно, у FR другая задача, у него другой конечный продукт - ему нужно увеличить и прочитать символ, в то время как у меня - получить читабельную страницу!!!
Далее, пробую разобрать варианты подготовленные в FR на СТ;
увеличиваю страницу без потери качества в Xara и тоже пытаюсь разобрать ее на СТ
см.
http://slil.ru/28565817 (смотреть лучше в FastStone Image Viewer, там есть лупа)
и что вижу: увеличенную мной в Xara страницу до размера 58,7*41,1 см СТ уменьшает автоматом до 9,5*13,6 см!
Выигрывает от этого читабельность - конечно нет!
На мой взгляд, без введения понятия ИП (со всеми ее зависимостями) нам не обойтись!
Предложение:
Перед СТ, ввести стадию анализа сырья: вычислить ИП, предложить! варианты обработки сырья дополнительными плагинами и уже после предварительной обработки передавать в СТ.
На стадии анализа формировать файл для передачи данных в СТ
Для корректировки ИП применять некие типовые сценарии (плагины) из свободного (например) XnView, позволяющего проводить пакетную обработку.
Важно, что по результатам анализа эти сценарии должны быть предложены (рекомендованы), либо выполнены автоматом из собранной библиотеки.
Непосредственно в СТ жестко зафиксировать ИП (т.е., убрать возможность регулирования полей, перейти на жесткую конструкцию – ширина полезной области будет строго равна зафиксированной ИП.