Gajver100 Цитата: Дайте свой sk.ini которым вы кромсировали кусочек книги
Задание для Вашего примера я привел в своем предыдущем сообщении (под линком "Подробнее.."). Сохраните его как .spt, удалив лишние переносы строк.
В этом задании можете сохранить его профиль и применить его ко всем остальным сканам Поля. Должно получиться хорошо.
А ini-файл не нужен, в нем не содержится опций обработки.
Добавлено: По почте меня недавно спросили как обрабатывать сканы с однородным цветным текстом, например красным заголовком или синим векторным рисунком (остальной текст на странице - обычный, т.е. черный).
Привожу и здесь свой ответ, тем более что он непосредственно связан с новыми возможностями версии 5.91
>>>>
В новой версии (5.91) это теперь делается просто.
Однородный цветной текст, или рисунок, заключается в picture-зону, в ней выставляются те же параметры, что и для страницы (b/w, 600dpi, convert threshold, despeckle, фильтры). На закладке Colors свойств зоны ставите галку на enable в панельке Text, щелкаете на кнопке с 3-мя точками или на черном квадрате и задаете цвет текста. Можно выбрать цвет непосредственно на самой картинке. Для этого нужно включить ее preview (на 1-й закладке кнопка с синим небом), окно расширится и справа появится ее изображение. Включить режим выделения (отжать кнопку с ладошкой над рисунком зоны), выделить небольшой участок на зоне с типичным цветом и нажать кнопку, на которой нарисована рука с пальцем.
Что будет происходить при обработке? Зона будет сконвертирована в ч/б и таковой и останется, поэтому в постобработке ее можно например, почистить от спеклов, также как и обычный ч/б файл. Раскраска текста на ней (точнее, всего, что имеет черный цвет) будет происходить на-лету при ее отображении в окне view result и при слиянии зоны со страницей.
Аналогично можно задать и цвет фона. В этом случае окрашиваться будет все, что имеет белый цвет. Помимо цвета, для фона можно задать также несколько вариантов градиентной заливки.
Что делать, если нужно например закрасить только часть фона зоны? Для этого после(!) обработки в окне view result в режиме показа зон (panels layout = Zones) отобразить зону в правой панели, и там все белые пиксели, которые не должны закрашиваться, сделать прозрачными. Это можно выполнить несколькими способами. Например, выделить их мышкой (прямоугольным или как правило непрямоугольным выделением) и в контекстном меню выбрать команду Special->Zero transparent. В выделении можно захватывать и черные пикселы, ничего страшного, эта команда на них не действует. Можно сделать наоборот: всю зону сделать прозрачной, а потом с нужного участка снять прозрачность (Special->Remove transparency). Все зависит от того, какой области больше, в зависимости от этого и выбирать наименее трудоемкий способ выделения. Если область замкнутая (ограничена черными пикселями, или наоборот, область снаружи от замкнутой), то выделить ее можно одним щелчком - щелкнуть внутри области, держа нажатым Ctrl+Shift.
Раскраска зон имеет еще одну замечательную особенность: изменение (подбор) цвета можно делать, не выполняя переобработку зоны. Можно даже делать это непосредственно в окне view result. При этом результат изменения цвета отображается мгновенно.
Может возникнуть еще такой вопрос: как обрабатывать участки скана, которые в оригинале имеют фон (как правило серый, но с учетом качества сканирования он может превратиться в облако точек), который использовался в книге для выделения (подсветки) текста. Пример - текст на сером фоне или на dither-подобном (грязном) фоне. Такие участки обрабатываются тоже очень просто, так же как и описано было выше. С одним исключением - цветность зоны (не путать с цветом раскраски) в ее свойствах ставится не b/w, а b/w-clean. В результате существующий сканированный фон будет удален и заменен на однородный (или градиентный, если задано) цвет, который вы задали как цвет фона. Кстати, режим b/w-clean можно с успехом применять не только к серым/цветным сканам, но и к ч/б. Если в книге присутствовал текст на каком-нибудь темном фоне, то при сканировании ее в ч/б режиме получается жуткая грязь с плохо различимым текстом (такие сканы встречаются довольно часто). Режим b/w-clean позволяет избавиться от грязи и восстановить оригинальный цвет фона.
Все выше сказанное относится как к случаю, когда зоны будут сливаться чтобы получить потом djvu, так и к случаю, когда делается pdf непосредственно из кромсатора. В последнем случае будет значительная экономия объема pdf-файла, т.к. в pdf кромсатор будет помещать ч/б скан, а его раскраску выполнять специальными командами, которые предусмотрены в спецификации pdf. Раскраска зон идеально также подходит для sep-кодирования djvu.