Цитата: Кстати мне интересно, что именно мешает сырой скан (допустим что он у вас есть) от начала и до конца сделать в СТ? Про фиксированную рамку и выделение картинок я знаю. Что-то еще?
Грязь, но тут вы обольщаетесь, ставя ее приоритетом. Есть такая грязь, что ни БР ни СК ее не берут. Увы, только ручками. Плюс сами буквы могут быть на некоторых страницах попорчены и тогда ластиком в СК - грязь+реставрация отдельных букв.
А вот интересно, что вы знаете про выделение картинок ?
Сейчас очень просто: я прогоняю пакет в СТ в ч/б, в смешанном и в цветном режимах.
А потом собираю отдельно все правильные картинки и картинки, которые надо довести до ума в СК. Как я уже писал, мне в СК резать неудобно, а энхенсинг делать как раз удобно.
Я не думаю, что вы сразу сделаете нормально работу с зонами. Ибо, что я делаю в СК с неполучившимися в СТ страницами (в среднем их где-то 8% от книги):
1) Например в СК есть чистка по краям картинки. руками удаляются ошметки вокруг картинки, не трогая саму картинку.
2) В СТ у меня есть случаи, когда фоном заливается часть картинки - (хорошо бы иметь настройку порога сегментации, но часть картинок действительно сливается с фоном и это не автоматизировать).
3) Для части картинок (малоцвет), когда сегментация в СТ их не выделяет. Для обеления фона я в СК завышаю контраст и снижаю гамму (в уровнях).
Т.е. вам нужен инструмент уровни в СТ.
4) Часть картинок, которые идут в цвете, а СТ в смешанном делает их черно-белым.
Тогда я делаю оутпут цветным и в СК.
5) У вас идет смешение опции цвет/серый. Часть серых картинок выглядят как цветные (желтизна, коричневизна), я их в СК конвертю в серый.
6) Часть картинок, где идет паразитный фон, я в СК делаю магическое выделение цвета.
В некоторых случаях я делаю это в Фотошопе - при минимальном пороге чувствительности. Волшебное выделение.
Это, как правило, где кривые контуры картинок, а сегметация СТ оставила куски фона.
7) Вот как то была книга напечатана в малоцвете, но цвета загрязнились. Я в Фотошопе в иллюстрациях. просто заливал зоны правильным цветом.
8) Вот только что на странице прыгала освещенность, но даже БР не помог. Я в СК просто на всей странице навыделял зон и каждой задавал свой порог бинаризации.
9) не говоря уже о том, что выделение картинок в СК заточено под джвучивание в FSD - т.е. создается пара картинок с принудительной сегментацией на фон и маску.
См. пример на сайте monday2000
http://www.djvu-soft.narod.ru/scan/djvu_sep.htm Если картинки имеют мелкие контрастные элементы, то это очень выгодно иначе они уйдут в маску и будут выглядеть плохо.
Ну допустим вы сделаете пункты
1 (заливку-ластик, игнорирующие зоны);
4 (запрет на бинаризацию в зоне),
5 (принудительная конвертация в серый)
9 (вы даже кому-то рассказывали где это в СТ внедрять)
Да вот это самое противное: когда серая или цветная картинка по результатам СТ обработки в смешанном режиме оказывается черно-белой. У меня как-то так было. У части страниц я удалил фон и вставлял в фотошопе отдельные картинки (там где фон вокруг картинки удалялся а по всей странице нет, или выделял картинку кривой.
У части - где фон нормально удалялся по всей странице - подменил входные картинки в проекте СТ.
Но вы приоритетами считаете грязь, что не решит проблему.
Выделение картинок, если вы не хотите оутпутить пары субсканов, то это тоже не приоритет, т.к. для нормального кодирования по "методу разделенных сканов" - с использованием программы FSD все равно нужно будет в СК картинки еще раз выделять.
Кстати, bolega много писал про перекрывающиеся зоны, про зоны непрямоугольной конфигурации...
Да вот щас как раз книжку кодил с такими руками заданными кривыми контурами зонами. Там кривоконтурные цветные картинки были встроены в ч.б. текст. И по другому никак. СТ же сегментацию не делал.