Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: ndch
Дата сообщения: 01.06.2011 20:33
VidelSamogO
Tulon много раз говорил что не будет фотошопа в Scan Tailor.
Автор: VidelSamogO
Дата сообщения: 03.06.2011 01:34
ndch
Зачем выносить поспешные вердикты? Не правда ли?
Я говорю о необходимом для подобного типа программ, коих становится всё больше, а не фотошопе. Иного выравнивания яркости, насколько я знаю, нет и быть не может. Ни в одной программе подобных инструментов нет пока. И если это изобретение не запатентует наш друг, его очень быстро возьмут на вооружение другие. А также я хочу предложить возможность изменения захваченных мышкой границ полезной области (например), с применением сразу ко всем выделенным эскизам. Это нужно скажем для того, чтобы удалить неверно определённые области из-за прокола на корешке книги, точках... А также предыдущее мое изобретение, которое я назвал световой линзой, тоже применять сразу ко всем выделенным изображениям, поскольку обычно все страницы сканируются или фотографируются с едиными параметрами освещённости или другими факторами, влияющими на равномерность. Что также справедливо и с загибамии или изгибами страниц в области корешка.
Автор: ndch
Дата сообщения: 03.06.2011 13:21
VidelSamogO

Цитата:
обычно все страницы сканируются или фотографируются с едиными параметрами освещённости или другими факторами, влияющими на равномерность. Что также справедливо и с загибамии или изгибами страниц в области корешка.

В случае проблем с загибом у корешка Вы абсолютно не правы.
Наибольший загиб раяде случаев (часто) в середине книги.
Нормальное решение - оптибук или разбор/распил книги.

"влияющими на равномерность" - тоже достаточно спорно. Встечается что в книгах бумага разная.
Со старением бумаги эта разница обычно увеличивается.

Не все так просто.
Автор: iit512
Дата сообщения: 03.06.2011 19:57
Давно хотел знающих людей спросить -- почему для цветного режима не соблюдается правило 1-254? Я имею в виду штуку, которая позволяет разделять слои в смешанном режиме -- СТ в цветных зонах выводит светимость от 1 до 254, а 0 и 255 оставляет для черно-белой части. Так вот, в цветном режиме с выравниванием освещения и белыми полями этого нет, а в цветном режиме без выравнивания и без полей -- есть! Это стало для меня очень неприятным сюрпризом при сборке одной из книг. По-моему, это неправильно. (Вариант с выравниванием освещения, но без полей не проверял).
===
И еще одно -- я уже спрашивал, но, по-моему, вопрос затерялся: в ранних версиях СТ сканы, выделенные на одной стадии обработки, оставались выделенными и на другой. Это было удобно. Теперь выделение сбрасывается. Зачем? (Ведь сбросить выделение можно одним щелчком). Нельзя ли сделать, как было раньше?
Автор: woodyfon
Дата сообщения: 03.06.2011 20:29
Кину и я свои 5 копеек. Очень не хватает в примении к страницам выбор только или нечетные. При скане разворотов и рарезе, поля практически нужно ставить вручную, хотя обычно для четных к примеру они будут одинаковыми.
Автор: StanFreeWare
Дата сообщения: 03.06.2011 20:39
iit512
Если 100% уверены в баге (а разное поведение на разных параметрах цветного режима это однозначно неправильно) то правильнее всего описать его в списке багов на sourceforge. Можно не регистрируясь. И даже на русском.

Автор: iit512
Дата сообщения: 04.06.2011 00:24
Я уже писал как-то туда, когда были вылеты под Linux после сортировки страниц по размеру. Баг был закрыт, а я послан. Совет получил только здесь.
Автор: StanFreeWare
Дата сообщения: 04.06.2011 06:56
iit512
ОК, боитесь оказаться посланным - ваше право. Я оставил артефакт в баг-трекере, посмотрим что выйдет. Наверное, так даже логично, т.к. такое разделение в режиме Цветной/Серый пошло с моей подачи. Хотя по большому счету оно не так уж необходимо, если бы ST Separator работал не на уровне папки Out, а на уровне проекта ST (вообще говоря оно и в режиме смешанный не необходимо, но это уже совсем другая математика..)
Автор: StanFreeWare
Дата сообщения: 04.06.2011 12:42
Tulon согласен с багом, единственная проблема - куда девать белые поля. Я настаиваю на том, чтобы они были не белыми, а (1,1,1) - т.е. уходили в фон. Обоснование - на баг-трекере.
Автор: StanFreeWare
Дата сообщения: 04.06.2011 23:00
Баг исправлен (в исходниках). Через пару недель обещается официальный релиз 0.9.10
Автор: iit512
Дата сообщения: 05.06.2011 03:22
Большое спасибо! Очень Вам обязан.

Добавлено:
Просто моя img2djvu работает именно на этом принципе.
Автор: VidelSamogO
Дата сообщения: 05.06.2011 04:57
ndch

Цитата:
VidelSamogO

Цитата: обычно все страницы сканируются или фотографируются с едиными параметрами освещённости или другими факторами, влияющими на равномерность. Что также справедливо и с загибамии или изгибами страниц в области корешка.

В случае проблем с загибом у корешка Вы абсолютно не правы.
Наибольший загиб раяде случаев (часто) в середине книги.
Автор: anagnost96
Дата сообщения: 05.06.2011 05:31

Цитата:
Ну да ладно. Есть другое пожелание программе. Чтобы явно яркие цвета программа в смешанном режиме относила к области небинаризуемых картинок. А то красные и синие отметки сразу забинаризовывает. Относит к двуцветному тексту. Приходится вручную отмечать, чтобы относило к картинке, а не строкам текста. А малоцветное кодирование программа пока не поддерживает.


А вот я очень просил бы оставить всё как есть, или же, если такое поведение будет реализовано, то пусть будет отключаемым.

Просто я сейчас обрабатываю всяческие цветные обложки и т. п. следующим образом. Делаю вывод дважды: один раз -- в черно-белом режиме, другой -- в цветном. И вот эту пару файлов передаю на вход либо утилите djvumake, либо моему скрипту pdfbeads, которые берут цветное изображение и разбивают его по заданной маске на блоки фона и переднего плана. Другой вариант (если фактура обложки не важна и если есть желание немного повозиться) -- открыть маску в gimp и раскрасить вручную, а потом опять же на вход кодировщику, чтобы тот вывел заданные цвета в передний план. Так или иначе, для этого нужно, чтобы все яркие цвета оказались именно в маске.

Если уж на то пошло, то было бы здорово, если бы при обработке в черно-белом режиме ST позволял инвертировать цвета/яркость. Потому что сейчас, если попадается обложка, на которой цвет светлее фона (скажем, золото на темно-зеленом), то для вывода маски приходится сначала делать из него негатив.
Автор: iit512
Дата сообщения: 05.06.2011 06:25
А я обложки просто постеризую, а потом отдаю cpaldjvu. По-моему, это проще всего.
===
Я тоже бы хотел оставить все, как есть.
Автор: StanFreeWare
Дата сообщения: 05.06.2011 07:27
anagnost96

Цитата:
и разбивают его по заданной маске на блоки фона и переднего плана.

А как задаете цвет блоку переднего плана, если он изначально, скажем, синий - в GIMP или на автомате как-то?


Цитата:
если бы ST позволял инвертировать цвета/яркость

По-моему, такая функция скорее должна выглядеть как зона с указанием того, что при бинаризации в ней требуется учитывать инверсность текста. Просто достаточно часто на одной и той же обложке вижу и черный текст на светлом фоне и наоборот.


Цитата:
Делаю вывод дважды: один раз -- в черно-белом режиме, другой -- в цветном

Аналогичную методику использует логика раскраски маски ST Separator. К сожалению, пока она позволяет прокрасить только один цвет. Зато во всей книге.
В принципе есть теоретическая возможность последовательной обработки цвет за цветом.
Автор: anagnost96
Дата сообщения: 05.06.2011 09:14
StanFreeWare

Собственно, это метод для тех случаев, когда передний план имеет фактуру (напр. позолота на ледерине), т. е. его окраска должна делаться не цветом, а дополнительным изображением. В djvu это блок FG44, в pdf -- SMask. Если требуется именно раскрасить маску определенными цветами, я это делаю вручную.
Автор: VidelSamogO
Дата сообщения: 05.06.2011 20:51
anagnost96

Цитата:
А вот я очень просил бы оставить всё как есть


Цитата:
Я тоже бы хотел оставить все, как есть.

А вот сейчас я дам вам ссылку на замечательную 400-мегабайтную только что вышедшую книгу Шойгу, на обработку которой я потратил целый день своей жизни, коих у меня не так много. Отмечая и исправляя неверно определённые области. И вы поймёте, что подобная функция категорически необходима. Лучше, как опция. А оставить всё мы сможем, когда уже ничего не сможем.
Автор: anagnost96
Дата сообщения: 05.06.2011 22:01
VidelSamogO

Увольте, не надо нам никакого Шойги. Лучше словами скажите, что в той книге -- много цветного текста? Если так, то время следовало тратить не на исключение его из бинаризации, а на раскраску готовых черно-белых файлов. Или, как вариант, сэкономить время и раскрасить маску по методу FG44/SMask, что можно сделать и на автомате. Это гораздо более корректно, чем убирать текст или графику (какого бы цвета они ни были) в фон.
Автор: VidelSamogO
Дата сообщения: 06.06.2011 00:14
anagnost96
400 страниц. Причём и исходный dpi и выходной я сделал в 600 единиц. Это потребовало огромного времени при всяком малейшем движении мышкой.


Вот ещё небольшой пример. Исходник, результат и проект. Сейчас обработал. Чтоб не качать 400 мегов.

Автор: StanFreeWare
Дата сообщения: 06.06.2011 06:11
VidelSamogO
Качать с барыжного letitbit никто не будет. Лучше ifolder.
Если это издание 2004 года, то можно посмотреть на рутрекере.
А массажу явно лучше не стало, особенно тексту. И так весь в инее был, а теперь количество инея удвоилось.
Автор: monday2000
Дата сообщения: 06.06.2011 11:51

Цитата:
А я обложки просто постеризую, а потом отдаю cpaldjvu. По-моему, это проще всего.

Применительно к цветному тексту ИМХО это самое разумное. Наверное, у Tulon просто руки не дошли, чтобы встроить прямо в СТ постеризацию цветного текста (ради подготовки скана под cpaldjvu). Такой подход позволил бы отказаться от извращенческой раскраски DjVu-текста (ликвидировав или сведя к минимуму нужду в DjVu Pal).

Насколько я понимаю, алгоритмы постеризации называются ещё "цветовая квантизация" и описаны тут:

http://www.leptonica.com/color-quantization.html (здесь исходники алгоритмов, можно взять и вставить в СТ).

http://en.wikipedia.org/wiki/Color_quantization

PS А вот обложки постеризовать как раз наоборот плохо - т.к. при этом уничтожается фактура обложки (тиснение фонового узора).

Добавлено:
StanFreeWare

Цитата:
Качать с барыжного letitbit никто не будет.

А чем плох letitbit? Это самый обычный бесплатный файлообменник, и качать с него очень, кстати, удобно (через USD вообще автоматически).
Автор: StanFreeWare
Дата сообщения: 06.06.2011 12:18
monday2000
Через USD - может быть. А без него сунулся - то телефон требуют ввести, то низкой скоростью пугают... Короче, резко не понравилось.

Мне кажется, что постеризация в чистом виде приведет в лучшем случае к результату, который мы видим в scanned-djvu для серых сканов - т.е. несколько оттенков в одном слове (или даже в одной букве), типа усредненного цвета в рамках бинаризованной буквы. Не думаю, что это будет красиво. Постеризация с предварительным статистическим анализом будет поинтереснее, но нужно знать количество искомых цветов и правильно выбирать критерии отбора.


Автор: VidelSamogO
Дата сообщения: 06.06.2011 13:37
StanFreeWare
Исходник
Обработанный кем то, вариант
Обработанным мной, вариант
Автор: monday2000
Дата сообщения: 06.06.2011 17:06
StanFreeWare

Цитата:
т.е. несколько оттенков в одном слове (или даже в одной букве), типа усредненного цвета в рамках бинаризованной буквы.

Да, совершенно точно. Вот и меня это сильно смущает. Нужна какая-то более изощрённая квантизация - чтобы точно находить единый заменяющий цвет.

Цитата:
Постеризация с предварительным статистическим анализом будет поинтереснее, но нужно знать количество искомых цветов и правильно выбирать критерии отбора.

Я так представляю себе, что потребуется ввести в СТ новый тип зон - "зона цветного текста". Тогда будет легче найти количество искомых цветов. Пусть СТ внутри такой зоны будет автоматически постеризовывать цветной текст.

Цитата:
Через USD - может быть.

Через USD - просто вводите ссылку в программу, и нажимаете кнопку "старт" (скачивания). И далее программа не требует человеческого участия - программа сама при обрыве коннекта подключается, вводит каптчу, и докачивает с места последнего обрыва. Скорость скачивания - около 50 КБайт/сек - вполне ничего так.
Автор: StanFreeWare
Дата сообщения: 06.06.2011 21:04
В общем, думая про Шойгу, додумался до такого изврата, как отдельная программа, собирающая разные результаты окраски маски ST Separator в один. Подозреваю, что можно это сделать просто скриптом в стиле LayerTailor, но пока не знаю как.
Т.е. проходим первый раз - красим красные заголовки. Второй раз - красим синие буквицы (субсканы иллюстраций можно не сохранять).
И придуманной утилиткой собираем результаты обоих проходов (txt1 + txt2 = txt).
Автор: VidelSamogO
Дата сообщения: 06.06.2011 21:32
StanFreeWare
Жуть! Это ж очередные костыли! Когда надо просто добавить цвет с similarity. Ну с допуском. Добавить к относимым к небинаризуемой автообласти. Нет, программка для малоцвета, конечно лишней не будет.
Автор: StanFreeWare
Дата сообщения: 06.06.2011 21:57
VidelSamogO
Почему же к небинаризируемой - цветной текст не зазорно и на передний план положить. А остальное описанное уже и так есть в Сепараторе. Только для одного цвета.
Иллюстрация к txt1 + txt2 для смешанного режима
Кстати, синяя буквица добавила проблем. Использовать режим однотонные символы нельзя - соседняя буква посинеет. Но со второго раза вроде бы попал с выделенной областью.
Еще попытался вместо смешанного режима использовать закраску фона в маске. Результат пока удручающий. Может маленькое разрешение виновато, а может и алгоритм.
Автор: VidelSamogO
Дата сообщения: 07.06.2011 19:00
StanFreeWare
Спасибо. Посмотрел. А чем эти цвета текста отделить? И главное, как потом слить в один Djvu?
Автор: StanFreeWare
Дата сообщения: 07.06.2011 19:27
VidelSamogO
Отделял Сепаратором по инструкции.
Автор: StanFreeWare
Дата сообщения: 08.06.2011 06:40
Добавил функционал склейки txt1 + txt2 + ... + txtN в свежую версию Сепаратора. Заодно добавил функционал ручного задания результирующего цвета маски, если усредненный цвет образца по какой-либо причине не устраивает.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.