Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: Melirius
Дата сообщения: 06.11.2008 01:48
monday2000


Цитата:
Лично мне самое непонятное - как в СК сканы готовятся под МРС - http://www.djvu-soft.narod.ru/kromsator/cla_melirius.htm и т.п. Я даже и не начинал это изучать - т.к. всё это на вид выглядит сложно и непонятно, тут нужно время, чтобы разобраться, и куча хороших и наглядных примеров (на словах непонятно).


Попробуйте просто сделать как в описании пакета, а? Загрузите его, поставьте и сделайте точно так, как там сказано, в пункте 4.2. И - о чудо - если Вы затем
залезете в bat-файлы и проведёте ночь, медитируя над документацией, то Вам всё станет кристально ясно.


Цитата:
Некоторые тут втихую используют этот приём - а я вот даже и не заметил этого - потому что это не было разъяснено достаточно чётко.


Спасибо, добавлю поясняющую картинку. Однако дырки в тексте именно на месте фото-иллюстраций. Хотя и фон тоже можно пихать в background, но не штатными средствами SK, потому это в доке и не описывается.


Добавлено:
monday2000


Цитата:
Т.е. этот трюк применяется, когда нужно на одних страницах (будущего многостр. DjVu) сделать автоматическую сегментацию, а на других - ручную.


О, боги! Поясните только, зачем Вам это нужно!
Автор: monday2000
Дата сообщения: 06.11.2008 08:23
Melirius

Цитата:
Попробуйте просто сделать как в описании пакета, а

Я сделаю по-другому - просто поэкспериментирую с СК на основе http://www.djvu-soft.narod.ru/kromsator/cla_melirius.htm - надеюсь разобраться.

Цитата:
Однако дырки в тексте именно на месте фото-иллюстраций.

Есть 2 случая МРС:
1. Фото-МРС (ФМРС). Субсканы имеют вид как в http://www.djvu-soft.narod.ru/scan/djvu_sep.htm .
Признаки:
а. На исходном скане будущие foreground-объекты не могут налезать поверх будущих background-объектов.
б. Background-объекты могут быть многоцветными.
в. Background-объектов чисто визуально может быть несколько.
2. Плакатный-МРС (ПМРС). (а-ля cpaldjvu)
Признаки:
а. На исходном скане будущие foreground-объекты могут налезать поверх будущих background-объектов.
б. Background-объекты не могут быть многоцветными (а только один монохромный цвет).
в. Background-объект чисто визуально - только один - заливка всей поверхности субскана заднего фона монохромным цветом (доминантным на исходном скане).

Цитата:
О, боги! Поясните только, зачем Вам это нужно!

Чтобы сочетать достоинства и ручной и автоматической сегментации. И это Arcand первый начал. Но ИМХО и этого мало - пока невозможно сочетать на одном скане области автоматического и ручного распознавания. Возможные варианты решения:
1. Хранить куски "ручного" фона в user-defined чанках в формате IW44 и сделать спец. DjVu-вьювер, их отображающий (плохое решение - проблемы с масштабированием).
2. Декодировать автосегментированный DjVu, добавлять куски "ручного" фона, собирать назад через csepdjvu (совет Леона Буту). (плохое решение - падение качества).
3. Попробовать порыться в DjVu SDK 3.6 - может, удастся перехватить на пол-пути формирование DjVu и подсовывать после автосегментации, но перед закодированием в DjVu, куски "ручного" фона. (уже лучше).
4. Сделать вообще самодельный авто-сегментёр. (супер, но пока фантастика).

Добавлено:
Melirius
Замечательно, что Вы стали программировать алгоритмы (в скан-топике). Небольшая просьба: сбрасывайте интересные алгоритмы/методики в топик по Scan Tailor (для обмена идеями).

Добавлено:
Как я понимаю, Picture-зона в СК может применяться не только для МРС - а просто для постеризации плакатных объектов, подлежащих автоматической сегментации (в foreground).
Автор: Melirius
Дата сообщения: 06.11.2008 09:39
monday2000


Цитата:
Есть 2 случая МРС:
1. Фото-МРС (ФМРС). Субсканы имеют вид как в http://www.djvu-soft.narod.ru/scan/djvu_sep.htm .
Признаки:
а. На исходном скане будущие foreground-объекты не могут налезать поверх будущих background-объектов.
б. Background-объекты могут быть многоцветными.
в. Background-объектов чисто визуально может быть несколько.
2. Плакатный-МРС (ПМРС). (а-ля cpaldjvu)
Признаки:
а. На исходном скане будущие foreground-объекты могут налезать поверх будущих background-объектов.
б. Background-объекты не могут быть многоцветными (а только один монохромный цвет).
в. Background-объект чисто визуально - только один - заливка всей поверхности субскана заднего фона монохромным цветом (доминантным на исходном скане).


На самом деле эти два случая ничем друг от друга не отличаются, ибо механизм кодирования для background-слоя один и тот же. Это Вы их искусственно различаете.

Foreground-объекты в любом случае могут и будут выводиться поверх background. Это как два слоя в Photoshop, и при этом белый цвет на foreground = прозрачный.

Автор: monday2000
Дата сообщения: 06.11.2008 10:21
Melirius

Цитата:
Это Вы их искусственно различаете.

Ну да, это такое условное разграничение. По методике приготовления пары субсканов. Не зря же для 2-го вида сделали спец. утилиту - cpaldjvu.

Цитата:
Foreground-объекты в любом случае могут и будут выводиться поверх background.

Конечно могут. Только если фон - многоцветный (а не монохромный) - то это будет уже обычный случай автоматической сегментации посредством documenttodjvu - вряд ли тут можно применить ручную сегментацию.

Ещё можно поэкспериментрировать с Плакатный-МРС (ПМРС) и попробовать отправлять в задний фон не один монохромный цвет - а хотя бы 2-3 наиболее доминантных цветов. Но тогда они должны быть отделены друг от друга достаточным по ширине foreground-объектом (который скрыл бы расплывчатые разводы в месте их соприкосновения).
Автор: ghosty
Дата сообщения: 06.11.2008 10:49
monday2000
Еще раз попросил бы перестать оффтопить. У тебя есть "свой" топик уже - экспериментируй там.
Автор: monday2000
Дата сообщения: 06.11.2008 12:50
ghosty
А я хочу себе ещё один.

И ещё - чтобы bolega был в курсе некоторых моих идей, поскольку они СК-зависимы (по крайней мере, пока).
Автор: MIHMIH007
Дата сообщения: 10.11.2008 12:52
Здравствуйте))
Раньше очень сильно увлекался данной программой... после произошло долгое затишье .... и забыл как склеивать изображения.
Пример:
У меня есть цветной скан.... там есть чёрно-белый текст и цветная картинка для этого я выделяю область картинки с помощью ползунка "Mark as picture zone" залазию в Опции данной зоны выставляю на то чтобы картинка была цветной делаю обрезку ... и после обрезки получаю два файла изображения одно текст а второе эту цветную картинку ....как сделать чтобы кромсатор автоматом склеивал их???
Спасибо
Автор: Melirius
Дата сообщения: 10.11.2008 13:42
MIHMIH007

Это Вам в Zones > Merge Zones прямая дорога...
Автор: MIHMIH007
Дата сообщения: 12.11.2008 21:45
Подскажите пожалуйста а для чего нужна вкладка в разделе:
1. File ---> Scan's folder monitoring ?
2. Image ---> Special ---> Exchange image with bak-file?
3. Почему по правой клавиши мыши вкладка Mark as floodfill zone работает только в чёрно белых изображениях а в серых не хочет хотя из меню Zones она работает и для серых изображений?
Автор: wyxa
Дата сообщения: 13.11.2008 02:46
ghosty
Почему бы не включить в сборку DJVUDecode и файл DJVUsed.exe?

Добавлено:
Ой, прости, как я понял, это версия «Лайт»?
Может стоит создать сборку для DJVU, чтобы пользователям не пришлось искать эти файлы?
Автор: monday2000
Дата сообщения: 14.11.2008 15:52
Интересно, что можно сделать в Кромсаторе с ч.б. сканами, сделанными с грязной ксерокопии? Деспекл не в состоянии их очистить. Руками - муторно. Пересканировать - нереально, т.к. сканы чужие.

Вот пример:

http://w17.easy-share.com/1702423639.html (120 КБ)

Вся книжка (если надо) тут:

http://forum.abok.ru/index.php?act=attach&type=post&id=20402 (3,69 МБ)

Всякие там шумодавы (Neat Image и т.п.) по-моему неспособны это почистить. Есть ли хотя бы теоретически какой-то алгоритм очистки?
Автор: ghosty
Дата сообщения: 14.11.2008 16:04

Цитата:
Всякие там шумодавы (Neat Image и т.п.) по-моему неспособны это почистить. Есть ли хотя бы теоретически какой-то алгоритм очистки?
Единственный пакет, в котором я видел действительно особый и сильный алгоритм очистки спеклов - PixEdit. Там он назывался "Intellectual despeckle" или что-то в этом роде...
В демо-версии он работает, но сохранить результаты нельзя.
Автор: dma200899
Дата сообщения: 14.11.2008 16:18
В Wisebook можно задать любой размер спеклов
и применять не ко всей странице, а лишь к выбранной зоне
Автор: ghosty
Дата сообщения: 14.11.2008 16:25
dma200899

Цитата:
В Wisebook можно задать любой размер спеклов

В СК - тоже (Options->Processing), но в данном случае дело не в размере
Автор: dma200899
Дата сообщения: 14.11.2008 16:30
в СК зоны исключения нужно настраивать, а в WB выделил зону - применил деспекл. Ничего нужного не потеряется. То есть мелкие спеклы применить на все страницы, а по зонам затемнения пройтись руками с выставленными крупными спеклами.
Автор: U235
Дата сообщения: 14.11.2008 19:37

Цитата:
Всякие там шумодавы (Neat Image и т.п.) по-моему неспособны это почистить.

Так Neat Imagе расчитана на фото, а не на бинарные сканы. ИМХО, такие шумы лучше чистить морфологией (еще лучше labeling и селекция по признакам) и логическими операциями. Вот что получилось. Не совсем чисто, конечно.. Сделано в Matlab, но алгоритм с приближениями я думаю можно перенести в Corel или ImageMagick.

Цитата:
Деспекл не в состоянии их очистить.
ИМХО, иллюстрация сильно этому мешает, она скорее всего и будет "плыть" при любом деспекле, независимо ScanKromsator это или какая-то другая программа (если конечно ее предварительно не замаскировать.).


Автор: Torino
Дата сообщения: 14.11.2008 21:26
Не могу скачать картинки из поста, т.к. зашел с телефона, но догадываюсь о чем там речь идет.
Могу посоветовать воспользоваться "инженерными" векторизаторами.
Например Spotlight.
В современных векторизаторах реализован очень грамотный и гибкий механизм очистки ч/б сканов.
Область предварительно анализируется на наличие "полезной" информации.
И на основе этого анализа происходит очистка.
Есть пакетная обработка.
Автор: monday2000
Дата сообщения: 14.11.2008 21:53
U235

Цитата:
Не совсем чисто, конечно..

А по-моему - шикарно получилось. Несравненно лучше, чем оригинал.

Цитата:
Сделано в Matlab, но алгоритм с приближениями я думаю можно перенести в Corel или ImageMagick

Было бы замечательно. Давайте продолжим эту тему в топике по Scan Tailor.

Тема ИМХО довольно актуальна - поганых сканов с именно такой проблемой накопилось довольно немало...

Ещё, мне кажется, надо бы когда-нибудь сделать фичу впечатывания в скан буковок текста - поверх белых проплешин в тексте. И как-либо эти буковки по высоте подстраивать, чтобы не сильно от оригинальных отличались.
Torino

Цитата:
Не могу скачать картинки из поста, т.к. зашел с телефона, но догадываюсь о чем там речь идет.

Вот я продублировал:
http://www.djvu-soft.narod.ru/dirty.tif (139 КБ)
ghosty

Цитата:
PixEdit

Спасибо, попробую.
Torino

Цитата:
Могу посоветовать воспользоваться "инженерными" векторизаторами.
Например Spotlight.

Хотелось бы чуток подробнее.
Автор: dma200899
Дата сообщения: 15.11.2008 16:12
Так вам шашечки или ехать ?

Речь идет о чистке конкретной книжки в 78 страниц или о глобальной разработке умного деспекла.
Если про первое, то
10 кликов в Вайзбуке:

съелись правда две точки, но они некритичны.

+ чистка мусора внизу ластиком и блурринг зоны с оформлением ее серой картинкой в СК дает вполне приличный результат и достаточно быстро:
http://s40.radikal.ru/i090/0811/e8/c5ba5fe93fd7.tif

кроме того, надо заметить, что это нетипичная страница. Дальше идут страницы с чертежами и пунктирными линиями, в которых грязь идет лишь узкой полосой.
Ваш деспекл в Матлабе не выест ли из них куски ? Неизвестно.

Ну а так, да, конечно умный деспекл лучше, чем ручками все делать.

А вот в СК у меня получить точно такой результат, увы, не получается.
Т.к. задать параметры деспекла локально и применить его к зоне а не к странице я не могу.

Кроме того, на удивление, в данном случае Wisebook удачно делает deskew, невзирая на грязь (видимо по линии внизу), а и СК и BR дают ошибки.
Автор: ghosty
Дата сообщения: 15.11.2008 18:45
dma200899

Цитата:
в СК зоны исключения нужно настраивать, а в WB выделил зону - применил деспекл. Ничего нужного не потеряется.
Правильно, и в СК можно, с одной стороны, настроить размер спекла для всей книги, а, с другой стороны, уже после обработки пройтись по страницам в режиме Auto-sepeckle (выделяешь зону - в ней срабатывает деспекл). Настроить размер спекла для этого режима можно в контекстном меню - Clear Options.
Автор: dma200899
Дата сообщения: 15.11.2008 18:59
Хо-хо.
Ну так тогда и надо делать,

вот еще если бы в режиме подсветки спеклов можно было бы колесико мышки крутить, меняя размер спеклов - совсем круто было бы.
Автор: ghosty
Дата сообщения: 15.11.2008 19:18
dma200899

Цитата:
вот еще если бы в режиме подсветки спеклов можно было бы колесико мышки крутить, меняя размер спеклов - совсем круто было бы.
Очень хорошее предложение, кстати!
Автор: dma200899
Дата сообщения: 15.11.2008 19:43
да и сам режим подсветки, чтобы не только на всю страницу, но и на выделенную зону можно было применить.
Т.е. типа, выделил зону - подобрал размер спекла с подсветкой - применил (не переустанавливая зону).
Автор: bolega
Дата сообщения: 15.11.2008 21:51
Попробую. Но уже в следующей версии, т.к. новая версия уже готова.
Автор: MIHMIH007
Дата сообщения: 15.11.2008 23:10
bolega
а можно уже посмотреть новую версию?))))
в чём отличие от версии 5.91 ?
Автор: monday2000
Дата сообщения: 16.11.2008 16:24
dma200899

Цитата:
Речь идет о чистке конкретной книжки в 78 страниц или о глобальной разработке умного деспекла.

Очистка этой конкретной книги мне глубоко неинтересна. Интересны лишь идеи по очистке такого рода книг - причём с таким прицелом, чтобы потом реализовать их в виде самодельного алгоритма

Цитата:
режиме подсветки спеклов

ИМХО совершенно бесполезная фича, увы. В реальности толку от неё ноль. Слишком много лишнего там мерцает - кусочки букв и картинок - их миллион на каждом скане.

Добавлено:
Я сравнил алгоритм выравнивания освещённости у Book Restorer 4.1 и Scan Kromsator v5.91. Пример выложил:

http://www.djvu-soft.narod.ru/bookscanlib/sl_example.rar (642 КБ)

Там внутри исходный скан, затем он же обработанный в BR, и он же обработанный в SK.

На мой взгляд, разница в качестве выравнивания освещённости между SK и BR очевидна: SK в этом отношении ИМХО очень сильно уступает БукРестореру. Просто небо и земля, я бы сказал. Кто мне не верит - смотрите сами выложенный мною примерчик.

Отсюда вывод: рекомендовать пользователям использовать выравнивание освещённости, встроенное в СканКромсатор (как это делается в ScanAndShare), нецелесообразно. Качество не то. Единственно правильный вариант (надеюсь, пока) - делать выравнивание освещённости в BookRestorer v4.1.
Автор: bolega
Дата сообщения: 16.11.2008 18:01

Цитата:
Отсюда вывод

И где же там небо и земля???

Цитата:
ИМХО совершенно бесполезная фича, увы. В реальности толку от неё ноль.

А вот от ваших бестолковых размышлений, советов и выводов действительно не только толку ноль, но еще и огромный вред. Мда. Вообщем, пока из этого топика не уберут г-наmonday2000, я тут больше не появляюсь.



Добавлено:
MIHMIH007

Цитата:
в чём отличие от версии 5.91

Есть несколько очень серьезных отличий. Whatsnew будет на хомяке.
Автор: Alexx S
Дата сообщения: 16.11.2008 18:09

Цитата:
в чём отличие от версии 5.91


Есть несколько очень серьезных отличий


Хорошее нововведение
Автор: VadimirTT
Дата сообщения: 16.11.2008 18:52
monday2000

Цитата:
рекомендовать пользователям использовать выравнивание освещённости

не корысти ради, но нафига это выравнивание освещенности нужно само по себе?
Автор: MIHMIH007
Дата сообщения: 16.11.2008 21:24
bolega
в принципе лично меня устраивала вполне версия 5.81NY я даже и представить не могу ЧТО можно ещё запихнуть для удобства в эту прогу))))
реально там стоко настроек что это сверх понимания простого юзверя))
вообщем одним словом ЖДУ новую версию.... СПАСИБО ОГРОМНОЕ
monday2000
Даже по вашим примерам видно что СК справился со своей задачей..... ИМХО 70% успеха зависит от хорошего скана.... а всякое г*** и нечего в хорошую прогу пихать и смешивать её с тем же что и запихнул.....

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.