Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: shch_vg
Дата сообщения: 02.07.2008 14:53
bolega
Еще раз спасибо за помощь!
Жаль, что рапидшаре снова задурила, постоянно показывает "осталось 53 мин".
В версии 5.91 на закладке Filters нашел только Contrast, поэтому неплохо было бы посмотреть на 5.92.
Единственная просьба, выложите еще куда-нибудь кроме рапиды.
Автор: noveagle
Дата сообщения: 02.07.2008 15:41
bolega

Цитата:

Цитата:
В новой версии 5.91 появилась неожиданная "фича" (баг?):

Это появилось раньше, причем это не просто фича, а фича, которую меня просили непременно сделать (т.е. восстанавливать zoom после отключения ластика).


Странно. Я пока не пойму даже теоретически в какой ситуации это может быть кому-то удобно... Лично мне это сразу стало мешать

Тут ещё дело в том, что zoom-то может и восстанавливается, но вот положение экрана
(в случае, когда страница не входит целиком в экран при текущем zoom'е)
по-моему меняется каким-то непредсказуемым образом. Не сразу понимаешь, в каком "квадрате" страницы ты вдруг оказался.


Цитата:
Так что извиняйте, что просили, то и сделал


Спасибо, конечно, но может это можно было сделать хотя бы как опцию?
Автор: dma200899
Дата сообщения: 02.07.2008 15:44
bolega

1.
Так я ж и говорю, что я в СК, так получилось, ни ухом ни рылом. Ну не пользуюсь я им. Очень-очень редко.

2.
В моей 5.91 у зон есть только контраст. Яркости нету.

3.
Когда я говорил, что зоны не показываются, то речь не шла о наложении. Я имел в виду, что при сборке пдф отдельных зон нет. Они установлены, и как картинки сохраняются, а вот внутрь пдф (если делать без сеп-оут) почему-то не попадают. Причем это происходило, если пихать все страницы сразу.
Когда я сохранял пдф пакетами по 10-20 стр, то вроде было нормально, но я получил Ваш совет раньше, чем сделал так всю книжку или определил максимально пролезаемое число страниц.
Я просто не знаю, что именно в 5.92 было поправлено. И чем именно был вызван такой глюк. Если Вы выложите 5.92, то я пока не удалил свои исходники и sep - могу протестить и отписаться как оно (если) происходит.

4.
Может быть оно и удобнее, и в картинке цветов больше - поэтому я и пишу что мой результат посредственный, но Вы представьте сколько раз на картинке надо кликать "волшебной тыкалкой" ? А если картинок много ? И у них сложный контур ?

Там же вся книжка такая, насколько я помню. На каждой странице. Я специально подбирал так, чтобы фон стал белым без какой-либо доп. очистки. Ну за счет текста через зоны, да. (Причем это только потому, что у зон в 5.91 нету опции изменения яркости.)
Но что сложнее ? Пробежаться по всем страницам выделяя текст (параметры же последней выделенной зоны при этом, ура-ура-ура, запомнены и их выставяять не надо каждый раз). Или 5-7 раз кликать в участки фона, а потом еще и чистить дополнительно ?


shch_vg

Я не думаю, что здесь для каждой картинки вследствие разных цветов нужно подбирать параметры гаммы шаманством. Там же главное - фон загнать в белый. (Сдвинуть белую точку за пик гистограммы, созданный фоном.) На крайний случай после этого подбирать контраст. Через превью результата. Но это несложно.

Я когда-то сам работу с уровнями считал шаманством. Потом на одном из форумов дали ссылку:
http://www.photoweb.ru/prophoto/biblioteka/Cifra/levels/1.htm
и все встало на место.

Я подбирал параметры гамму через гистограмму, но раз, оказывается, для зон первью есть, да еще и на изменение уровней гаммы реагирует, то совсем все просто.


Для нашей зоны с картинкой можно тогда по другому - черную и белую точку не трогать,
контраст зоны загнать в 100 (уберется фон), а затем только крутить гамму (колесиком мышки) вниз, пока цвета на превью не сбалансируются.
Общий текст сделать как ч/б, синий текст - второй зоной.

http://rapidshare.com/files/126544312/test2.spt.html
http://i040.radikal.ru/0807/13/32c72906a5ae.jpg


PS
вопрос к болега - насколько параметры гаммы в фотошопе коррепондируют с параметрами гаммы в СК и не планируете ли Вы сделать гистограмму ?
(Для зон я имел в виду.)

PPS

раз проблемы с рапидой, то сеп (test2) на ифолдер:
http://stream.ifolder.ru/7193258
Автор: bolega
Дата сообщения: 02.07.2008 16:39
shch_vg
http://ifolder.ru/7192466

noveagle

Цитата:
Я пока не пойму даже теоретически в какой ситуации это может быть кому-то удобно...

Я тоже

dma200899
Не буду спорить, т.к. каждый делает как ему удобнее и понятнее, главное, чтобы такая возможность была (т.е. делать по разному). Кстати, я не говорил, что Ваш результат посредственный, мне он нравится, я просто бы достигал бы его по-другому. Но это дело вкуса.

Цитата:
насколько параметры гаммы в фотошопе коррепондируют с параметрами гаммы в СК

Не знаю. Пока не планироввал.
Автор: shch_vg
Дата сообщения: 03.07.2008 09:04
bolega
Использовали ли Вы в выложенном Вами файле spt какие-то специфические свойства только версии 5.92? Т.е. хотелось бы знать, видим ли мы один и тот же результат?
И еще, какими свойствами обладает "новый unsharp-фильтр" и какое влияние он может оказывать на диаграммы?
Автор: bolega
Дата сообщения: 03.07.2008 09:27
shch_vg

Цитата:
Использовали ли Вы в выложенном Вами файле spt какие-то специфические свойства только версии 5.92

Да, яркость в свойствах зоны. Раньше ее не было.


Цитата:
И еще, какими свойствами обладает "новый unsharp-фильтр" и какое влияние он может оказывать на диаграммы?

Это очень сильный фильтр, который избирательно влияет на низкочастотные области, т.е. удаляет размытости, сильно подчеркивает плохо-различаемые и соприкасаемые участки и т.д. Только сейчас он работает только как preview или целиком для страницы, зоны еще не доделаны. Можете поэкспериментировать с ним в фотошопе.
Автор: shch_vg
Дата сообщения: 03.07.2008 10:45
bolega
Еще один вопрос с зонами. Пытаюсь обработать книгу с множеством цветных фрагментов трех типов. Два были представлены на выложенном мною скане, третий - диаграммы, залитые желтым фоном. Вопрос связан со значением списка DPI на закладке Format . В Вашем варианте стоит Original , т.е. DPI = 300 как у исходного скана. Я еще не знаю, в каком виде буду обрабатывать книгу, как 300dpi или 600dpi. По обработке диаграмм в ч/б зонах точно знаю, что при апсемплинге до 600 варианты Original и 600 заметно отличаются.
А как это в случае цветных зон?
Вопрос связан с тем, что если это существенно, то для обработки в другом dpi придется заходить во все зоны и менять значение списка DPI , чего очень не хотелось бы делать.

Добавлено:

Цитата:
Можете поэкспериментировать с ним в фотошопе.

Пока я держусь на "трех китах" - vuescan, SkanKromsator и DEE5.1+DEEditor.
Хотелось бы обходиться ими.

Добавлено:
Выложил фрагмент скана, содержащий две диаграммы, залитых желтым фоном, но несколько разных тонов.
Вопрос: можно ли средствами СканКромсатора добиться близкого к оригиналу результата с учетом этой разницы тонов?
Фрагмент тифа в 300 dpi 24 bit (4,5 мб) - лежит здесь.
Автор: bolega
Дата сообщения: 03.07.2008 15:31
shch_vg

Цитата:
Вопрос: можно ли средствами СканКромсатора добиться близкого к оригиналу результата с учетом этой разницы тонов?

Здесь вообще простейший случай. Задание и результат: http://ifolder.ru/7206482
Использовались только 5.91 опции. Зоны - ч/б с раскраской.
Кстати, если хотите поменять цвет зоны, то при этом не нужно зону переобрабатывать.
Раскраска выполняется на лету. Достаточно войти в свойства зоны и поменять цвет, можно это делать непосредственно в окне VR.


Цитата:
Еще один вопрос с зонами

Original - как у исходного скана (Вы правы)
Default - как у выходного файла, на котором будет зона (т.е. как правило 600)
Если это псевдо-цветные зоны (т.е. ч/б но раскрашенные), то dpi должен быть default (т.е. не ниже чем у вых. страницы), если чисто цветные - то для djvu без разницы, ведь потом при merge их dpi все равно поднимается до уровня страницы. Поэтому их можно оставлять 300dpi.


Цитата:
заходить во все зоны и менять значение списка DPI

Это можно сделать автоматом. В контестном меню любой опции зоны есть команда клонирования этой опции на все другие зоны или группу зон
Автор: shch_vg
Дата сообщения: 03.07.2008 17:03
bolega
Еще раз спасибо за разъяснения.
Вопрос по последнему примеру: цвета подбирали на глаз?
А если я, например, дальтоник?
При присваивании значения из текущего выделения получается заметное расхождение в цвете.

Еще одно наблюдение: из-за ошибки стал задавать цвет по выделению не для фона, а для текста, а все равно поля заливались желтым, правда чуть светлее.
В предложенном Вами методе заливки на мой взгляд есть один существенный недостаток - приходится очень тщательно задавать границу зоны, что не спасает, если страница слегка равернута. После этого приходится делать много ручной работы по убиранию лишнего желтого цвета.
Автор: bolega
Дата сообщения: 03.07.2008 17:25
shch_vg

Цитата:
Вопрос по последнему примеру: цвета подбирали на глаз?

Выделял на зоне участок и нажимал на кнопку с пальцем


Цитата:
После этого приходится делать много ручной работы по убиранию лишнего желтого цвета.

Ничего подобного. Я использую 2 приема: хоткей, по которому по периметру отрезается все лишнее белое. Либо Ctrl+Shift по белому снаружи от диаграмм и нажатие F7 (это у меня хоткей на команду make transparent - все, что прозрачно, не заливается фоном).
Если знаете более быстрый способ - скажите


Цитата:
А если я, например, дальтоник?

Как я?
Автор: metrim
Дата сообщения: 04.07.2008 02:15
У меня вопрос к знатокам
Достались мне сканы книги. Я их порезал, выровнял, теперь вот хочу почистить и в ЧБ перегнать
НО
Качество входного материала - плохое и результат получается ужасный.
Для примера "исходный материал":

Перепробывал разные режимы, но как то для сложных вариантов они не очень проходят.
Как бы обработать это всё в АВТОМАТИЧЕСКОМ режиме, т.к. не очень хочется воится с каждой картинкой вручную ...
Автор: shch_vg
Дата сообщения: 04.07.2008 09:31
bolega

Цитата:
Я использую 2 приема: хоткей, по которому по периметру отрезается все лишнее белое. Либо Ctrl+Shift по белому снаружи от диаграмм и нажатие F7 (это у меня хоткей на команду make transparent - все, что прозрачно, не заливается фоном).
Если знаете более быстрый способ - скажите

Очень интересная информация!
Честно говоря, первый прием я совсем не понял, а вот второй очень даже ничего.
Более быстрый ( по крайней мере для себя) я знаю. Во втором приеме при обязательно включенной auto-clear mode после Ctrl+Shift по белому снаружи от диаграмм отпускаю Ctrl+Shift и после появления крестообразного курсора нажимаю левую клавишу мыши. Мне так удобнее.
А Вы уже передумали выкладывать 5.92?

Добавлено:
Кстати, прием удаления фона по Ctrl+Shift на рисунках дает в моем случае дополнительный на мой взгляд положительный эффект - добавление в рисунок еще одного цвета, а именно цвета фона, который я не обязан убирать всюду. На взгляд отдельные фрагменты рисунка выглядят лучше, если их не осветлять, а оставлять в фоновом цвете.
В связи с этим способом удаления фона вокруг рисунка всегда появляются вертикальная черта справа от рисунка и горизонтальная снизу. Это так и должно быть?
Автор: Smokeer
Дата сообщения: 05.07.2008 07:19
metrim
Включите выравнивание освещённости. Про него писали буквально на прошлой-позапрошлой странице.
Автор: nnevt
Дата сообщения: 05.07.2008 13:21
Дайте, пожалуйста, ссылку на плагин для чтения *.djvu для коммуникаторов.

Добавлено:
Nokia E90 - может, появился плагин?
Автор: dma200899
Дата сообщения: 05.07.2008 14:06
А к СК разве есть плагины ?
Автор: vitaly1
Дата сообщения: 05.07.2008 14:06
nnevt
Гуглом находится за 2 минуты. В частности вот: http://djvi.ru/viewpage.php?page_id=8

А вообще такие вопросы относятся к этому топику - LizardTech DocumentExpress и DjVu Solo
Автор: nnevt
Дата сообщения: 07.07.2008 09:57
vitaly1
Спасибо!
Автор: VadimirTT
Дата сообщения: 07.07.2008 10:27
vitaly1
у меня на 3-ю симбу эта штука не встает
Автор: dma200899
Дата сообщения: 09.07.2008 08:00
Уважаемый bolega,

а нельзя в СК при работе с зонами предусмотреть следующее, чтобы можно было использовать "метод разделенных сканов" при сборке в джву:

1) по результатам обработки зон делать как вариант merge в два типа страниц - а) основная страница с текстом в ч/б или grey; б) цветные или серые зоны на белом фоне размером с основную страницу

2) автоматическая генерация (для нас, чайников) bat-файла, такого, чтобы если поместить его и результаты из первого пункта в директорию с DEE можно было собрать джву, в котором слой маски и слой фона были бы заданы юзером.
1а шло бы в маску, 1б шло бы в фон и кодировалось как фото.

Потому что сейчас кроме arcand этот метод никто применить-то и не может.


Автор: monday2000
Дата сообщения: 09.07.2008 10:03
metrim

Цитата:
Как бы обработать это всё в АВТОМАТИЧЕСКОМ режиме, т.к. не очень хочется воится с каждой картинкой вручную ...


http://djvu-soft.narod.ru/scan/strange_lighted.htm

Добавлено:
OFFTOP:

Не смог пройти мимо интересных ссылок, которые ИМХО имеют отношение к книгосканированию:

http://lenta.ru/articles/2008/06/26/oledtv/

http://lenta.ru/articles/2008/07/08/pioneer/
Автор: ghosty
Дата сообщения: 09.07.2008 11:42
dma200899

Цитата:
Потому что сейчас кроме arcand этот метод никто применить-то и не может.
Как это. Многие уже давно успешно применяют
Zones->Picture Zone->Merge Zones->Create separate files for non-B/W zones (ставим галочку)
После чего обрабатываем по методу manfred'a-Arcand'a. Рекомендую использовать для этого утилиту manfred'a - FSD.
Автор: dma200899
Дата сообщения: 09.07.2008 12:17
А где FSD можно раздобыть ?
Я только комплект {pnmtodjvurle, tifftopnm} видел. Поиск FSD не находит

В постах от mаnfred в ветке про сканирование ссылки на неё уже умерли

PS
Спасибо, оживили
Автор: monday2000
Дата сообщения: 09.07.2008 20:47
Выложил у себя:

FSD by Manfred v1.2

http://www.djvu-soft.narod.ru/fsd_manfred_v1_2.rar (1,04 МБ)

Это самая последняя версия.

См. также статью: Малоцветное DjVu-кодирование.
Автор: DCT
Дата сообщения: 11.07.2008 22:00
Если это уже обсуждалось - не судите строго.
Много работал в Кромсаторе, хочу поделится своим опытом и соображениями по обработки серых сканов. Часто сталкиваюсь с тем, что в нем местами сильно затруднен "контроль качества" за результатом. Если для kromsate есть "контроль" - расстановкой резаков через draftkromsate, то для отделения фона аналогичного по функциональности инструмента нету. Поэтому отделить селективно текст от фона в кромсаторе сложно - часто теряется слишком серый текст и другие малоконтрастные детали (графики итд) - проконтролировать этот процесс для отдельных "проблемных" страниц крайне сложно.
Поэтому я пользуюсь следующей методикой отделения текста от фона. Кромсатором сначала только режу сканы (и подправляю контраст малоконтрастных картинок). Результат скармливаю documenttodjvu, затем смотрю получившийся djvu в режиме отображения foreground-слоя - наглядно вижу, не попало ли что то нужное в фон (если попало - обрабатываю эти страницы отдельно, если таких страниц слишком много - поднимаю пакетно контраст и/или меняю настройки сепаратора documenttodjvu). Далее: djvudecode --layer=foreground (у проблемных страниц отделяю фон вручную). После такой процедуры читабельность сканов увеличивается на порядок (djvu довольно часто "облагораживает" вид букв), далее после отделения фона уже можно прогонять сканы через фильтры, делать descew, переводить в BW.
Только так можно быть уверенным, что не потеряется что то нужное (в режиме сравнения в кромсаторе контролировать аналогичный процесс затруднительно). Конечно, этот процесс не интерактивный (приходится возиться вручную с проблематичными сканами) - но это пожалуй лучший известный мне способ надежно наглядно и быстро отделить фон от текста (вэйвлеты для этого подходят лучше многих графических фильтров)

Пожелания из сказанного очевидны: draft background kromsate (разделение картинки на 2 слоя), с возможной последующей интерактивной подстройкой параметров аля-резаков для "проблемных" сканов.
Соответственно draft-процесс при этом может выглядеть так: на каждую страницу создается 2 временных файла с разрешением и размером равным исходному (или 2 слоя в одном файле). В ходе draft-процесса 1) автоматически расставляются резаки - всё, что за их пределами уходит на background-слой 2) из оставшегося отделяется фон в background-слой.
После draft-процесса смотреть и переключаться между 1) режимом наложения foreground на background (=исходный скан) 2) foreground-текст слой 3) background-слой (фон из текста+обрезки от страницы). При этом ОДИН РАЗ пройдясь по всем страницам можно будет раставить резаки и подкорректировать отделение фона (после корректирования параметров тут же применить к странице - поменяется распределение между foreground и background временного файла)
На финальной стадии в соответствии с резаками режется полученный foreground-слой, с которым производятся "стандартные" кромсаторские фичи (descew, resize, rotate итд)
При чернобелых сканах такой подход тоже должен быть полезным: можно легко интерактивно контролировать удаление черных полос, удаление больших пятен и despcle.

Подводя итог - мое ИМХО - для отделения текста от мусора разделение картинки на 2 слоя - наиболее рациональный полуинтерактивный алгоритм для качественной первоначальной полуавтоматической обработки сканов.
Автор: nnevt
Дата сообщения: 12.07.2008 18:49
DCT
Эх, а поподробнее - как ScanAndShare, а? Благое дело было бы...
Автор: DCT
Дата сообщения: 13.07.2008 16:48
nnevt
Эээ...А что Вас более конкретно интересует?
Автор: nnevt
Дата сообщения: 13.07.2008 21:32
DCT
Да лень вселенская заговорила: подайте им все сразу разжеванное...
Автор: Arcand
Дата сообщения: 14.07.2008 15:48
noveagle

Цитата:
В новой версии 5.91 появилась неожиданная "фича" (баг?):

1. Находимся окне Result View в режиме Erаser.
2. Изменим масштаб/zoom произвольным образом.
3. Переключаемся в Auto-despecle mode, нажав на красную кисточку.
4. Замечаем, что масштаб/zoom самопроизвольно изменился.

Приходится снова вручную ставить фокус экрана, как он был в режиме Eraser.

Цитата:
Я пока не пойму даже теоретически в какой ситуации это может быть кому-то удобно... Лично мне это сразу стало мешать
Нечто подобное просил по крайней мере я. Дело вот в чем. Чищу сканы в режиме Auto-despecle или Clear в постобработке и вижу например кляксу, которая налезла на текст, или ее просто так не достанешь. Включаю резинку, увеличиваю масштаб, чищу/правлю. Переключаюсь в прежний режим и красота - масштаб прежний, не надо крутить колесико мышки. Без задержек топаю дальше
Автор: Olive77
Дата сообщения: 16.07.2008 08:16
подскажите плиз с какими установками обрабатывать страницы содержащие разного рода графики (типа гистограмм и т.д.) (без использования picture-zones)

Проблема в том, что СК оставляет только контуры, а все черное внутри контура заменяет на белое.

Пример:
_http://rapidshare.com/files/130040142/Si.rar.html
1.8 MB

P.S.: SK 5.91

bolega
Спасибо
Автор: dma200899
Дата сообщения: 17.07.2008 09:52
А в СК есть ограничение на число обрабатываемых страниц ?

Пытаюсь загрузить книжку в 1300 страниц - ругается,
700 - ругается,
600 пролезло.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.