Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: bolega
Дата сообщения: 31.01.2011 12:52
monday2000

Цитата:
Вы точно уверены? Я, разумеется, думал, что блит всегда связен

Уверен точно. Возможно, что несвязность возникает только для больших блитов. Но это не отменяет сам факт.

Вот пример несвязности блитов: http://www.onlinedisk.ru/file/600411/
В архиве 3 djvu:
normal.djvu - это то, что необходимо получить (правильный вариант)
bad.djvu - это то, что получилось при раскрашивании 4-мя прямоугольниками (последовательность была такая: синий, черный, красный, черный. черные нужны были, чтобы вернуть цвет тексту в прозрачной области зон).
bw.djvu - ч/б djvu, из которого доставались блиты
Сами блиты, точнее, часть их, находятся в папке blits. Номера файлов соответствуют номерам в sjbz-чанке.
Положил также образец сложной раскраски example.djvu, сделанной СК.

Автор: monday2000
Дата сообщения: 01.02.2011 10:59
bolega

Цитата:
Вот пример несвязности блитов: http://www.onlinedisk.ru/file/600411/

Спасибо, посмотрю внимательно.
Раз уж блиты могут быть несвязными, то это, конечно, плохо. Надо бы ещё копнуть поглубже в формат DjVu - наверняка блиты не являются элементарными объектами, и их несвязные части можно разделить (т.е. получить только связные блиты).

А я вот, как ни забавно, до сих пор не прочитал полностью спецификацию DjVu. Некогда. Заткнуть бы самые большие дыры в технологии DjVu-книгосканирования - а там уж можно будет и в деталях разбираться.
Автор: bolega
Дата сообщения: 01.02.2011 12:06
monday2000

Цитата:
их несвязные части можно разделить (т.е. получить только связные блиты).

Да, судя по всему, это сделать не сложно. При условии, что эти блиты не находятся в общем словаре и не помечены как разделяемые, т.е. на их базе не строятся другие блиты.

Кстати, реализованный мною способ правки размера sjbz позволяет в принципе реализовать еще одну фичу (которая есть в acrobat, но нет в djvu): обрезание, или наоборот, наращивание, полей в готовом djvu - т.е. crop. Правда, сложность там будет с другими слоями (FG,BG и т.д.). Как их безболезненно кропить, я еще не смотрел.

Автор: ghosty
Дата сообщения: 05.02.2011 21:29
bolega
Я помню, что в СК была возможность задавать после бинаризации цвет текста и фона. Только не помню - это только для зон возможно или для всего файла целиком. Может быть, можно как-то задавать цвета текста/фона уже на этапе постобработки в окне RV?

В общем, хотел бы спросить, какой наиболее оптимальный путь обработки Вы могли бы предложить для такой обложки:
http://ifile.it/qn6dh9s/Image%200001.tif

Вот, что получилось с применением зон:
http://ifile.it/gd7mzta/test.rar
Вроде, неплохо, но повторяю, почему-то мне казалось, что есть путь без выделения зон. Или я не прав?
Автор: bolega
Дата сообщения: 06.02.2011 01:44
ghosty

Цитата:
Только не помню - это только для зон возможно или для всего файла целиком

Только для зон.


Цитата:
Может быть можно как-то задавать цвета текста/фона уже на этапе постобработки в окне RV?

Да, можно конечно. Т.е. цвета можно менять на лету, при этом переобработка не требуется. Единственное условие - страница с зоной должна быть финализирована. Иначе свойства зоны в окне VR не вызвать. Свойства зоны можно менять в окне постобработки. Для этого нужно дважды щелкнуть на зоне.
Ваш вариант мне вполне нравится. Но я бы в свойствах данной зоны не использовал бы denoise и smart blur. Эти опции больше подходят к серым/цветным зонам. Для изначально ч/б по сути иллюстраций они иногда приводят к потерям деталей. И раз уж Вы обрабатываете обложку как зону, то еще бы я в избавился далее от белых полей: в контекстном меню зоны (в окне VR) вызвал бы команды Adjust (crop) page->width и Adjust (crop) page->height. Эти команды подгоняют размер страницы под размеры (или координаты) зоны.
Кстати, для smart blur я бы рекомендовал увеличивать радиус до 6-7, а порог уменьшать до 20. Это позволить получать более сильное сглаживание (однородность) не боясь при этом размывания резких деталей (букв, штрихов и т.п.)

================
Вот здесь положил 4 тифа: http://www.onlinedisk.ru/file/603672/.
Первый тиф - это исходный обработанный ч/б скан. 2-й тиф - это полученный из 1-го, обработанный по технологии, очень похожей на акробатовской clearscan (смотреть все лучше при большом увеличении). Как видите, результат - почти сказка. Если бы не одно но: изображение стало серым. После бинаризации (3-й тиф) уже не все так красиво, но тем не менее сглаживание букв все таки имеет место. Качество можно сохранить, если перед бинаризацией удвоить разрешение до 1200dpi - 4-й тиф. При этом размер djvu конечно возрастает. djvu прилагается.
Данный пример показывает, что технология типа clearscan хороша в основном для просмотра на экране и при печати. При бинаризации же результата ее преимущества уже не так заметны (при том же dpi). Если же dpi увеличить, то результат вполне ничего. Однако это надо еще будет исследовать на полной книге. В моем примере выбрана только одна страница, причем с иллюстрацией, которая заметно добавляет веса в djvu-файл. Возможно, что для книги с общим словарем размер будет вполне приемлим, т.к. буквы получаются очень гладкими.

=================
Еще одна фича из новой версии СК: опция для зон descreen. В архиве два типичных примера обработки с помощью этой опции (смотреть с увеличением). Как видите, качество картинки улучшается кардинально.
http://www.onlinedisk.ru/file/603673/
Descreen - это опция без параметров настройки. Все делается автоматом. Для ее работы требуется fftw.dll с сайта http://www.fftw.org/. DLL выполняет быстрое преобразование Фурье.
Идеей и алгоритмом descreen любезно поделился Cptn_Cook
Автор: ghosty
Дата сообщения: 06.02.2011 02:34
bolega
Спасибо за рекомендации.

Цитата:
Но я бы в свойствах данной зоны не использовал бы denoise и smart blur.
Я подумал, что они помогут лучше отфильтровать грязь на обложке, как бы "дефрагментировав" ее.


Цитата:
Первый тиф - это исходный обработанный ч/б скан. 2-й тиф - это полученный из 1-го, обработанный по технологии, очень похожей на акробатовской clearscan (смотреть все лучше при большом увеличении).
В каком смысле похожей? Векторизация без OCR (рисунок, вроде, тоже векторизован)? И СК это теперь умеет делать?

Цитата:
Данный пример показывает, что технология типа clearscan хороша в основном для просмотра на экране и при печати.
На мой взгляд, это и станет теперь приоритетом - максимальная эргономичность, комфорт для глаз, качество печати. Уже нет смысла этим пренебрегать за счет уменьшения объема файла.


Цитата:
Descreen - это опция без параметров настройки. Все делается автоматом.
Для автоматического режима действительно очень неплохо. Хотя явно виден краевой эффект и, похоже, снижение качества descreen в темных зонах. Хорошего descreen-алгоритма в СК очень не хватало.
Автор: bolega
Дата сообщения: 06.02.2011 11:14
ghosty

Цитата:
Я подумал, что они помогут лучше отфильтровать грязь на обложке, как бы "дефрагментировав" ее

Да, мусора станет меньше. Но denoise я не рекомендую применять. SBlur вполне хватит, и он на порядок быстрее делается.


Цитата:
И СК это теперь умеет делать?

Я еще окончательно не решил, стоит ли добавлять в СК эту возможность. Нужны еще эксперименты.


Цитата:
Хотя явно виден краевой эффект и, похоже, снижение качества descreen в темных зонах

Нет, дело не в краевом эффекте. Просто алгоритм вносит побочный шум в однородный фон, независимо от его цвета. Но учитывая, что descreen предназначен именно для картинок такого качества, в котором однородного содержимого намного меньше, чем неоднородного, то эффект от опции намного перекрывает ее недостатки. Теоретически и этот недостаток можно исправить, если научиться маскировать descreen однородных участков.
Автор: Dimock
Дата сообщения: 10.02.2011 16:38
Если одновременно запустить обработку 2-х словарей в СканКромсаторе, по одному в каждой программе, процесс каждого замедлится наполовину?

Система Win 7, 32 bit, Microsoft Office 2003 SP3, процессор AMD Phenom(tm) II X4 810, 2.59 Гц, ОЗУ – 4.00 Гб (3.52 Гб доступно).

Версия v5.93 стабильна?
Автор: Melirius
Дата сообщения: 11.02.2011 17:03
Dimock

Нет, замедление возможно только из-за одновременных обращений к диску. Поэтому я Вам советую финт ушами: сделайте себе RAM-диск и положите туда сканы для обработки + переместите папку temp для SK. Станет намного быстрее. А то у Вас и так 500Мб памяти пропадает...
Автор: Dimock
Дата сообщения: 12.02.2011 10:34
Melirius


Цитата:
Поэтому я Вам советую финт ушами: сделайте себе RAM-диск и положите туда сканы для обработки + переместите папку temp для SK.


Как сделать этот диск? Потом путь к папке temp для SK прописать в программе? Можно подробнее? Спасибо.
Автор: VadimirTT
Дата сообщения: 12.02.2011 11:15
Dimock
например
SuperSpeed RamDisk
Автор: Melirius
Дата сообщения: 12.02.2011 15:32
Dimock

У меня SK запускает такой bat-ничек

setlocal
set TEMP=q:
set TMP=q:
start sk.exe %*

q — соответственно RAM-диск.

Берите SuperSpeed RamDisk Plus или бесплатный VSuite.Ramdisk.
Автор: Dimock
Дата сообщения: 12.02.2011 19:16
VadimirTT
Melirius

Спасибо.
Автор: monday2000
Дата сообщения: 18.02.2011 09:05
Я сделал в Википедии статью о ScanKromsator:

http://ru.wikipedia.org/wiki/ScanKromsator

Надеюсь, её не сотрут. Но даже если и сотрут - то мы хотя бы будем знать, что их не устроило.

Приглашаю всех желающих дополнить эту статью (но не нарушайте при этом правил Википедии).
Автор: Nick222
Дата сообщения: 21.02.2011 23:40
Правильно ли я понимаю, что версии СК под Линукс нет?
Автор: monday2000
Дата сообщения: 22.02.2011 08:45
Nick222

Цитата:
Правильно ли я понимаю, что версии СК под Линукс нет?

Нет, но можно запустить через Wine:

http://biotex.ibss.org.ua/libsoft_profile.html?id=31
Автор: Eduardo2
Дата сообщения: 23.02.2011 00:21
У меня СК из сине-белых тиффов делает черно-белые. Как его настроить, чтобы сохранить книжные цвета?
Автор: shch_vg
Дата сообщения: 23.02.2011 19:14
Eduardo2
Все экстрасенсы сейчас в отпуске!
Нужны сине-белые тиффы (1 штука) + spt-файл Вашего задания, делающего его (тифф) черно-белым.
Автор: VadimirTT
Дата сообщения: 26.02.2011 11:44
Как обработать такую страничку с рисунком?
_http://www.onlinedisk.ru/file/616251/
Автор: shch_vg
Дата сообщения: 26.02.2011 13:20
VadimirTT
Так не подойдет?
Автор: VadimirTT
Дата сообщения: 26.02.2011 15:11
shch_vg
Вполне, мне интересно минимум телодвижений сделать.
Книга 37 года, хотелось бы что бы людям было полезно и приятно
Автор: shch_vg
Дата сообщения: 26.02.2011 18:28
VadimirTT
[more=Вот мой spt-файл]V5.88
1
[CMNT]=
[A]=*;out;;1;0
[B]=1,0,3,0,1,0,2,0,0,0,4,0,0,1,0,0,0,0,0,0,0,0,2,0,2,0,0,0,0,0,1,1,2,4,7,180,160,150,1,0,0,1,3,5,6,10,0,1,1,12880,1,67175172,1,21390492,1244460,4598962,1244532,2,0,2000242334,0
[MPTIF]=0
[PROCRES]=
[FILES]
[A]=1
[FFNAME]=L:\dl\2011\inform\raznoe\VV 0022.tif
[FNAME]=VV 0022.tif
[B]=0,0,0,0,19714,0,0,0,0,92,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,31,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,1,1,0,0,0,1,10,1,10
[X]=(290,1744,345,2505)
[X1]=100
[X2]=(100,1,6,1,0,10255,198,314,1651,2473,198,314,1651,2473,0,0,0,0,100,255,10,70,1,0,38400,0,16777215,0,0,4,3,40,7,100,10,80,0,0,1,1,0,204816,50),
[E]=1536,0,1,1,1,1,0,255,0,3,20,0,-1,-1,0,1,0,0,0,0,0,0,0,0,0,0,0,0,1,0,150,17,5,0,0,0,100,255,0,10,70,1,0,10,50,1,0,2,0,3,100,1,0,6,5,1,0,0,2,50,1,0,0,0,0,0
[ENDF][/more]
Автор: bolega
Дата сообщения: 27.02.2011 00:01
Вот мой вариант: http://www.onlinedisk.ru/file/616609/
djvu делался самим СК.
Задание пока не выкладываю, т.к. в старых версиях его не воспроизвести.
Основных отличий два: текст обработан новым фильтром contour smoothing, для получения djvu СК вызывает DEE, передавая ему ч/б страницу, затем сам вклеивает в него зону.
Автор: slava_kry
Дата сообщения: 27.02.2011 06:10
VadimirTT
Если не влом повозиться с рисунками, то можно сделать подобное

Дальше сами решайте, но как-то варварски такие хорошие картинки так сильно сжимать, как в предложенных вариантах.
Автор: VadimirTT
Дата сообщения: 27.02.2011 06:22
bolega
Если не требуется много ручной возни, может я выложу на обменник все картинки (40 страниц) для обработки? А книга - Атлас важнейших видов сорных растений СССР академика Мальцева, 1937 г., Сельхозгиз.
Автор: slava_kry
Дата сообщения: 27.02.2011 06:26
VadimirTT
Давайте
Автор: VadimirTT
Дата сообщения: 27.02.2011 06:28
slava_kry
Вы с bolega совсем по разному сделали, можно сказать, альтернативный поход к обработке подобных иллюстраций. Если честно, то мне вариант от bolega больше нравится.

Автор: slava_kry
Дата сообщения: 27.02.2011 06:31
Хорошо...
Автор: ndch
Дата сообщения: 27.02.2011 09:47
VadimirTT

Цитата:
альтернативный поход к обработке подобных иллюстраций

В чём альтернативность ?
Автор: VadimirTT
Дата сообщения: 27.02.2011 11:58
Цветные вкладки к атласу (400 МБ), 40 штук + 1 страница с текстом, для выбора размера страниц
http://www.onlinedisk.ru/file/616695/
http://www.onlinedisk.ru/file/616739/
http://www.onlinedisk.ru/file/616757/
http://www.onlinedisk.ru/file/616781/
http://www.onlinedisk.ru/file/616725/

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.