Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: ghosty
Дата сообщения: 12.11.2007 21:42
kontiky
Книги бывают разными. Для некоторых необходима как предобработка (в том случае, если, к примеру, есть пометки ручкой), собственно обработка и постобработка.
А для некоторых и просто обработкой можно обойтись
Автор: Alexx S
Дата сообщения: 12.11.2007 22:57
kontiky

Цитата:
По поводу постобработки... Мне казалось, следует добиваться такой настройки параметров кромсатора, что бы после автоматической обработки, в Result View, нужно было только убедиться в том, что все Ок. Если же нет, изменить параметры sk и выполнить обработку по новой. С ваших же слов выходит, что этап постобработки так же обычен и нужен, как и собственно сама обработка. Я работаю в sk неоптимально?


Все зависит от ваших требований к качеству книги. лично я весь мусор вычищаю, он меня раздражает, а его полное отсутствие приносит моральное удовлетворение А полсностью от него избавиться на автомате невозможно - многие спеклы имеют размер, равный или больший знакам препинания.
Поскольку, книги я делаю для души, времени мне не жалко, а уходит его много.
Автор: kontiky
Дата сообщения: 13.11.2007 01:34
Alexx S

Цитата:
лично я весь мусор вычищаю, он меня раздражает

Меня тоже. Но я делаю это до автоматической обработки, а не после.
Автор: ghosty
Дата сообщения: 13.11.2007 02:12
kontiky

Цитата:
Но я делаю это до автоматической обработки, а не после.
И что Вы для этого делаете?
Автор: kontiky
Дата сообщения: 13.11.2007 07:49
ghosty

Цитата:
И что Вы для этого делаете?

Просматриваю то, что получилось после автоматической обработки в режиме Result View и, если нужно что-то поправить, выхожу из этого режима в основное окно sk и уже здесь подчищаю то, что нужо поправить. Пройдясь так по всей книге, повторно запускаю автоматическу обработку.
Автор: Alexx S
Дата сообщения: 13.11.2007 08:06
kontiky

Цитата:
Просматриваю то, что получилось после автоматической обработки в режиме Result View и, если нужно что-то поправить, выхожу из этого режима в основное окно sk и уже здесь подчищаю то, что нужо поправить. Пройдясь так по всей книге, повторно запускаю автоматическу обработку.

Снимаю шляпу, месье поинимает толк в извращениях
Автор: kontiky
Дата сообщения: 13.11.2007 10:50
Alexx S

Цитата:
Снимаю шляпу, месье поинимает толк в извращениях

У вас есть алгоритм лучше? Поделитесь.
Автор: Alexx S
Дата сообщения: 13.11.2007 11:30
kontiky

Цитата:
У вас есть алгоритм лучше? Поделитесь.


Смотря для чего. На серых сканах имеет смысл вычищать лишь ограниченный ряд дефектов - выделение маркером, бледным карандашом и т.п.

Большинство же мусора в виде всевозможных точек и групп точек гораздо удобнее чистить уже на черно-белых изображениях в редакторе постообработки. Для этого и существует выделение спеклов цветом и инструмент Despecle
Автор: shch_vg
Дата сообщения: 13.11.2007 11:33
kontiky

Цитата:
У вас есть алгоритм лучше? Поделитесь.

Зачем выходить из Result View?
Поправляйте прямо в нем, затем переходите в нем же к следующей странице.
Гораздо быстрее
Конечно, если Вы хотите иметь чистые исходные сканы, тогда другое дело.
Автор: bolega
Дата сообщения: 13.11.2007 12:14
Прошу прощения у уважаемых посетителей данного топика, должен признаться, что в последнюю версию подло закралось несколько очень серьезных багов.
1) В draft при включенной use threads при определенных (но редких) обстоятельствах. Если сканы развернуты, и в draft задано поворачивать их и сохранять, то в некоторых редких случаях это может привести к порче скана (один скан запишется на место предыдущего). Настоятельно рекомендую пока отключить опцию use threads.
2) В обработке опция background cleaner не работает (выдает index out of range) если сканы - развороты.
Баги исправлены. В ближайшее время выложу.

По поводу preview denoise. Его можно прервать нажав Esc (возможно, что среагирует с задержкой). Буду думать, как его ускорить. Он дает превосходные результаты по сглаживанию букв и затягиванию дырок, улучшает даже корявые и рваные буквы (проверять это лучше на небольшом выделении, а не на всем скане). Я использую contour presicion=от 3.2 до 4 (хорошее сглаживание дает 3,5, чем меньше тем лучше сглаживание и затягивание неровностей) , Calc presision =10 (чем меньше, тем лучше). Остальные параметры влияют незначительно. В случае цветных букв после denoise они становятся не только гладкими, но и практически одноцветными, т.е. цветной мусор и неоднородности практически полностью исчезают.

=================
Сделал еще одну фичу. В свойстах зоны можно указать цвет текста и цвет заливки. Предназначен для b\w зон. Применяется это в следующих случаях. Если есть скан, в котором имеется цветной текст (или что-то еще цветное, но одного цвета в пределах зоны), то такой участок можно обработать как черно-белый, и только при слиянии зоны заменить цвет текста с черного на другой (при этом во view result цвет при показе будет заменяться на заданный, но только при показе, файл изменяться не будет). Особо выгодна такая возможность для pdf. В этом случае нет необходимости переводить зону в цветной формат вообще! Она оставляется ч/б, а для ее раскраски используются средства самого формата pdf по раскраске объектов. Это дает хороший выигрыш в размере pdf, т.к. нет необходимости хранить в нем цветные изображения.
Аналогично цвету текста, в зоне можно задать цвет заливки. В этом случае зальется все, что имеет белый цвет (т.е. фон). В книгах нередко встречаются подобные выделения: текст на сером или цветном фоне. В этом случае создается зона с форматом Color=b/w clean (такой формат уже есть в версии 5.9) и задается цвет заливки.
Про формат зоны b/w clean я уже как-то упоминал (пример скриншота b/w скана с текстом на фоне сильной грязи есть на моем сайте), она используется как для серых/цветных, так и для ч/б сканов. Позволяет избавиться от фона или от сильной грязи, на фоне которой напечатан текст (в случае b/w-скана).


Автор: kontiky
Дата сообщения: 13.11.2007 12:26
Alexx S
shch_vg

Цитата:
Зачем выходить из Result View?

Меня смущает, что если я начну работать в Result View, а потом увижу, что допустил ошибку в параметрах автообработки или что там можно было сделать лучше, то мне придеться или мириться с этой ошибкой, или фактически потерять то, что я наделал руками в Result View.
Вот, например, вижу я в Result View, что угол автоповорота страницы sk определил неправильно. Я могу подправить угол наклона для автообработки и выполнить ее еще раз, а могу внести поправку в Result View. Что посоветуете?

Добавлено:
bolega

Цитата:
Настоятельно рекомендую пока отключить опцию use threads.

Я специально не экспериментировал, но опция use threads особенного ускорения работы не дает. Скорее даже совсем наоборот. На моей домашней однопроцессорной машине (даже без гипертрединга) книга с включенной этой опцией обрабатывается минут 50, а без этой опции таже книга обрабатывается минут 20-25 (в первом случае скорость обработки составила 4-5 страницы в минуту, вот втором - более 10-15). Спреведливости ради должен сказать, что в первом случае на компьютере можно было параллельно еще чем-то заниматься, а во втором - как и было в более ранних версиях - жуткие тормоза. Даже не знаю, что теперь лучше.
Автор: bolega
Дата сообщения: 13.11.2007 12:39
kontiky

Цитата:
то мне придеться или мириться с этой ошибкой, или фактически потерять то, что я наделал руками в Result View.

Не всегда. Кромсатор запоминает то, что чистилось во view result для последней вычищаемой страницы. Т.е. вы почистили и вдруг заметили, что нужно перекромсать страницу. Вы переобрабатываете ее, затем в контекстном меню команда Restore clear selections нарисует на скане вычищенные ранее прямоугольные области (к сожалению, не учитываются участки, чищенные с помощью непрямоугольных выделений, а также ластиком, но это пока). Если позиция спеклов изменилась, то подсвеченные выделения можно подвигать с помощью Ctrl+стрелки. Если теперь нажать delete, то кромсатор воспроизведет чистку (включая и despeckle). Чтобы отменить чистку, нужно просто нажать мышку.

Добавлено:
kontiky

Цитата:
опция use threads особенного ускорения работы не дает

Для обычных ПК это по-видимому логично, хотя увеличение времени в 2 раза крайне подозрительно. На моей двухъядерной машине выигрыш хоть и небольшой, но все-таки есть.
Можете попробовать в option опцию priority=очень низкий (ввел в 5.9), ниже в windows уже не сделаешь. И сказать, дало ли это что-нибудь.
Спасибо
Автор: Alexx S
Дата сообщения: 13.11.2007 13:03
bolega

Цитата:
Сделал еще одну фичу. В свойстах зоны можно указать цвет текста и цвет заливки

Если помните, я не так давно делал подобную книжку, но с одним отличием - там было сочетание красного и черного цветов вручную их разделить не представлялось возможным, вот если бы новую команду доработать до того, чтобы кромсатор сам выделял зоны другого цвета с заданной чувствительностью, это было бы здорово
Автор: bolega
Дата сообщения: 13.11.2007 13:31
Alexx S
А у Вас не остался скан, было бы хорошо если бы выложили пару-тройку типичных сканов.
Мой метод подходит, только если нет соприкосновения черного и цветного, иначе их не разделишь одной зоной. В противном случае можно поработать над другим способом (который Вы упомянули, автор Arcand) - отфильтровывать какой-то цвет с заданной чувствительностью и помещению его в прозрачную зону-маску.
Автор: Alexx S
Дата сообщения: 13.11.2007 14:23
bolega
Осталось
http://rapidshare.com/files/69410827/249_482.rar.html
http://rapidshare.com/files/69410828/25_189.rar.html

Два архива по 2 картинки, по 8Мб каждый

Надо будет еще -выложу.

Соприкосновения есть. А способ от Arcand в моем случае дал отличные результаты.
К тому же, мне думается, что не очень сложно сделать разделенные сканы - выделять один цвет и накладывать его повех черно-белого текста. Но с ПДФ сложнее будет, наверное.
Автор: shch_vg
Дата сообщения: 13.11.2007 14:48
kontiky

Цитата:
Я могу подправить угол наклона для автообработки и выполнить ее еще раз, а могу внести поправку в Result View. Что посоветуете?

Я такие повороты делаю в Result View - так быстрее.
Автор: kontiky
Дата сообщения: 13.11.2007 21:02
shch_vg
Попробую, использовать редактирование в Result View, как все тут советуют.
Автор: chesskom
Дата сообщения: 14.11.2007 04:46
(...)
Автор: bolega
Дата сообщения: 14.11.2007 07:10
chesskom
Вы извините, но качество Ваших книг (особенно на englishtips) не выдерживает никакой критики.
Автор: pepux
Дата сообщения: 14.11.2007 12:56
bolega
Если можно, пожалуйста, замените zigzag навигацию на последовательную (верх-низ-верх-низ) (или, может, скроллинг сделать с переходом на следующую страницу?). Если я правильно понимаю, то стиль zigzag очень удобен при использовании мыши. А если используется хоткей, то в чём смысл zigzag'а? Всё-таки, на мой взгляд, для восприятия обработчика более адекватным было бы последовательное движение, а в zigzag'е всё время кажется, что что-то пропустил. Спасибо.
Автор: Alexx S
Дата сообщения: 14.11.2007 22:52
bolega
Попользовавшись немного очисткой с мигающими спеклами, пришел к выводу, что режим мне не нравится - вместо того, чтобы бегло пробегать глазами текст, надо ждать, пока спеклы мигнут пару раз... В общем, каюсь и посыпаю голову пелом - надежды не оправдались
Но, всесто того, чтобы раскаяться и уйти в монастырь, я измыслил очередную гадость.
Думаю, по карнитке все понятно - выделяем цветом не спеклы, а текст:



Поскольку у всех мониторы с разной констрастностью, можно задавать цвет или "прозрачность" черного.


Автор: Dig100
Дата сообщения: 15.11.2007 19:23
прошу прощения,не нашел пароль к архиву
Цитата:
Текущая версия: 5.81 NY (пароль к rar-архиву ищите тут в топике)

не подскажет ли всезнающий олл?
Автор: vitaly1
Дата сообщения: 15.11.2007 19:31
Dig100
Текущая версия 5.9 - без пароля. Описание - на предыдущих страницах.

Добавлено:
Alexx S
Можно картинку чуть урезать? Или вообще только эскиз вставить, кому надо посмотрит.
Автор: Alexx S
Дата сообщения: 15.11.2007 20:27
vitaly1
Сделал
А вообще, мне даже утром, которое, как известно, вечера мудренее, идея нравится - все дело в том, что при любом цвете подстветки спеклов, самый яркий и констрастный - это чертный цвет основного текста, и что-либо заметить на его фоне очень сложно... как только я его поменял на серый, мусор сразу стал бросаться в глаза, спеклы даже визуально увеличились.
Автор: PIRASOFT
Дата сообщения: 15.11.2007 23:03
Hello everyone!

Sorry for bothering you guys with this coment, I only want to express an small idea wihtout irrespecting anyone here.

I'm very grateful with Bolega for his incredible effort developing ScanKromsator and his genorus act of share it with all of us!!.

In my particvular case I'm focus in chess books, so I start scanning book; first scanning direclty to PDF without any editing work, then working in MS Paint and MS Picture, very basic image edintg program, and by now working with VueScan, Clear Image, Photoshop and Scan Kromsator.

I'm a sefleaner, never went to any instute or scholl to learn about Computer, software or any related about it. and because my chess activity I have the oportunity to talk with a lot of people who are interested in work creating chess material in electronic format. The main problem I found is that a LOT of people have no knowledges about using their PC, actually have no knowledges about OS use, something that is pretty basic. Of course for poeple who have experience or knowledges about PC or software it can sounds really "INCREDIBLE" but it is true, unfortunally.

As this chess interested people they are a lot of people who will be very interested in work creating ebooks. Actually, for example I'm a member of a spanish readers books that work digitalazing material, and they run a OCR process over them, that means their production is TEXT files in DOC or PDF, not images, that means a LOT of work, really a LOT!! and they have around 2,000 titles produced in several years. Few time ago I try to talk with them about how to use image processing software in order to speed his work (for them produce a title take a lot of time and effort, after scan the book , they ran the OCR process, and then somebody else ran a proffreading process correcting the book).

Sorry for the long coments but I want to show a little bite of the reality around, and in my opinion of course, if we be able to give to the rest of the people the oportunity to know and learn how to use a program like SK, it will be a very good thing.

Of course I understandt the idea of if somebody want to use it , he/she must dedicated enough time to adquire knowledges about image procesing, digitalizng process and so on., theoretically it must be the way to be, but in reallity it is pretty hard to achieve that. If you don't gave the people a easy way to do the thing 99% of them will not do it. Sounds so dissapointed but it is the cruel true.

Ok that is enough crazy talk from me, sorry for that, I want to repeat that my intetion is not irrespect anybody here!.

Best regards!
PIRASOFT
Автор: ghosty
Дата сообщения: 16.11.2007 00:30
PIRASOFT
We tried helping you. But what can we do if you tend to make your work even harder.
The whole technology is optimized for grey scans. If you scan in grey mode, I am ready to write a short instruction with only 3 or 4 short sections.
But if you want to go on scanning in BW, I cannot help you. Alas!

Добавлено:
Alexx S

Цитата:
Думаю, по карнитке все понятно - выделяем цветом не спеклы, а текст:
Думаю, можно было бы выделять цветом как текст, так и спеклы: цвет спеклов все-таки тоже можно подобрать таким образом, чтобы они казались крупнее/заметнее. Мне нравится.
Хотелось бы предложить возможность работы ластиком в режиме Despecle: т.е. ластик удаляет только спеклы, а текст оставляет нетронутым.
Автор: PIRASOFT
Дата сообщения: 16.11.2007 03:46
Ghosty!
Thx for your offer sir! I really apreciate that.

Actually there is a few sources of scanning, we have a user who is scanning in greyscale, and antohers who scan in B/W as everybody point with 100% reasson, greyscale give the best rersults, after procesing it if you know how to do it of course. If the scanner don't know how to process it, unfoirtunate for him, and he will send the images to be processed by someboyd else, B/W is the best choice, the quality resulting will be worst but you can't ask somebody to do what he don't know how to do.

My previus comnent was about the idea of create an explanation about how to work with SK or Help file, thank you very much for your offer again!.
I will upload few pages scanned in greyscale in order to ask for your advice.

Best regards!
PIRASOFT


Автор: Alexx S
Дата сообщения: 16.11.2007 08:51
ghosty

Цитата:
цвет спеклов все-таки тоже можно подобрать таким образом, чтобы они казались крупнее/заметнее


Подбирал, почему-то оказалось, что замнее всего черное на белом


Цитата:
Хотелось бы предложить возможность работы ластиком в режиме Despecle: т.е. ластик удаляет только спеклы, а текст оставляет нетронутым.


Имеет смысл хотя бы потому, что для Despecle нужно два клика, а для ластика - один. В случае, когда мы имеем дело не с группами точек, а с одиночными спеклами, будет удобно... а с тем же Shift-том можно уже чистить все
Автор: bolega
Дата сообщения: 16.11.2007 10:18
Alexx S
ghosty
Ваши предложения мне очень понравились. Я попробовал чистить в мигающем режиме, так спеклов в итоге осталось больше, чем вообще подсветку не использовать. Единственное, для чего красная подсветка оказалась годна - это в целом визуально оценить степень грязноты скана. Ну еще если исходые сканы - b/w, то по команде Result->Show source files можно увидеть, что будет вычищено при fine despeckle.

Кстати, в версии 5.9 в режиме ластик фильтр рендеринга можно оставить включенным, при этом если есть подсветка, то она тоже будет отображаться. См. контекстное меню Options->Zoom filter in eraser mode (вкл/выкл).

Добавлено:
shch_vg

Цитата:
Попытки перевести ее в другой преоритет ни к чему не приводят. Нельзя ли на это повлиять как-то программно?

Предусмотрел (через опцию в ini-файле)


Цитата:
И еще вопрос: сейчас дежавю и pdf разбераются на тифы в директорию Tempsk. нельзя ли как-то изменить этот путь (м.б. через файл sk.ini?

Tempsk - это дефолтное имя временной директории. Имя можно изменить в Options->Temp folder.
Кромсатор использует две временные папки. Одна - это общесистемная временная папка. Фалы там создаются кромсатором и удаляются при ненадобности. Вторая - для импортированных сканов и временных файлов, создаваемых при создании pdf (в этом смысле она условно-временная, т.к. автоматически чистится только во втором случае).

Автор: shch_vg
Дата сообщения: 16.11.2007 13:53
bolega

Цитата:

Предусмотрел (через опцию в ini-файле)

Как я понял, это будет в следующей версии? М.б. имеет смысл сообщить сейчас по горячим следам имя и параметры опции, чтобы не возвращаться к этому вопросу позже.

Нужно сказать, что сейчас импортировать djvu и pdf стало просто замечательно прямо в Кромсаторе. Мне эта возможность заменила две программы.
Что касается PDF, то у меня такой вопрос: как узнать, с каким разрешением содержатся в нем сканы? Ранее при разборе PDF в программе разборки можно было это указать в настройках, а Ваша программа определяет это автоматически.

Спасибо за копирование по местоположению курсора мыши, но нельзя ли сделать, чтобы он задавал не левый верхний угол копируемого прямоугольника, а его центр (так легче и естественней позиционировать перенос шахматных диаграмм).

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.