Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: bolega
Дата сообщения: 01.02.2008 16:05
asdf128
Под линукс уже давно есть крутая any2djvu
Автор: Torino
Дата сообщения: 01.02.2008 16:45
bolega

Вопрос из любопытства: версия 6 Кромсатора когда ориентировочно ожидается?
Хотя в 5.91 все устраивает.
Автор: DmitryKz
Дата сообщения: 01.02.2008 18:15
Torino
Тут все боятся, как бы 5.91 последней не оказалась, а Вы 6-й интересуетесь.

Добавлено:
Тем более

Цитата:
в 5.91 все устраивает

Автор: amv
Дата сообщения: 01.02.2008 18:32
asdf128
Цитата:
gscan2pdf
Похоже, что это gui для разных программ, содержательная часть -- всё та же http://unpaper.berlios.de
Замены sk-внутри-чего-то-вроде-virtualbox не предвидится
Автор: bolega
Дата сообщения: 01.02.2008 18:54
Torino
В 5.91 я уже нашел 2 бага, не считая мелких, упомянутых на форуме.
Эти 2 бага серьезные, но очень-очень редкие, и сразу видны - обработка останавливается с сообщением об ошибке (sk при этом не вылетает). Т.к. никто пока на это не жалуется, значит эти баги только у меня случались. Баги исправил, скоро выложу подправленную версию.
Над новыми фичами я пока не работаю, начну, по-видимому, только весной. Но задумки новые есть.
Автор: Torino
Дата сообщения: 01.02.2008 19:22
bolega
Понятно, спасибо за инфу.

Кстати эта ошибка у меня тоже бывала.
Появлялась после нажатия Process, в тот момент, когда обработка доходила до прежде активного файла.
Лечилось переходом на первый файл в списке и заново Process.

Теперь буду знать, что сюда можно жаловаться на ошибки в программе.
Автор: Kiljes
Дата сообщения: 01.02.2008 20:15
bolega а мануал будет создаватся? А то столько неясностей.
Автор: pepux
Дата сообщения: 02.02.2008 15:27
bolega
Каждый раз при upsample в новой версии пользовался smooth*1+blur*(2-3) и фильтром bicubic с подбором порога конвертации. Сейчас обнаружил, что bilinear даёт чуть более жирный, но значительно более гладкий результат, особенно на наклонных шрифтах italic (хотя, возможно, это неудивительно). Для bicubic ступеньки при upsample на наклонном шрифте размываются плохо и сильно бросаются в глаза. А какой выбор рекомендуете Вы?
Автор: bolega
Дата сообщения: 02.02.2008 21:15
pepux
Не знаю, мне казалось, что отличия между ними в общем случае минимальные. В теории самым оптимальным из простых фильтров является Lanczos. При upsample ч/б сканов bicubic дает более гладкие контуры
Автор: Smokeer
Дата сообщения: 03.02.2008 07:22
bolega

А недавно добавленый "mitchel"?
Автор: bolega
Дата сообщения: 03.02.2008 12:44
А что mitchel? Тоже простой фильтр
Автор: ghosty
Дата сообщения: 04.02.2008 20:40
Если при переходе в режим RV было открыто окно Grey image Enhance, то оно перекрывает собой окно RV, и не может быть закрыто. Случается это не сразу, а при свертывании-развертывании окна SK.
Автор: ghosty
Дата сообщения: 05.02.2008 10:08
Очередной триллер (теперь почти в буквальном смысле этого слова ):
http://rapidshare.com/files/89289445/3.wmv.html
Довольно неприятный глюк в работе Auto-despeckle - если линия выделения проходит через символ, есть вероятность, что часть символа пропадет (символ не содержит разрывов). С чем это может быть связано?

Воспроизводится стабильно при отключенном "Highlight speckles" при значении Speckle Size = 32 на символах "с", если линия выделения проходит по середине символа. Сам символ по размеру не является speckle. Если включить "Highlight speckles", этого не происходит.

Теперь я, похоже, догадался. Вот результат выделения:

Линия выделения немного "подрезает" все символы. Если она разрезает целиком, то часть символа в области выделения оказывается спеклом.
Автор: Gajver100
Дата сообщения: 05.02.2008 22:10
Как сделать чтобы СК не выгрызал в рисунках места со сплошными черными площадями?

Вот оригинал скана: http://webfile.ru/1726665

Вот что получилось после кромсирования: http://webfile.ru/1726647
http://webfile.ru/1726649

Второй вопрос: Есть ли на форуме люди, которые могут обработать три тома Р.В. Поля по физике? Очень хорошие по содержанию книги некоторые говорят что эти тома одни из самых лучших книг по физике Множество рисунков и схем, класс. Нужен просто человек которые все сделает очень хорошо и будет интернет пользователям счастье
Автор: bolega
Дата сообщения: 06.02.2008 10:35
Gajver100

Что-то у Вас плохо получилось, неправильно опции выбрали (буквы корявые и много шума).
Вот задание для файла, ничего не выгрызлось.
[more]
V5.6
1
[CMNT]=subtask
[A]=;out;;1;0
=1,0,3,2,1,180,0,0,0,0,4,0,0,0,0,0,0,0,0,0,180,0,0,0,2,0,0,0,0,0,1,1,2,4,7,180,160,150,1,0,0,1,3,5,6,10,0,0,0,80,0,65536
[MPTIF]=0
[PROCRES]=
[FILES]
[A]=1
[FFNAME]=014.tif
[FNAME]=014.tif
[B]=1,1,1,0,32702,0,0,1530,1719,72,3174,1,1,1,1,0,0,0,0,0,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,68,2308,0,0,1,1,0,0,0,1,1,0,0,0,0,0,2,0,4,0,0,0,0,0,0,0,0,0,0,1,1,0,1,1,0,0
[E]=781,0,1,2,2,1,0,255,0,3,20,150,-1,-1,0,1,0,0,0,0,150,0,0,0,0,0,0,0,1,0,150,17,10,0,0,3,100,255,0,10,70,1,0,10,50,1,0,2,0,3,100,1,0
[ENDF]
[/more]

[b]Добавлено:

Gajver100

Цитата:
люди, которые могут обработать три тома Р.В. Поля по физике?

Есть В каком качестве сканы?
Автор: Torino
Дата сообщения: 06.02.2008 13:15
Gajver100


Могу взять на себя один том, если сканы grayscale 300 dpi без шума и пере/недоэкспонирования.
Автор: VadimirTT
Дата сообщения: 06.02.2008 16:15
Боюсь, что это был призыв к сканированию .
Автор: Gajver100
Дата сообщения: 07.02.2008 00:24
50 разворотов из книги Р.В. Поль "Электричество" 1962 г. Помогите настроить СК на хорошую обработку этой книги или может кто возьмется сделать? Жду критику в адрес настройки яркости

1. http://webfile.ru/1729129
2. http://webfile.ru/1729133
3. http://webfile.ru/1729135
4. http://webfile.ru/1729126

bolega

Значит книжку вот эту я запарол?

http://webfile.ru/1729130

Добавлено:
bolega

Дайте свой sk.ini которым вы кромсировали кусочек книги
Автор: bolega
Дата сообщения: 07.02.2008 15:53
Gajver100

Цитата:
Дайте свой sk.ini которым вы кромсировали кусочек книги

Задание для Вашего примера я привел в своем предыдущем сообщении (под линком "Подробнее.."). Сохраните его как .spt, удалив лишние переносы строк.
В этом задании можете сохранить его профиль и применить его ко всем остальным сканам Поля. Должно получиться хорошо.
А ini-файл не нужен, в нем не содержится опций обработки.


Добавлено:
По почте меня недавно спросили как обрабатывать сканы с однородным цветным текстом, например красным заголовком или синим векторным рисунком (остальной текст на странице - обычный, т.е. черный).
Привожу и здесь свой ответ, тем более что он непосредственно связан с новыми возможностями версии 5.91

>>>>
В новой версии (5.91) это теперь делается просто.
Однородный цветной текст, или рисунок, заключается в picture-зону, в ней выставляются те же параметры, что и для страницы (b/w, 600dpi, convert threshold, despeckle, фильтры). На закладке Colors свойств зоны ставите галку на enable в панельке Text, щелкаете на кнопке с 3-мя точками или на черном квадрате и задаете цвет текста. Можно выбрать цвет непосредственно на самой картинке. Для этого нужно включить ее preview (на 1-й закладке кнопка с синим небом), окно расширится и справа появится ее изображение. Включить режим выделения (отжать кнопку с ладошкой над рисунком зоны), выделить небольшой участок на зоне с типичным цветом и нажать кнопку, на которой нарисована рука с пальцем.
Что будет происходить при обработке? Зона будет сконвертирована в ч/б и таковой и останется, поэтому в постобработке ее можно например, почистить от спеклов, также как и обычный ч/б файл. Раскраска текста на ней (точнее, всего, что имеет черный цвет) будет происходить на-лету при ее отображении в окне view result и при слиянии зоны со страницей.
Аналогично можно задать и цвет фона. В этом случае окрашиваться будет все, что имеет белый цвет. Помимо цвета, для фона можно задать также несколько вариантов градиентной заливки.
Что делать, если нужно например закрасить только часть фона зоны? Для этого после(!) обработки в окне view result в режиме показа зон (panels layout = Zones) отобразить зону в правой панели, и там все белые пиксели, которые не должны закрашиваться, сделать прозрачными. Это можно выполнить несколькими способами. Например, выделить их мышкой (прямоугольным или как правило непрямоугольным выделением) и в контекстном меню выбрать команду Special->Zero transparent. В выделении можно захватывать и черные пикселы, ничего страшного, эта команда на них не действует. Можно сделать наоборот: всю зону сделать прозрачной, а потом с нужного участка снять прозрачность (Special->Remove transparency). Все зависит от того, какой области больше, в зависимости от этого и выбирать наименее трудоемкий способ выделения. Если область замкнутая (ограничена черными пикселями, или наоборот, область снаружи от замкнутой), то выделить ее можно одним щелчком - щелкнуть внутри области, держа нажатым Ctrl+Shift.
Раскраска зон имеет еще одну замечательную особенность: изменение (подбор) цвета можно делать, не выполняя переобработку зоны. Можно даже делать это непосредственно в окне view result. При этом результат изменения цвета отображается мгновенно.
Может возникнуть еще такой вопрос: как обрабатывать участки скана, которые в оригинале имеют фон (как правило серый, но с учетом качества сканирования он может превратиться в облако точек), который использовался в книге для выделения (подсветки) текста. Пример - текст на сером фоне или на dither-подобном (грязном) фоне. Такие участки обрабатываются тоже очень просто, так же как и описано было выше. С одним исключением - цветность зоны (не путать с цветом раскраски) в ее свойствах ставится не b/w, а b/w-clean. В результате существующий сканированный фон будет удален и заменен на однородный (или градиентный, если задано) цвет, который вы задали как цвет фона. Кстати, режим b/w-clean можно с успехом применять не только к серым/цветным сканам, но и к ч/б. Если в книге присутствовал текст на каком-нибудь темном фоне, то при сканировании ее в ч/б режиме получается жуткая грязь с плохо различимым текстом (такие сканы встречаются довольно часто). Режим b/w-clean позволяет избавиться от грязи и восстановить оригинальный цвет фона.
Все выше сказанное относится как к случаю, когда зоны будут сливаться чтобы получить потом djvu, так и к случаю, когда делается pdf непосредственно из кромсатора. В последнем случае будет значительная экономия объема pdf-файла, т.к. в pdf кромсатор будет помещать ч/б скан, а его раскраску выполнять специальными командами, которые предусмотрены в спецификации pdf. Раскраска зон идеально также подходит для sep-кодирования djvu.
Автор: Alexx S
Дата сообщения: 07.02.2008 20:54
bolega
А будет ли сделан следующий шаг? Двухцветные зоны? Т.е зоны, где присутствует черный и еще один цвет.
Автор: bolega
Дата сообщения: 08.02.2008 09:20
Дополнение к моему предыдущему пояснению.
Раскраску можно применять не только к ч/б, но и к серым/цветным зонам (имеется ввиду цветность зоны на выходе, после обработки, а не цветность исх.скана). Т.к. в этом случае чисто белого и чисто черного цвета уже как правило не будет, то понадобиться с свойствах закраски задействовать параметр threshold (как для текста, так и для фона), кот. задает допустимое отклонение реальных значений этих 2-х цветов от идеальных, т.е. 0 и 255. Таким образом я менял по крайней мере фон для цветных зон; для удаления существующего фона приходилось либо в свойствах зоны отключать галку на защите от клинера, либо в постообработке убирать фон или его остатки с помощью magic clear.

Еще один момент. В версии 5.91 я изменил поведение опции transparent в свойствах зоны. Теперь, если она включена, то уже при обработке все пикселы, отличающиеся от белого на заданный threshold, станут прозрачными, невидимыми, т.е. это как бы аналог magic clean. При слиянии зоны со страницей прозрачные пикселы зоны игнорируются, т.е. как бы зачищаются. Если зона - ч/б, то значение threshold игнорируется, и все белые пикселы становятся прозрачными.

Alexx S
Да
Автор: Dracula
Дата сообщения: 10.02.2008 09:12
Всем привет!
Вот тут хочу посоветоваться с Вами. Есть книга Сёстринское дело (отсканированная и уже обработанная в SK) но видимо плохо (как я вижу сам).
Можно с этим разворотом сделать что-нибудь (у меня получилось посередине чёрная полоса). Ладно вот мой пример:

А вот что получилось:
Автор: djdtyfhu
Дата сообщения: 10.02.2008 09:36
Dracula

Пробовал откромсать разворот. В настройках Quality - Gray Enhance - Выставил Illumination в положение "Correct Illumination - Normal". Черной полосы нет.

Для увеличения качества можно еще преобразовать в 600 DPI BW.

Автор: Dracula
Дата сообщения: 10.02.2008 12:15
djdtyfhu

Цитата:
Выставил Illumination в положение "Correct Illumination - Normal". Черной полосы нет.

Вот чёрт - точно - а у меня стояло вместо "Normal" - "Smart".
Уже столько рисунков (через 1) и все с чёрной полосой. Кстати, а для чего нужен "Smart"?
И как быть с этими чёрными полосами - переделывать заново что-ли?
У меня версия 5.91 352 разворота делала:
Автор: djdtyfhu
Дата сообщения: 10.02.2008 13:58
Dracula

Я почти всегда делаю в режиме Normal, только в особых случаях пробую иные.

Насчет уже обработанных сканов наверно лучше переделать, но не все страницы, а только те которые с черной полосой.

Офигеть 7 часов?! Почему так долго?
Автор: Dracula
Дата сообщения: 10.02.2008 15:32
djdtyfhu
Я уже стал всю книгу переделывать - потом муторно будет искать и вставлять заново новые

Цитата:
Офигеть 7 часов?! Почему так долго?

Ну откуда я знаю (кстати сейчас я делаю снова её - по-моему столько же будет делать).
Хотя у меня процессор 2,58 Гц, ОЗУ всего 256 МБ (может из-за того, что у меня на диске всего 800 МБ места?).
Кто мне может подсказать - хочу отсканировать книгу не в ABBYY FineReader (как сканировал всегда) а попробовать через IrfanView (у меня последняя версия 4.10 с плагинами) - нажимаю всё как многоуважаемый VladimirTT в своём руководстве указал - но... отсканировав 1 страницу у меня окошко сканирования закрывается (6 раз пытался уже) - как это побороть? Ведь говорят, что лучше так сканировать, чем в FineReader'e - хотя у меня и есть 9 версия (где автоматическое выравнивание страницы можно уже отключить). Придётся всё-же в ФайнРидере опять сканить - обидно до слёз .
Автор: BooBoo
Дата сообщения: 10.02.2008 16:28
Dracula

А чем не устраивает скрипт от U235 v 2.2?
Или так хочется именно в IrfanViewе?
Автор: Dracula
Дата сообщения: 10.02.2008 16:35
BooBoo
Да мне без разницы где - лишь бы сканировалось отлично. Кстати а где надыбать этот самый скрипт?
Автор: BooBoo
Дата сообщения: 10.02.2008 16:41
На странице автора

__http://www.alexrey036.narod.ru/
Правила работы с ним
http://forum.ru-board.com/topic.cgi?forum=93&topic=1624&start=860#6
Автор: Torino
Дата сообщения: 10.02.2008 16:48
Dracula

По поводу программы для сканирования: пользуюсь
VueScan 8.4.37.
Скорость, комфорт и результат - на высоте.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.