Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: Kiljes
Дата сообщения: 04.10.2006 02:29
Ой. Не туда. Запостил. Извеняюсь. Удалите мой пост.
Автор: monday2000
Дата сообщения: 04.10.2006 09:33
bolega
Я решил пойти на риск и сделал новую ветку:

eBookz » Самодельные программы для обработки сканов книг

http://forum.ru-board.com/topic.cgi?forum=93&topic=1812&glp

Риск тут в том, что эта ветка может вообще остаться невостребованной на форуме - по крайней мере, в течении длительного времени.

Однако, у меня буквально в последние дни появились некоторые веские дополнительные предпосылки для создания такой ветки, о которых я пока умолчу (пока ещё ситуация не успела проясниться).

Пишу здесь для того, чтобы Вы были в курсе, поскольку открытие такой ветки ИМХО затрагивает СканКромсатор в какой-то степени.
Автор: bolega
Дата сообщения: 04.10.2006 10:06
monday2000
Я - за. Наверняка, и я почерпну там что-нибудь новенькое
Только не очень понятно, почему создание open-source программы попала в ветку вареза.
Автор: monday2000
Дата сообщения: 04.10.2006 11:34
bolega

Цитата:
Я - за.

Вот и замечательно. Здорово, что в этом наши взгляды совпадают.

Цитата:
Наверняка, и я почерпну там что-нибудь новенькое

Ну, скорее наоборот. Может быть, туда дальше раскачаетесь и тоже примете участие в обсуждении? Впрочем, сейчас пока об этом совершенно преждевременно говорить - пока ветка пуста. Развитие такой ветки будет во многом зависеть от везения - хотя уже сейчас есть кое-какие совершенно конкретные шансы.

Цитата:
Только не очень понятно, почему создание open-source программы попала в ветку вареза.

Ну а куда? В "Программы"? Так тут ещё до появления какой-то реальной программы плыть и плыть - и надо же обязательно обсудить все аспекты ещё заранее, до появления программы. Обсуждать это в ветке по сканированию книг? Так там это просто утонет - та ветка слишком универсальна.

Так что новая ветка - это "общие расуждения, со временем могущие перерасти в появление конкретной программы". А если часом таких новых программ появится не одна, а 2, или даже 3 - где тогда их обсуждать все сразу? В ветке по сканированию?

Мне вобще кажется, что ветка по сканированию - это как бы "не совсем то". То есть я имею в виду, что многое там сводится к попыткам добиться толка от уже существующих и готовых программ для работы с графикой. Но такие программы изначально не предназначены для наших специфических целей - вот и приходится писать сложные и отпугивающие чайников инструкции, и вообще пытаться "притулить горбатого к стенке".

Нужен ИМХО новый подход - сделать законченный комплекс самодельных программ для создания DjVu-книги "от и до" - заточенный именно под это, простой, удобный, понятный, маленького размера (это непременно). Конечно, полностью самодельным он быть не сможет - одно OCR чего стоит, однако суть замысла - облегчить жизнь сотням чайников, выкинув всё "лишнее", присущее набору разномастных готовых сторонних программ. Для этого, скорее всего, нужны именно преимущественно open-source программы - чтобы можно было их увязать в комплекс.

Лично я могу теоретически сделать следующее: используя MFC, написать примитивную каркасную прогу для пакетной работы с графикой - используя какую-то готовую open source библиотеку. А дальше нужно будет коллективно "нанизать" туда умные алгоритмы. Хотя прямо сейчас мне некогда - я тут ещё буду пока DjVu Small добивать до победного конца.
Автор: xitsa
Дата сообщения: 08.10.2006 14:31
Помогите побороть ситуацию:
В книге встречаются ч/б картинки, которые состоят из больших областей залитых одним цветом—черным или белым.
После того как отсканировал в 600DPI/Gray, пытаюсь в Кромсаторе получить адекватную картинку, у меня получаются две беды: или на белом фоне остается мусор, или, если включить GrayEnhance, черный фон становится рыхлым.
Как-то обошел так: картинки заключил в Exlude–регионы, результат установил в Gray, после с помощью Magic Clear потер, что мог.
В списке выбора типа региона видел Floodfill регион, думал, что может подойти, но… Он так и не смог его выбрать: пункт оставался серым.
Вроде понятно объяснил, но, на всякий случай скан страницы (7Мб)

P.S. Что есть Enhance Contour? Как работает и как выставлять параметры, чем может помочь, чем может навредить?
Автор: bolega
Дата сообщения: 09.10.2006 09:22
xitsa
Для таких страниц не используйте Background cleaner (!), либо заключайте большие черные области с иллюстрациями в exlude-зону, чтобы клинер знал, что это не паразитный грязный фон, а полезное содержимое. Я перевел в b/w Ваш файл с порогом normal. Область черного после этого получается в белых крапинках, это нормально для такого скана (он и в оригинале такой). Ничего страшного в этом нет, это легко исправляется в пост-обработке. Там в опциях клинера выставьте размер speckle size fine =17. Включите режим auto-despeckle или auto-clear. После этого, держа нажатым Ctl+Shift, выделите мышкой всю область черного и отпустите мышку, не отпуская Ctl+Shift. В результате белые крапинки затянутся.
Автор: xitsa
Дата сообщения: 09.10.2006 10:06
bolega
Спасибо.
Если я правильно понял, то Despeckle может работать и для инверсных изображений?
Автор: Aziat
Дата сообщения: 13.10.2006 18:46
Как можно в Scan Kromsatorе разрезать автоматом, скан-развороты 1000 страниц, ч одинаковым размером для каждой страницы.
Сразу же приношу извинения если не правильно изложил вопрос.
Спасибо. За ответ буду признателен.
Автор: Arcand
Дата сообщения: 15.10.2006 14:22
Aziat
Не очень понятно, что Вы подразумеваете под разрезкой автоматом. На всякий случай посмотрите здесь . Там было, по ходу дела, сказано и о разрезке сканов.
Автор: Aziat
Дата сообщения: 15.10.2006 17:25
Arcand
Да вот именно, это то что мне надо было. Спасибо.

Цитата:
Не очень понятно, что Вы подразумеваете под разрезкой автоматом.

Мои извинения за непонятное изложение вопроса.
Автор: shch_vg
Дата сообщения: 15.10.2006 21:55
bolega
Отсканировал книгу большого формата, у которой скан разворота на сканере А4 имеет маленькие поля. После драфт кромсайт многие развороты не имеют нижнего резака (окошко справа вверху не имеет галочки). Т.к. я делаю обработку на 15 или 17 дюймовом мониторе, то эти окошки для горизонтальных резаков не видны. Приходится разделительную линию сдвигать влево, выставлять галочку, чтобы появился нижний резак. Т.к. на этом же скане часто приходится пользоваться кнопкой special на закладке Pages, то приходится снова тащить разделитель вправо, что доволно утомительно.
Т.к. сами резаки без синей линии все время видны, то было бы гораздо удобней, если бы, допустим, по двойному щелчку на любом из них в окошко проставлялась (убиралась) галочка с соответствующим появлением (исчезновением) синей полосы у этого резака.
Кстати, неплохо бы менять цвет резака двойным кликом на нем наряду с проставлением галочки в Automargins
Автор: xitsa
Дата сообщения: 17.10.2006 18:51
Отсканировал книгу, в которой ScanKromsator не повернул ни одну страницу (почти, две он всё таки повернул).
Повернул вручную с помощью Ruler'а.
Вот скан одного разворота.
Обрабатывал в режиме Normal, был включен Deskew, во вкладке Special никаких углов вручную не было выставлено.

Это только у меня так?
Автор: shch_vg
Дата сообщения: 17.10.2006 21:43
xitsa

Цитата:
Это только у меня так?

У меня тоже было нечто подобное.
Я сейчас предварительно через Images-> Rotate&Save разворачиваю, а потом обрабатываю.
Автор: bolega
Дата сообщения: 18.10.2006 09:37
xitsa
У меня на Вашем примере устранил наклон без проблем.
Скажите, а Вы правильно расставили резаки? Всю черноту срезали? Ипользовали ли Split? Похоже, что Вы все-таки не отрезали черноту (или не разрезали разворот), и она не дает кромсатору правильно рассчитать угол deskew.

shch_vg

Цитата:
У меня тоже было нечто подобное.

Нет, здесь речь о другом. Не о предварительном повороте, а об устранении наклона
Автор: xitsa
Дата сообщения: 20.10.2006 17:10
2 Bolega
Чтобы было легче установить причину выложил файл проекта здесь
Все разрезал и отрезал.
В проекте будут установлены углы поворота вручную, так и есть: когда я обнаружил, что не повернулись страницы, стал делать все вручную.
Sk версии 5.6А
Автор: Arcand
Дата сообщения: 22.10.2006 04:43
bolega
После одной книженции созрело одно маленькое рацпредложение . Речь про Exclude region. Я его обычно использую чтобы защитить рисунок от Despecle, от Background cleaner или, чтобы рисунок не мешал Deskew. Если выполнялся Background cleaner, то промежуточные или выходные (как у меня) сканы имеют области с разной освещенностью. Они требуют разного порога бинаризации. Поэтому мне приходится такие сканы дополнительно обрабатывать в РастерИД - делать гамма-коррекцию Exclude region областей. Когда таких сканов несколько десятков, то это напрягает .
Нельзя ли в качестве, скажем, доп. опции Background cleaner указывать СканКромсатору выполнять неадаптивную чистку фона, скажем, с некоторой средней для всего скана величиной тонового сдвига (это чтобы рисунки с черными областями не искажались при чистке фона).
Если я не ошибаюсь, то в следующей версии предусмотрена возможность коррекция освещенности, тогда можно обойтись и без изменений для Exclude region. Для меня не принципиально, использовать ли Background cleaner или Цветокоррекцию.
Автор: bolega
Дата сообщения: 22.10.2006 11:09
xitsa
Спасибо большое за исчерпывающие данные!
Действительно, не повернул. Буду разбираться.
Как это обойти: уберите везде галки с опции Art deskew. Тогда все получится как надо.
Вообще, если неправильно поворачивается, нужно играться опцией Art: либо включать ее, либо, наоборот, выключать.
Еще пару советов. Во-первых, замените опцию Deskew method на Shear(Auto). Это архиважно для серых сканов! (Сейчас у Вас =Shear). Следует всегда использовать именно Shear(Auto), про остальные можно вообще забыть. И я бы еще включил на закладке Quality опции Blur=Sharpen=2 (метод Vadimir). В результате буквы получатся более ровненькие и более гладкие, что заметно снизит итоговый размер djvu. Да и смотреться будет приятнее.
Успехов.
Автор: xitsa
Дата сообщения: 22.10.2006 14:59

Цитата:
Еще пару советов. Во-первых, замените опцию Deskew method на Shear(Auto). Это архиважно для серых сканов! (Сейчас у Вас =Shear). Следует всегда использовать именно Shear(Auto), про остальные можно вообще забыть. И я бы еще включил на закладке Quality опции Blur=Sharpen=2 (метод Vadimir). В результате буквы получатся более ровненькие и более гладкие, что заметно снизит итоговый размер djvu. Да и смотреться будет приятнее.

Спасибо, учту для следующих книг.
Рад что как–то смог помочь, программа у вас замечательная, хотя и пугает обилием возможностей .
Автор: bdfy
Дата сообщения: 23.10.2006 18:19
Чет я не понимаю. беру файл (уже порезанный и выровнянный кромсатором ) и пытаюсь убрать шум.
В превью файл смотрится отлично, большего и желать не приходится (на скрине правда пережим с экрана )
http://img110.imageshack.us/my.php?image=previewjw3.jpg
Как только прогоняю конверт - качество субьективно много хуже, читать неприятно.
http://img110.imageshack.us/my.php?image=resultxo9.png
в настройках фактически только деспекл поставил - больше ничего не менял.
сколько не пробовал играться разрешением и цветом - ничего не выходит.
Кромсатор 5.51.
исходник сорри не выкладываю - 2 метра весит
что я не так делаю ? как получить качество как в превью ?
Автор: Arcand
Дата сообщения: 24.10.2006 11:49
bolega
Случайно столкнулся с искажениями при deskew (серые сканы, метод Interpolate). Выкладываю фрагмент скана, там все видно. Этот фрагмент был заключен в Exclude region, чтобы черные шарики не повредил Background cleaner. Что интересно, без зоны deskew выполняется без искажений.
Автор: tukktukk
Дата сообщения: 27.10.2006 06:49
Сделал драфт кромсейт, подправил резаки для всех страниц. Потом игрался с другими опциями, выставил как надо. Сейчас же резаки режут как хотят, а не так как я выставил. По виду резаки стоят как надо, но в результате выходит разрезаный текст. Как бы заставить програму пользоваться мною выставленными резаками? Переделывать все заново не хотелось бы это сотни страниц.

Какую еще информацию нужно для решения этой заковыки? Пользуюсь 5.6А.

Если что не так, не серчайте.
Автор: VadimirTT
Дата сообщения: 27.10.2006 09:10
tukktukk
А большая зеленая галка взведена?
Автор: bolega
Дата сообщения: 27.10.2006 10:20
Arcand

Цитата:
Если я не ошибаюсь, то в следующей версии предусмотрена возможность коррекция освещенности

Тут я поспешил с анонсом, коррекция у меня на самом деле не получилась. Вышло что-то вроде еще одного метода background clean, хотя и более сильного по эффекту, чем BC, и с настраиваемой степенью чистки. Так же как и в BC, темные области тоже зачищаются. В принципе, освещенность конечно выравнивается (но уменьшается яркость), но не в том смысле, в каком это делает BookRestorer. BR не чистит фон, и даже наоборот, более затеняет светлые участки. Я пока не могу понять, каким образом BR отличает тени от протяженных черных областей (по градиенту?), понял только, как он вычисляет и вероятно использует threshold в опциях light correction
Автор: tukktukk
Дата сообщения: 27.10.2006 23:59

Цитата:
А большая зеленая галка взведена?


Да, галка есть. Вообще то я не очень отступаю от вашего пособия по Кромсатору. В этот раз я оставил первоночальное разрешение и грейскейл - я просто хочу обрезать файлы без апскейла и перехода на 2 бита.

----

Ну что ж. Плюнул и начал все сначала. Триста страниц ручного выставления резаков (драфткромсатор не справлялся). Затем сохранил задачу (я обычно этого не делаю, но тут триста страниц ручной работы). Снова то же самое. Резаки стоят правильно, но кромсатор их игнорирует и режет так как драфткромсатор выставил. И в том и другом случае я сохранял задачу и проблема повторялась. Никогда раньше я не сохранял задачу/теск и этой проблемы не было. Пожалуйста помогите, нет сил в третий раз вручную резаки ставить (на еще результат может быть таким же).
Автор: shch_vg
Дата сообщения: 29.10.2006 16:05
tukktukk
Из Вашего описания не понятно, в каком виде у Вас исходные сканы (разворот на 2 или одну страницу, скан повернут или вертикален). В любом случае я не стал бы повторно выставлять все резаки, а проверил бы на одном скане в режиме Run current. Только добившись нужного результата на одном развороте, стал бы его обобщать.
Дополнение. У меня нечто похожее было, когда разрезались двухлистные сканы, повернутые на 90 градусов. В этом случае я предварительно через Images->Rotate&Save поворачивал сканы, после чего драфт кромсайт корректно устанавливал резаки.
Автор: tukktukk
Дата сообщения: 29.10.2006 18:46

Цитата:
Из Вашего описания не понятно, в каком виде у Вас исходные сканы (разворот на 2 или одну страницу, скан повернут или вертикален). В любом случае я не стал бы повторно выставлять все резаки, а проверил бы на одном скане в режиме Run current. Только добившись нужного результата на одном развороте, стал бы его обобщать.
Дополнение. У меня нечто похожее было, когда разрезались двухлистные сканы, повернутые на 90 градусов. В этом случае я предварительно через Images->Rotate&Save поворачивал сканы, после чего драфт кромсайт корректно устанавливал резаки.


Спасибо за ваше время. Вот данные: одна страница на скан (тифы), ориентация правильная (вертикальная), 300 dpi, cерый (с апскейлом до 600 и ч/б). Какой-то вуду выходит. Взял сделал другую книгу, все нормально. Возвращаюсь к этой, все повторяется. Уже даже не записывал задачу - все равно. Никто не знает есть ли альтернативная програма где я могу просто порезать эту книгу, а в кромсаторе сделать все остальное? Раз уж не судьба с кромсатором.

Может кто сможет посмотреть на одну из страниц книги (7мб) и сказать, что я делаю не так. Любые советы приветствуются:

http://d.turboupload.com/d/1144844/Workbook014.tif.html

Заодно, скажите какие опции приведут к наилучшим результатам.


--------------------

Итак определил, что проблема происходит только тогда, когда пользуюсь автополями (automargins). Кто-то может мне расказать поподробнее, как эта опция работает и почему у меня не работают резаки, когда автополя вклучены? В других книгах я не замечал такой проблемы.

Еще, как я могу поставить маркс (галочки) на все файлы за раз не пользуясь драфкромсатом?
Автор: Arcand
Дата сообщения: 30.10.2006 09:30
tukktukk
С проблемой, связанной с резаками, не сталкивался. Вам правильно посоветовали, для экономии времени и нервов решите проблему сначала на одном скане, только потом делайте книгу. Далее, 7 мег, наверное, многим скачивать не улыбается. Было бы лучше преобразовать скан в jpg (качество 80-90 %) до 1.5-2.5 мег. Уверен, что проблема возникла из-за недоразумения - что-то не так поставили или не так поняли какую-нибудь функцию СканКромсатора.
Цитата:
альтернативная програма где я могу просто порезать эту книгу
Более удобных нет. В других прогах у Вас непременно будут свои заморочки, похлеще прежних.
Цитата:
расказать поподробнее, как эта опция работает
В ФАКе можно много найти по этому делу. Не поленитесь, почитайте .
Автор: ghosty
Дата сообщения: 30.10.2006 11:21
tukktukk

Цитата:
http://d.turboupload.com/d/1144844/Workbook014.tif.html
Заодно, скажите какие опции приведут к наилучшим результатам.

Вот, что у меня получается (в архиве файл с настройками):
http://rapidshare.com/files/1258217/pix.rar.html
У меня все резало без проблем.
Автор: tukktukk
Дата сообщения: 30.10.2006 21:26
Arcand
ghosty

Спасибо большое. Да я читаю, только много всего читать. Я почти всегда иду по шагам Scan and Share, а тут это не сработало.

Еще вопрос. Гости сделал отличную обработку (апскейл до 600 дпи, но оставление серого). Только вот размер намного больше ч/б. Стоит ли оставлять серый?

Автор: shch_vg
Дата сообщения: 31.10.2006 11:31
tukktukk

Цитата:
Еще вопрос. Гости сделал отличную обработку (апскейл до 600 дпи, но оставление серого). Только вот размер намного больше ч/б. Стоит ли оставлять серый?

При создании djvu по этому серому тифу получается файл размером примерно 20 кб.
Уменьшить его можно до 11 кб, преобразовав в серый 150 дпи, но качество djvu будет похуже.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.