Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: vitaly1
Дата сообщения: 26.10.2005 17:43
orb2k2
К нему еще 2 длл-ки нужны.
Автор: romanef
Дата сообщения: 26.10.2005 23:00


потратил много времени, но нашел ответы на свои вопросы.

ps.хелп для newbies нужен просто позарез.
Автор: Alexx S
Дата сообщения: 26.10.2005 23:00
Если можно, выскажу такое пожелание: в редакторе постобработки сделать помимо выделения прямоугольной рамкой еще и выделение с помощью инструмента "лассо" (выделение произвольной формы). А то чистка рисунков с помошью прямоугольного выделения превращается в настоящее мучение, особенно сильно это выражается на мусоре около наклонных линий. Приходится переключаться на ластик и долго чистить мусор вручную.
Автор: romanef
Дата сообщения: 27.10.2005 01:27
bolega

1 .в бэте последней похоже, глюк - при очистке ректанглом в постобработке
портятся рядом находящиеся области

2. планируется ли ввести инструмент исправления кривизны строк?

если так, то букресторер можно будет забыть
Автор: Alexx S
Дата сообщения: 27.10.2005 06:24
romanef
У меня такой проблемы нет.
Попробуй в редакторе постобработки включить опцию "No Zoom Flter"
Автор: orb2k2
Дата сообщения: 27.10.2005 09:22
vitaly1

Цитата:
К нему еще 2 длл-ки нужны.

а выложить их можно, плизз? заранее благодарю.
Автор: vitaly1
Дата сообщения: 27.10.2005 12:31
orb2k2
http://rapidshare.de/files/6819398/sk_dlls.rar.html
Автор: bolega
Дата сообщения: 29.10.2005 19:21
Был неделю в командировке, поэтому отвечаю только сейчас.

romanef

Цитата:
Потом запускаю drafst cromsate, а он все равно после завершения предкромсания проставляет мне галки
deskew, automargins, despekle на большинстве страниц.

Нужно нажать там же на кнопку Load.
При последующих запусках кромсатора load def-опции уже делать не надо. Они сразу загрузятся.


Цитата:
И еще. Ладно, пусть он проставил. Но как мне убрать эти опции на уже предоткромсаных страницах, сразу скопом?

Любую опцию можно установить/сбросить/изменить у любой группы файлов.
Для этого нужно при изменении опции держать нажатым Alt. Кромсатор предложит на выбор, к какой группе применить изменение.

Alexx S

Цитата:
А то чистка рисунков с помошью прямоугольного выделения превращается в настоящее мучение, особенно сильно это выражается на мусоре около наклонных линий.

А Вы используйте лучше auto-clear в режиме despeckle. Тогда залезание выделения на буквы или линии ничем не грозит. Размер удаляемых спеклов следует задать в 2-2,5 раза больше дефолтных значений.
Автор: Alexx S
Дата сообщения: 29.10.2005 21:59
bolega

Цитата:
А Вы используйте лучше auto-clear в режиме despeckle. Тогда залезание выделения на буквы или линии ничем не грозит. Размер удаляемых спеклов следует задать в 2-2,5 раза больше дефолтных значений.


Попробую немного подробнее описать ситуацию.
Для чистки сканов в редакторе постобработки я использую именно auto-clear в режиме despeckle. Размер спеклов ставлю 10...15 (fine).

Довольно часто попадаются рисунки, у которых с одной стороны - мусор, который надо чистить, а с другой, например, заливка серым (была и превратилась в набор точек), штрифовые линии, да много чего может быть. И по размеру и те у другие относятся программой к мусору.
Сейчас помогаю знакомой с книгой по оригами, так там 70% рисунков такие - треугольники с серой заливкой, вокруг которых надо убирать мусор.

Теперь по тексту: при задании большого размера спеклов часть текста (знаки препинания, рваные перемычки у букв) также попадают в разряд мусора. И при чистке мусора прямоугольным выделением приходится удалять спеклы по одному, чтобы не задеть буквы.

Таким образом и при чистке рисунков и при обработке текста для меня лично было бы гораздо удобнее выделять произовольные области, внутри которых нет ничего, кроме мусора, чем по нескольку раз выделять прямоугольные области или использовать ластик. Порпробуй сделать так в каком-нибудь граф. редакторе и поймешь, насколько это удобно.

Кстати, только что пришла в голову интересная мысль - можно было бы сделать кнопку для открытия текущего файла в другом редакторе, наподобие того, как это сделано в ACDSee.
Автор: bolega
Дата сообщения: 30.10.2005 01:06
Alexx S
Хорошо, сделаю.
Кстати, сейчас лассо уже поддерживается в предобработке.
Автор: Alexx S
Дата сообщения: 30.10.2005 08:40
Спасибо большое!
Думаю, в таком случае понадобится функциональная клавиша для быстрого переключения между прямоугольным выделением и лассо. Какая - нибудь F2...F12.
Кстати, тебе помощь не нужна? Ну там потестировать, скриншотов сделать, с хелпом помочь?
Автор: Arcand
Дата сообщения: 30.10.2005 10:36

Цитата:
можно было бы сделать кнопку для открытия текущего файла в другом редакторе
Если это планируется сделать, то желательно добавить в редактор постобработки возможность указывать дпи и сжатие выходных файлов. Я пользуюсь Paint , а он, нехороший, всегда сохраняет файлы tif в разрешении 120 дпи без сжатия.
Автор: asdfg2003
Дата сообщения: 30.10.2005 12:59
в Book Restorer есть очень удобный инструмент для раздельной обработки текста и блоков изображений. Сначала применяетcя Areas Detection для автоматического выделения картинок (тут же можно в ручном режиме подправить) последовательно для всех страниц. Затем выделяются сразу все страницы с текстом и применяется бинаризация. В результате имеем чб текст и картинки в сером или цветном.
А умеет ли подобное кромсатор?
Мне известен пока только один способ в кромсаторе, это ручное выделение и в битонал, но в этом случае и качество и размер у рисунка хуже
Автор: Alexx S
Дата сообщения: 30.10.2005 18:03
Присоединяюсь к предложению asdfg2003, такая возможность бы очень удобна.
Автор: bolega
Дата сообщения: 30.10.2005 18:35
Alexx S

Цитата:
Кстати, тебе помощь не нужна?

Нет, спасибо.
asdfg2003

Цитата:
А умеет ли подобное кромсатор?

С месяц или два назад я писал, что такое разделение задумано (с ручным указанием областей). Как это сделано в BR, я еще не смотрел. Там картинки сохраняются в отдельные файлы? И каковы размеры картинок, равные размерам иллюстрации или одинаковые с размером страницы, но с замазанным белым цветом текстом?
Я вообще-то задумывал это делать исключительно для создания pdf, в которых цветные картинки помещаются поверх текста в отдельный слой. Посколько только pdf поддерживает слои (или djvu, т.е. DEE тоже? )
Но как я уже объявлял, что все серьезные изменения, если и появятся в кромсаторе, то не ранее, чем через полгода. Поскольку из-за сильной занятости, работа над ним носит чрезвычайно вялотекущий характер.



Автор: Alexx S
Дата сообщения: 30.10.2005 20:06

Цитата:
Но как я уже объявлял, что все серьезные изменения, если и появятся в кромсаторе, то не ранее, чем через полгода. Поскольку из-за сильной занятости, работа над ним носит чрезвычайно вялотекущий характер.

А вот это удручает.
А промежуточные версии будут? С "несерьезными" изменениями, вроде лассо
Автор: romanef
Дата сообщения: 31.10.2005 15:04

Цитата:
Мне известен пока только один способ в кромсаторе, это ручное выделение и в битонал, но в этом случае и качество и размер у рисунка хуже


да, отсканированный черно-белый растр при такой операции идет круглыми пятнами.
Автор: bolega
Дата сообщения: 31.10.2005 16:07
romanef

Цитата:
да, отсканированный черно-белый растр при такой операции идет круглыми пятнами

Если уже отсканировано в b/w, то при чем тут битонал?
Автор: romanef
Дата сообщения: 01.11.2005 07:38

Цитата:
Если уже отсканировано в b/w, то при чем тут битонал


Нет, я сканирую только в сером.
И если при этом на странице был растр из ч/б точек, то при повторной бинаризации в кромсаторе он "идет пятнами". Выложу вечером пример файла.
Автор: Melirius
Дата сообщения: 01.11.2005 10:40
romanef


Цитата:
И если при этом на странице был растр из ч/б точек, то при повторной бинаризации в кромсаторе он "идет пятнами".


Сканируйте в 600 dpi - точки будут отдельными и пятнами не пойдут - или замыливайте изображение в PhotoShop - после сканирования в 300 dpi рекомендую к картинкам применять последовательность: Gaussian Blur с radius=1px, Sharpen More, Gaussian Blur с radius=1px, Sharpen More - результат хороший.
Автор: asdfg2003
Дата сообщения: 01.11.2005 16:07
bolega

Цитата:
Как это сделано в BR, я еще не смотрел. Там картинки сохраняются в отдельные файлы? И каковы размеры картинок, равные размерам иллюстрации или одинаковые с размером страницы, но с замазанным белым цветом текстом?

видимо так и есть, "с замазанным белым цветом" но при сжатии размер меньше,
вот примеры http://rapidshare.de/files/7043467/test.rar.html
в кромсаторе это тоже делать можно, выделяя на изображении области вне рисунка и переводя их в b/w, но это очень долго
Автор: bolega
Дата сообщения: 02.11.2005 07:26
asdfg2003

Цитата:
в кромсаторе это тоже делать можно, выделяя на изображении области вне рисунка и переводя их в b/w, но это очень долго

Можно, наоборот, выделять картинки (множественное выделение поддерживается, держать shift), и выбирать команду invert selection - тогда выделение инвертируется, т.е. выделяется все, кроме картинок. Правда, пользоваться этим не рекомендую из-за бага в последующей интерпретации инвертированного выделения (спасибо dimaniak за обнаружение бага). Баг уже пофиксен, но новая версия кромсатора еще пока не доступна.

Автор: Arcand
Дата сообщения: 02.11.2005 09:19

Цитата:
Как это сделано в BR, я еще не смотрел. Там картинки сохраняются в отдельные файлы? И каковы размеры картинок, равные размерам иллюстрации или одинаковые с размером страницы,
Посмотрел. Картинки (кадры) в BR сохраняются в отдельные файлы и содержат только изображение картинки.
Автор: bolega
Дата сообщения: 02.11.2005 11:17
Arcand
А как их потом в djvu совмещать с текстом? Не подскажете?
Автор: Arcand
Дата сообщения: 02.11.2005 15:01
bolega
Я не совсем понял, что Вы имеете ввиду. То ли как получить в БР тифы, с черно-белым текстом и серыми рисунками, то ли как потом эти тифы кодировать в дежавю.
Если первое, то выполнить Публикацию с указанием цветовой гаммы "Лучшая". При этом, если первичная страница была преобразована в b/w, а рисунок (кадр) был gray, то конечный тиф будет gray (остальные тифы без рисунков будут b/w). Рисунок (кадр) в конечном тифе будет "склеен" с первичной страницей, он заменит собой свой b/w аналог.
Если второе, то при кодировании книги использовать профиль Scanned (в DEE) или Normal (в Editor). При этом ч/б тифы (без серых рисунков) будут кодированы так же как профилем Bitonal (в DEE и Editor), серые тифы - как и положено, с разделением на маску и фон.
Скоро расскажу о своем способе создания книги с серыми рисунками в оригинале и дежавю. Там я не пользуюсь БукРесторером, обхожусь СканКромсатором - Боливар двоих не вынесет .
Автор: bolega
Дата сообщения: 02.11.2005 16:53
Arcand

Цитата:
то ли как потом эти тифы кодировать в дежавю.

Это, но не совсем то, что Вы описали.
Т.е. имеем исходную страницу, где, предположим, в центре - цветная иллюстрация, а сверху и снизу - текст. Иллюстрацию вырезаем и сохраняем в отдельный файл. Остальное (текст) переводим в b/w. Итак, имеем по сути ч.б. подложку (текст) и цветной рисунок. Как теперь из двух файлов получить в djvu _одну_ страницу, где рисунок ляжет на полагающееся ему место в центре. Вот что мне непонятно.
Почему это мне интересно. Хотелось бы добиться следующего. Сканируем к примеру такую страницу в цвете в 600dpi. Оставлять все как есть - будет накладно, даже если взять 300dpi. Лучше бы картинку вырезать (и возможно, уменьшить ее dpi в 2-3 раза, для цветных этого вполне достаточно), а оставшуюся часть страницы, т.е. текст, перевести без изменения dpi в b/w. Только как потом все это дело слить в одну страницу djvu? В pdf это сделать можно (я так думаю), поместив цветную картинку поверх страницы в дополнительный слой. В результате качество текстовой части будет высоким, и картинка остается цветной и небольшого размера.

Автор: dimaniac
Дата сообщения: 02.11.2005 21:11

Цитата:
Только как потом все это дело слить в одну страницу djvu?

Несколько дикая идея но если бы я знал winapi я бы сделал так. Создаем djvu только для текста цветные/серые картинки загоняем в jpeg. Создаем файл с описанием положения картинок. Открываем страницу djvu сверху накладываем картинки. Еще бы найти где-нибудь людей которые взялись бы за это дело.
Автор: sergel
Дата сообщения: 03.11.2005 00:45
bolega
Не подскажете, с чем это может быть связано: при обработке в СканКромсаторе 5.52 серых сканов 300 дпи с переводом в ч/б 600 дпи если ставить Convert->HighDark - с каждой обработанной страницей отъедается оперативная память, 75 страниц съели 1,2 Гб оперативки!
С другими установками (MiddleDark LowDark Normal ) такого не происходит.
Автор: Arcand
Дата сообщения: 03.11.2005 06:34
bolega

Цитата:
Лучше бы картинку вырезать (и возможно, уменьшить ее dpi в 2-3 раза, для цветных этого вполне достаточно), а оставшуюся часть страницы, т.е. текст, перевести без изменения dpi в b/w. Только как потом все это дело слить в одну страницу djvu?
Такой возможности, насколько я знаю, нет ни в DEE ни в Editor. Также, такой возможности (тут я уверен значительно меньше) нет и в самом формате дежавю.
Возможно Вас устроит следующее. Как Вы знаете, дежавю разделяет все на фон и маску. Если сделать так, чтобы текст попал в маску, а все остальное в фон, то получится то что надо, ну или почти.

Сделал следующее. На основе профиля Scanned600 в Configuration Manager (DEE) создал свой. На закладке Segmenter (Advanced Settings…) установил:
Pixel Filter Level - 100 \
Shape Filter Level - 100 > (не текст по максимуму в фон)
Threshold Level - 100 /
Inversion Level - 0 (текст только черный)
Background Subsample -2 (дпи фона 600/2=300)

Взял ч/б тиф 600 дпи с текстом, пробразовал его в цветной и вставил в центр фрагмент цветной фотографии. В DEE закодировал его своим профилем.
Получилось следующее. Весь текст (99.99%) попал в маску, фотография (99.9%) в фон. Общее впечатление - пойдет.
Автор: bolega
Дата сообщения: 03.11.2005 08:21
Arcand

Цитата:
Такой возможности, насколько я знаю, нет ни в DEE ни в Editor. Также

Понятно.
Тогда непонятно, зачем в BR заниматься вырезанием из сканов иллюстраций и сохранять их отдельно, если все-равно потом нужно подавать на вход DEE комбинированную страницу. Тогда проще не картинки вырезать, а переводить текст в псевдо-b/w. (я называю "псевдо", т.к. реально скан остается цветным, но области с текстом переводятся в два противоположных цвета - 0,0,0 и 255,255,255).
Спасибо за Ваши исследования!

Добавлено:
А вообще-то жалко, что DEE не поддерживает такой фичи.
Можно делать как Вы написали, но здесь есть одна неприятность - чтобы хранить цветные 600dpi файлы, нужно иметь уйму места на винте. Было бы намного экономичнее разделять "слои" сразу же.

sergel
Пока не знаю. Скажу только, что одна страница 600dpi grey или color занимает в несжатом ввиде (а именно так windows работает с битмапами) от 50 до 100 Мб. Кстати именно из-за этого кромсатор долго отображает такие сканы при включенном фильтре, ведь фильтр на каждую точку анализирует 9 соседних, т.е. умножьте объем еще на 10.
Нагрузка на кэш процессора колоссальная.
Метод Convert->HighDark, в отличие от остальных, не является пороговым. Он адаптивный, порог высчитывает автоматически исходя из энтропии изображения. Поэтому он жрет еще кое-какую память. Если как Вы говорите, память не высвобождается, значит буду разбираться.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.