Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: bolega
Дата сообщения: 17.07.2008 12:08
Olive77

Цитата:
Проблема в том, что СК оставляет только контуры, а все черное внутри контура заменяет на белое

Это по видимому влияние correct illum (или background clean). Защитите нужные области exclude-зонами. Тогда они не будут выбеляться. В свойствах correct illum должна быть отключена "apply to exclude zones". Если она включена, то correct illum будет действовать и на exclude-зоны

dma200899

Цитата:
А в СК есть ограничение на число обрабатываемых страниц ?

Нет. Но при выборе большого количества файлов формируется строка из их имен, разделенных запятой. Вот у этой строки есть ограничение на длину. Выход такой: сначала загрузите часть файлов, потом добавьте остальные (Files->Add files). Можно и по-другому: если все файлы пронумерованы (имена из цифр), то после выбора первой партии (даже из одного, самого первого скана) нажмите хоткей "H" (если он отключен, то в опциях->хоткеях команда auto-add scan files)
Автор: Olive77
Дата сообщения: 18.07.2008 08:20
bolega

Цитата:
Защитите нужные области exclude-зонами. Тогда они не будут выбеляться.

Попробывал. При этом, к сожалению, заменяется одна проблема другой.
Теперь проявляются буквы и разные другие бяки с другой страницы, существенно добавляющие ручную работу.

По-видимому, проще не добавлять никаких exclude-zones, а потом просто в Фотошопе залить контуры черным цветом.

Кстати, заметил такую проблему.
Поместил график в dither-zone.
При этом качество всей страницы значительно ухудшилось, а вокруг присутствующей на этой странице picture-zone появился контур.

Пример:
_http://rapidshare.com/files/130549047/si0098.rar.html
372 kb

P.S.: операцию merge к picture-zone не пременял, чтобы не увеличивать размер файлов.
Автор: bolega
Дата сообщения: 18.07.2008 08:56
Olive77

Цитата:
Теперь проявляются буквы и разные другие бяки с другой страницы

Так Вы обрамляйте зонами только черные области, которые выбеляются (возможно, потребуется несколько зон делать), а не всю часть страницы
Автор: LVitek
Дата сообщения: 20.07.2008 00:08
bolega
Использовал кнопку 'штампик',выбрал картинку,применил.А теперь,что-бы изменить картинку штампика надо лезть в файл sk.ini и указывать другой путь к новой картинке или вообще стирать,а потом заново выбирать путь к картинке.
А нельзя ли проще,при каждом нажатии кнопки 'штампик',открывалось дерево папок,для выбора картинки,как в виндовском проводнике.
SK 5.91
Автор: bolega
Дата сообщения: 20.07.2008 00:17
LVitek

Цитата:
теперь,что-бы изменить картинку штампика надо лезть в файл sk.ini

Не надо лезть, достаточно при нажатии кнопки со штампиком (или меню) держать нажатым Ctrl, тогда вылезет окно выбора файла. Все время предлагать окно выбора файла - это слишком муторно для юзера.

================
Кстати, сделал автоматическое добавление в pdf линков. Два типа - содержание и индексы. Все на автомате, но с визуализацией и контролем процесса. Исх. данные - задание для pdf, сам pdf и текстовый файл, который генрируется утилитой Генчо.
Делал на скорую руку, поэтому интерфейс как всегда не совсем внятный, но зато быстро и качественно. Поэтому в итоговую версию эта фича входить не будет, только по запросу кому очень надо.
Автор: LVitek
Дата сообщения: 20.07.2008 02:12
bolega
Большое спасибо,всё понял,так даже лучше,чем я предлогал.
Автор: Olive77
Дата сообщения: 21.07.2008 16:29
bolega

Цитата:
Так Вы обрамляйте зонами только черные области, которые выбеляются (возможно, потребуется несколько зон делать), а не всю часть страницы

Получилось отлично и без выбора нескольких зон.

Каким-то образом у меня сбились настройки на закладке содержащую correct illumination.
У strength выставились значение по умолчанию 10,
как только поменял его на 1, то все получилось чики-чики
Автор: spartakchamp
Дата сообщения: 23.07.2008 16:19
Подскажите, пожалуйста!

Делаю техническую книгу ScanKromsatorом по инструкции ScanAndShare 1.07! получается в принципе неплохо, кроме фотографий (фотографии черно-белые - даже серые, так как бумага не супер). Мне кажется, что они как-то мутнеют по сравнению с необработанными сканами и видно на них объекты хуже (выбираю режим для фотографий Exclude and Mark as dither zone и больше ничего не трогаю) ! Вопрос: как поступить, чтобы такие фотографии были более качественными (какой режим задать)?
Автор: ghosty
Дата сообщения: 23.07.2008 16:41
spartakchamp
Все, конечно, зависит от качества фотографий, но в общем случае лучше их выделить просто как Picture Zones и выставить для всех один набор параметров обработки (Copy to all zones).
Автор: VadimirTT
Дата сообщения: 23.07.2008 16:57

Цитата:
(выбираю режим для фотографий Exclude and Mark as dither zone

вот это не правильно, надо заключать фотографии в пикчерзоны, в инструкции об этом написано.
Автор: spartakchamp
Дата сообщения: 23.07.2008 17:59
Я делал как пикчерзоны, но как мне казалось качество фотографий было хуже чем при установке Exclude and Mark as dither zone! Попробую завтра на книге где очень много фотографий!
Нужно ли еще что-нибудь делать или только выделить все фотографии как Picture Zones и все?


Цитата:
выставить для всех один набор параметров обработки (Copy to all zones).
Не совсем понял? Какой набор выставить и как?
Автор: spartakchamp
Дата сообщения: 24.07.2008 12:49
Обработал фотографии как пикчерзоны! теперь не знаю как перевести в djvu (какой профиль задать в Document Express Enterprise)? В Bitonal600 фотографии вообще не выходят, в Scanned600 фотографии выходят но качетво их очень плохое (резкость маленькая по сравнению с обработаннми сканами), в Photo600 фотографии получаются неплохо, но текст сущетсвенно хуже по сарвнению с предыдущими вариантами (кроме того при таком профиле как я понимаю не добавишь OCR). Подскажите какой профиль выбрать или задать (поскольку есть страницы где есть 1/2 фото и 1/2 текста)?
Автор: ghosty
Дата сообщения: 24.07.2008 12:59
spartakchamp

Цитата:
Я делал как пикчерзоны, но как мне казалось качество фотографий было хуже чем при установке Exclude and Mark as dither zone!
Во-первых, на деле Вы получаете черно-белые, а не полутоновые фотографии (нужно ли говорить, что большая часть инф-и уходит), а во-вторых, dithered-фотографии занимают слишком большой объем. JB2 не оптимизирован для кодирования подобных изображений.

Цитата:
Не совсем понял? Какой набор выставить и как?
После того, как выделите Picture Zone, щелкните правой кнопке по зоне и выберите в контекстном меню Zone Properties.

Цитата:
Обработал фотографии как пикчерзоны! теперь не знаю как перевести в djvu (какой профиль задать в Document Express Enterprise)?

Добавьте в documenttodjvu.conf следующие профили:[more]

#@displayName:COVER
COVER: scan300
description=
threshold-level=38
shape-filter-level=20
pix-filter-level=30
fg-subsample=7
jb2-format=color

#@displayName:600 with images
BW600_with_images: COVER
bg-subsample=2
fg-subsample=2
jb2-format=bitonal
pages-per-dict=50
dpi=-600
aggressive=true[/more]
Попробуйте использовать профиль "600 with images" ("Cover" используется для обложек). Если и в этом случае качество фоток не будет устраивать, то придется осваивать метод раздельного кодирования.
Автор: spartakchamp
Дата сообщения: 24.07.2008 14:01

Цитата:
Добавьте в documenttodjvu.conf следующие профили:Подробнее...
Попробуйте использовать профиль "600 with images" ("Cover" используется для обложек). Если и в этом случае качество фоток не будет устраивать, то придется осваивать метод раздельного кодирования.



Конечно получилось лучше (даже в принципе терпимо), но при увеличении в djvu файле некоторые фотографии тоже расплываются (хотя в 100 % масштабе не отличишь djvu от tiff). Хочется конечно получше, чтобы подробности на фотке рассмотреть! Что это за метод раздельного кодирования?
Автор: ghosty
Дата сообщения: 24.07.2008 14:14
spartakchamp

Цитата:
Что это за метод раздельного кодирования?
Посмотрите на предыдущих двух страницах.
Автор: spartakchamp
Дата сообщения: 24.07.2008 14:22
А нет какого-нибудь алгоритма? А то не понятно, что искать на этих двух страницах!
Автор: VadimirTT
Дата сообщения: 24.07.2008 14:29
spartakchamp
ключевое слово sep
Автор: ghosty
Дата сообщения: 24.07.2008 14:37
spartakchamp
Если бы у меня было побольше времени, ответил бы более развернуто. Смысл в том, чтобы отказаться от сегментации фотографий (разбиения их на слои). Для этого в СК необходимо вместо слияния зон (Merge Zones) сделать их разделение в разные файлы, после чего обработать не в documenttodjvu, a в msepdjvu.
На практике это можно сделать следующим образом:
1) Zones->Picture Zone->Merge Zones->Create separate files for non-B/W zones (ставим галочку)
2) Для кодирования используем утилиту FSD (возможно, прежде придется переименовать файлы в соотв. с требованиями этой утилиты - не знаю, как сейчас). Линк на FSD на предыдущей странице.
Автор: monday2000
Дата сообщения: 24.07.2008 16:21
spartakchamp

Цитата:
А нет какого-нибудь алгоритма?

Общие принципы см. здесь: http://www.djvu-soft.narod.ru/scan/low_color_djvu.htm
Автор: Arcand
Дата сообщения: 26.07.2008 06:31
spartakchamp
Цитата:
Обработал фотографии как пикчерзоны! теперь не знаю как перевести в djvu (какой профиль задать в Document Express Enterprise)?
Особых проблем с обработкой и последующим кодированием книг, содержащих растровые (серые или цветные) рисунки ИМХО нет. Пара слов о разделенных сканах. Качество (автоматической) сегментации, которое во многих случаях можно достичь в DEE, на мой вкус визуально лучше, чем ручное выделение рисунка в фон (т.е. если рисунок находится полностью в фоне).
1. Обработка.
Имеет большое значение. Во первых, нужно удалить растр. Далее, тоновая коррекция - добиться желаемого вида рисунков. Вот, собственно и все. Все просто . Как это все делать в Кореле сказано здесь. Как сделать в СК не в курсе.
2. Кодирование. О профиле для кодирования книг с рисунками сказано здесь. Готовые профили, которые просто вставляются в файл профилей documenttodjvu.conf, есть в предыдущей ссылке.
Для получения желаемого результата при кодировании можно покрутить разрешение фона и его качество (сегментер лучше пока не трогать). Как видно, снова все просто .
Автор: monday2000
Дата сообщения: 27.07.2008 17:59
ghosty

Цитата:
разделение в разные файлы, после чего обработать не в documenttodjvu, a в msepdjvu.

Хоть кто-нибудь пробовал это реально делать? Я вот сегодня впервые попробовал - при помощи СК 5.91. Во-первых, у меня получились 2 картинки (из 1 исходной) с чуть-чуть неодинаковыми размерами - на 1-2 пикселя разные длина-ширина - и NetPBM-утилиты заругались на это. Но это мелочи. Самое главное - полученный таким способом DjVu оказался ощутимо больше по размеру, чем он же, просто закодированный в режиме Photo. Попытки снизить разрешение фона в 3 раза не дали уменьшения DjVu. Есть ли всё-таки практический смысл в методе разделённых сканов?
Автор: Arcand
Дата сообщения: 27.07.2008 18:34
monday2000
Цитата:
Хоть кто-нибудь пробовал это реально делать?
Разумеется, Вы же статьи пишете не на пустом месте
Цитата:
Есть ли всё-таки практический смысл в методе разделённых сканов?
Торопитесь . И documenttodjvu и msepdjvu используют одни и те же алглритмы кодирования маски и фона. Отсюда следует, если на входе того и другого будет все одинаково, то при одинаковых настройках кодера для маски и фона, дежавю будут идентичны.
Предполагаю, что Вы не задавали настройки для фона в msepdjvu. Т.е. msepdjvu использовал умолчание. Насколько помню, это соответствует 100% качеству в DEE (профиль scan). Выводы делайте сами
Автор: monday2000
Дата сообщения: 27.07.2008 18:59
Arcand

Цитата:
Как это все делать в Кореле сказано здесь.

Я добавил эту ссылку к себе на http://www.djvu-soft.narod.ru/scan/ . Нельзя ли воплотить эти кореловские обработки в Scan Tailor - вот что на ум приходит...


Цитата:
Предполагаю, что Вы не задавали настройки для фона в msepdjvu.

Скорее всего. Вроде бы разбирались мы ранее в этом вопросе - а всё-таки нет полной ясности. Вы не помните ли, что там за настройки именно? Смысл опций командной строки msepdjvu уже подзабылся. Как работать с FSD - непонятно, она и глючит, и смысл опций неясен.

Было бы здорово сделать несколько готовых комплектов командной строки для msepdjvu (или сsepdjvu) - и использовать их в соотв. случаях.

Кое-какие мысли на эту тему я запостил в топике по СТ: этот пост и следующий.
Автор: Arcand
Дата сообщения: 27.07.2008 19:14
monday2000
Цитата:
Вы не помните ли, что там за настройки именно? Смысл опций командной строки msepdjvu уже подзабылся.
По счастливой случайности, кой-какие ссылки записал Смотрите здесь, здесь и здесь.
Автор: monday2000
Дата сообщения: 28.07.2008 08:56
Arcand
Спасибо. Хотелось бы добиться от МРС меньшего размера, чем от простого Photo-кодирования (при сходном качестве).

Добавлено:

Цитата:
По счастливой случайности, кой-какие ссылки записал

Я их отдельно к себе выложил - чтобы не потерялись:

http://www.djvu-soft.narod.ru/scan/arcand_msepdjvu.htm

(Этот линк постоянно доступен с http://www.djvu-soft.narod.ru/scan/ )


Добавлено:
Что-то не получилось у меня СканКромсатором 5.91 разделить один серый скан с небольшой полутоновой картинкой на 2 "субскана" - ЧБ с текстом, и gray с полутоновой картинкой. Ведь эти 2 "субскана" обязаны быть одинакового размера - чтобы подать их на вход метода разделённых сканов. А 2-ой "субскан" после СК - это просто вырезанная отдельно из исходного скана серая картинка, у которой размер (длина на ширину в пикселях), естественно, не такой, как у цельного исходного скана.

Как сделать эти 2 субскана в СК 5.91 одинакового размера? Или Picture Zones задуманы исключительно как средство воздействия на автоматическую сегментацию при последующем DjVu-кодировании?

Добавлено:
Всё, нашёл сам: Zones->Picture Zone->Merge zones… и ставим флажок Create separate files for non-bw zones.
Автор: monday2000
Дата сообщения: 28.07.2008 11:02
Но полученные 2 субскана всё равно не проходят на входе метода разделённых сканов - приходится сначала пропускать через Irfan View.

Добавлено:
СК 5.91 выдаёт 2-й субскан в 8-битном greyscale (исходный скан - тоже 8-битный). А NetPBM-утилиты его не воспринимают - приходится конвертировать в 24-бит цветное в Irfan View. Попытки получить из СК 2-й субскан в 24-битном виде не увенчались успехом - даже если выставить на опциях Picture-зоны 24 бита.
Автор: Arcand
Дата сообщения: 28.07.2008 12:39
monday2000
Цитата:
NetPBM-утилиты его не воспринимают - приходится конвертировать в 24-бит цветное в Irfan View.
Все должно работать, приходится только перекодировать серый файл фона Ирфаном.
Несколько страниц из книги, сделанной методом разделенных сканов. Некоторые рисунке я разделял на маску и фон с помощью Корела, так что не удивляйтесь этому . Это я хотел посмотреть, что получится из этого.
Автор: monday2000
Дата сообщения: 28.07.2008 13:00
Arcand

Цитата:
приходится только перекодировать серый файл фона Ирфаном.

Ну да, я же именно об этом и говорю - и перекодировать его (серый субскан) приходится в 24-bit Color - иначе NetPBM-утилиты его не воспринимают. Можно прикрутить в цепочке NetPBM-утилит ещё одну - повышающую с 8 до 24 бит. Сейчас поищу, что это за утилитка там.
Автор: Arcand
Дата сообщения: 28.07.2008 13:48

Цитата:
его (серый субскан) приходится в 24-bit Color - иначе NetPBM-утилиты его не воспринимают.
Я имел ввиду простое перекодирование серых файлов фона в Ирфане, без изменения глубины цвета. У меня после этого все работало.
Автор: kontiky
Дата сообщения: 28.07.2008 20:58
Неужели проект sk уже закрыт окончательно? ;(
Сужу по урлу
http://bolega.hotmail.ru/Proekt%20zakryt/iz-za%20otsutstvija%20svobodnogo/vremeni%20i%20intersa/

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.