Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: shch_vg
Дата сообщения: 02.07.2014 01:56
Dracula
Вроде бы мы общаемся на русском языке, а Вы не делаете то, что я написал.
Меня АБСОЛЮТНО НЕ ИНТЕРЕСУЕТ разворот из Вашей книги. Я предлагал сделать sub-task одной страницы (в Вашем случае одного разворота) и описал, как это сделать. Это нужно для того, чтобы понять, как Вы обрабатывали этот разворот. Если Вы это не можете сделать, то я Вам ничем помочь не могу.

Цитата:
Да, честно говоря не понял как это заменить обработанные мной, если они уже объединились (к примеру текст и 1 картинка на странице уже внедрена).

Если Вы действительно делали в своем задании picture-зоны, то в директории out кроме страниц с объединенными зонами должны находиться и тифы, в расширении которых присутствует слово "pic". Это и есть те зоны, которые Вы должны заменять. После объединения зон с текстом задание теряет связь между сканом страницы и сканами зон, расположенных на этой странице. После повторной обработки зон эта связь восстанавливается, и хотя на скане с текстом остается старая объединенная зона, но появляется возможность обработать зону, как это нужно, и заменить при повторном объединении старую зону на скане страницы на новую, устраивающую Вас.
Как Вы дополнительно обрабатывали свои картинки, я не знаю, да и не очень хочу знать. А что-то еще посоветовать смогу, только увидев в sub-task, как Вы обрабатывали этот разворот.
Если все, что я Вам написал выше и ранее Вам непонятно, то я ничем помочь не могу, Вам надо изучить работу в программе Сканкромсатор, увы!
Автор: Dracula
Дата сообщения: 02.07.2014 09:18
shch_vg

Цитата:
Я предлагал сделать sub-task одной страницы (в Вашем случае одного разворота) и описал, как это сделать. Это нужно для того, чтобы понять, как Вы обрабатывали этот разворот.

Но я именно так и сделал. Там и разворот книги после скана и 2 отдельные страницы после обработки в ScanKromsator даны.

Добавлено:

Цитата:
Если Вы действительно делали в своем задании picture-зоны, то в директории out кроме страниц с объединенными зонами должны находиться и тифы, в расширении которых присутствует слово "pic".

Да такое есть отдельные фото моих выделенных в picture zones файлы лежать с названиями pic.0001 и т.д.

Добавлено:

Цитата:
Это и есть те зоны, которые Вы должны заменять.

Заменять на что? Я их уже обработал в данной папке (out) - но объединиться они не захотели.
Только 7 рисунков объединились, которые я заново переобработал в ScanKromsator (подтянул picture zone - т.к. подпись к рисунку налазила на рисунок).
По Вашему нужно книгу всю снова обработать и снова проверить и убрать всякие спеклы - снова все картинки обрабатывать (увеличивать яркость и т.д.)? Это же сколько опять времени займёт.
Автор: bolega
Дата сообщения: 02.07.2014 10:01
Dracula
Вы должны понимать, что объединение зон с текстом - необратимая операция. И выполняется в самый последний момент, когда все проверено.
После объединения СК во внутренних структурах зоны взводит флажок, который отвечает за признак слияния. Теоретически можно было бы флажок просто сбросить в ноль, тогда переобрабатывать зоны не нужно будет. Практически же такой команды на данный момент нет. Важно еще, что переобработка зоны может привести к нежелательным последствиям: ее новое положение может не совпасть с тем, что было до переобработки. Это происходит, если в постобработке менялись размеры зоны, были ручные сдвиги страницы или их габаритов. Кстати, в готовящейся версии СК теперь это контролирует и выдает предупреждения (уже сделано).
Самое главное - нет никакого смысла вообще объединять зоны. СК сам умеет делать djvu, слияние зон он делает на лету, когда сочтет нужным, при этом выходные файлы не меняются, т.к. слияние выполняется во временные файлы.


Цитата:
Нажимаю, но выходит такое опять:
Error "Command unavailable for current Page Type option value (Auto)".

Здесь по-моему все написано понятно: на закладке book Page type = auto. Что говорит о том, что СК не знает, какой ему нужно выдерживать размер страниц (книги). В таком состоянии слияние невозможно. Page type должен быть равен fixed и заданы размеры книги. Похоже, задание пошло вразнос.
Автор: shch_vg
Дата сообщения: 02.07.2014 11:31
Dracula

Цитата:
Но я именно так и сделал.

Вы меня ввели в заблуждение, написав, что выложили разворот, а я не посмотрел.
В Вашем случае все просто.
Поставьте на закладке Book списки Page width и Page Height в значение Fixed, а потом переобработайте только все зоны, как я описал выше.
Если Вы дополнительно обрабатывали тифы с расширением pic в других программах, то предварительно сохраните их в другой директории, а после переобработки зон просто замените ими вновь образовавшиеся тифы.
Автор: Dracula
Дата сообщения: 02.07.2014 12:19

Цитата:
Если Вы дополнительно обрабатывали тифы с расширением pic в других программах, то предварительно сохраните их в другой директории, а после переобработки зон просто замените ими вновь образовавшиеся тифы.

Да обрабатывал с помощью Microsoft Picture Manager прямо в папке out - они там и сохранялись обработанные picture zones. Ну сохраню в другю папку эти picture zones - затем сделаю как Вы описали выше в ScanKromsator с зонами (fixed и обработать). Затем верну (заменю те, что были picture zones с папки куда перекинул временно). НО. у меня же они не заменятся на самих страницах - чтобы был текст на странице и НОВАЯ (обработанная картинка с помощью Microsoft Picture Manager) чтобы именно они встали на страницы обработанные после ScanKromsator.


Цитата:
СК сам умеет делать djvu,

Я это делаю в LizardTech Document Express Enterprise 5.1 - яд умаю он создан специально для кодирования и качество будет лучше - сорри - я не преуменьшаю Ваших заслуг. Но думаю, для перевода в DjVu лучше пользоваться уже специально заточенным для этого продуктом.
Автор: bolega
Дата сообщения: 02.07.2014 13:03
Dracula

Цитата:
НО. у меня же они не заменятся на самих страницах

После переобработки появится возможность снова их merge


Цитата:
Я это делаю в LizardTech Document Express Enterprise 5.1 - яд умаю он создан специально для кодирования и качество будет лучше

СК именно его и вызывает для создания djvu. Разница в том, что СК берет на себя все действия по подготовке файлов и вызову DEE. Кроме того, для кодирования зон используется МПФ, что на сегодня является наиболее оптимальным методом раздельного кодирования текста и иллюстраций.
Грубо говоря: вы сливаете зоны с текстом, потом DEE автоматически делает обратную операцию (вычленяет текст и фон/картинки), что неизбежно приводит к артефактам в области зон. Налицо ненужная lossy операция, ведь мы и так заранее знаем, где текст, а где зоны, так зачем эту разбивку снова поручать DEE, когда можно самому закодировать текст, зоны и потом объединить в один файл. Причем кодировать текст будем тем же DEE, что действительно является наилучшим. Такое раздельное кодирование и есть метод МПФ

Добавлено:

Цитата:
качество будет лучше - сорри - я не преуменьшаю Ваших заслуг

я не настолько глуп, чтобы подменять профессиональный DEE собственными поделками
Автор: Dracula
Дата сообщения: 02.07.2014 13:27
bolega
Я кодирую текст+фото таким способом - My_Scanned600.
Я правда не знаю как можно откодировать отдельно фото и текст - если картинки слиты на странице уже? Я так понимаю если это делать из ScanKromsator - то там отдельно кодируются текст в Bitonal и фото профилем Scannned 600 и затем объединяется в один файл DjVu?
Автор: bolega
Дата сообщения: 02.07.2014 14:23
Dracula

Цитата:
Я правда не знаю как можно откодировать отдельно фото и текст - если картинки слиты на странице уже?

После слития - увы, никак. Это на будущее.

Цитата:
если это делать из ScanKromsator - то там отдельно кодируются текст в Bitonal и фото профилем Scannned 600 и затем объединяется в один файл DjVu?

Текст кодируется не обязательно bitonal, вы сами укажете СК, какой профиль взять из DEE (по умолчанию профиль настроен непосредственно в СК, и он imho оптимальный, можно только изменить по желанию количество страниц в словаре).
Картинки кодируются с помощью djvulibre (ничем не хуже чем DEE), т.к. и в том, и в другом инструменте используется практически одинаковое вейвлет-кодирование. Качество кодирования можно варьировать. Вызов кодировщиков, слияние слоев, раскраску текста (если есть), кодирование и вставку обложек (или цветных вкладок) СК берет на себя.
СК поддерживает и обычное DEE-кодирование, не раздельное. Но при этом вам не нужно заморачиваться слиянием зон, СК сделает все сам. Более того, можно применять разный способ кодирования для разных страниц.
Правда в текущей публичной версии есть проблемы с утечкой памяти при создании djvu. Проблемы пофиксены в новой версии, которая будет в скором времени доступна.
Автор: shch_vg
Дата сообщения: 02.07.2014 16:45
Dracula

Цитата:
НО. у меня же они не заменятся на самих страницах - чтобы был текст на странице и НОВАЯ (обработанная картинка с помощью Microsoft Picture Manager) чтобы именно они встали на страницы обработанные после ScanKromsator.

Если после этого снова сделаете объединение, то именно это и произойдет.
Проверьте на любой зоне на любом развороте и сами убедитесь в этом.
Автор: Dracula
Дата сообщения: 02.07.2014 21:42
bolega
shch_vg
Ребята огромное Вам спасибо - реально работает. Не пришлось всё заново переделывать. Поставил размер страниц - fixed и обработал picture zone - затем заменил эти зоны в папке "out" на те, что я обработал в графическом редакторе и всё заменилось и в ScanKromsator'e зоны объединились наконец обработанные в графическом редакторе которые.
Автор: shch_vg
Дата сообщения: 03.07.2014 19:27
bolega
Маркирую ряд зон в середине книги, меняю параметры обработки и обрабатываю их. После завершения обработки появляется RV первой страницы, а хотелось бы видеть RV страницы, содержащей первую помеченную зону.
Автор: driver1991
Дата сообщения: 13.07.2014 23:04
Господа,

странная ситуация: создаю ПДФ, к моему удивлению - качество текста ухудшается. Незначительно, но неприятно и видно "невооруженным глазом". Может ли кто-либо помочь? С чем это может быть связано?
Автор: shch_vg
Дата сообщения: 14.07.2014 00:22
driver1991
Было бы странно, если бы качество улучшалось.
Любое преобразование с сжатием заведомо ухудшает качество, весь вопрос - насколько? Я могу так создать пдф, что Вы вообще не различите на нем ничего.
Мораль всего вышесказанного: нужно подробно описать, как Вы создавали пдф.
Автор: driver1991
Дата сообщения: 14.07.2014 10:59
Я не думал, что создание пдф в кромсаторе надо описывать. Вообще-то это достаточно стандартная процедура: создается выводящее задание (create out-task), на закладке "Files" указывается требуемый формат (в моем случае - пдф) и имя файла, далее "Process". На закладке "PDF" можно указать "Page layout" и качество сжатия для цветных или серых страниц (у меня - черно-белый текст без иллюстраций).

Если Вы при этом можете черно-белый текст превратить в нечто, на чем ничего не различить - это говорит о высокой квалификации. У меня таких целей нет.

Я не делаю никакого сжатия. Для меня странно, что это стало происходить в последние неделю - две, до этого я может быть ничего не замечал, а может быть ухудшений не было.

Автор: bolega
Дата сообщения: 14.07.2014 11:20
driver1991
у вас прочие опции обработки отключены? На закладке Files чему равно DPI и Color? Создание pdf мало чем отличается от обработки файлов, если есть какие-то включенные опции, они будут учтены.
Автор: driver1991
Дата сообщения: 14.07.2014 12:13
bolega

DPI = 600
Color=b/w
Input DPI = auto; сканирую я обычно 300.

"Создание pdf мало чем отличается от обработки файлов, если есть какие-то включенные опции, они будут учтены."

Учитываются опции только с закладки "Files" или с других закладок тоже?

Еще один вопрос. Книга издана недавно, репродукционное или репринтное издание дореволюционной книги. Качество получается невысокое, уже на сканах потери эилементов букв: например, "н" без горизонтальной черты и т. д. Что в этом случае может быть сделано для улучшения? Изменить настройки сканера?
Автор: shch_vg
Дата сообщения: 14.07.2014 12:34
driver1991
Сделайте subtask на какой-нибудь скан, на котором заметно это ухудшение, и выложите директорию task в архиве на обменник. Заодно добавьте в этот архив Ваш ухудшенный вариант пдф этой страницы.
Насчет сканера могу сказать, что многие из них при работе по умолчанию пытаются сделать какие-то дополнительные обработки создаваемых сканов.
Поэтому на мой взгляд лучше всего сканировать в vuescan в вариант raw, качество которого наиболее приближено к исходному состоянию страницы/разворота.
И, конечно, увеличение дпи сканирования (до 600) даст заведомо нехудший вариант.
Автор: driver1991
Дата сообщения: 14.07.2014 13:23
shch_vg

Цитата:
выложите директорию task в архиве


Я не совсем понял, что это за директория. У меня есть директория со сканами в формате тиф. В этой директории кромсатель создает директории "SPT" и "out". Файлы пдф можно сохранять в любой удобной директории, кромсатель сохраняет их в "out", для меня это не играет никакой роли, их затем можно преместить куда угодно.
Какую директорию имеете в виду Вы?

bolega

Еще вопрос, Я использую "Акробат" Про 10, им я обрабатываю также другие файлы, не только из кромсатора. Учитываются ли настройки, используемые при обработке "посторонних" файлов при создании пдф в кромсаторе из файлов, полученных в кромсаторе?
Автор: bolega
Дата сообщения: 14.07.2014 13:35
driver1991

Цитата:
Учитываются опции только с закладки "Files" или с других закладок тоже?

С других тоже.
Я уже не раз писал, как правильно делать pdf. Если есть сканы, то сразу pdf делать не нужно. Обрабытывайте сканы с выводом в tif. Когда все готово, делаете задание для pdf: Files->Create out-task.
Если же сразу делать с обработкой в pdf, то что-либо частично переобработать будет невозможно, нужно будет прогонять все задание по-новой. Не будет также возможности сделать пост-обработку.

Если при обработке страдают перемычки, то нужно задействоать опции gray enhance.
Пропадают они по двум причинам: они изначально малоконтрастны, т.е. не намного отличаются от фона и поэтому исчезают при бинаризации, либо рваные и поэтому часто удалятся despecklом. В первом случае следует использовать опции unsharp и contour enhance, во втором придется использовать safe despeckle.

Добавлено:

Цитата:
использую "Акробат" Про 10, им я обрабатываю также другие файлы

Не понял вопроса. СК не использует Acrobat и его настройки при создании pdf. После СК pdf рекомендуется по вкусу оптимизировать уже средствами акробата. В свойствах оптимизатора акробата нужно обязательно отключать группу "прозрачность". Почему-то акробат не любит прозрачные зоны СК (и непрямоугольные). Отображает все правильно, а оптимизировать не хочет.
Если нет picture-зон, то pdf можно сразу делать акробатом. Если есть зоны, то только СК.
Автор: driver1991
Дата сообщения: 14.07.2014 13:56
bolega


Цитата:
Обрабытывайте сканы с выводом в tif. Когда все готово, делаете задание для pdf: Files->Create out-task.


Только так и делаю, почти всегда полученные тиф надо немного чистить, потом делать пдф.

В gray enhance на закладке Sharpen - enhance contour и sharpen:
использовать обе опции или только enhance contour?

И Sharpen и в unsharp - что за параметры: radius, strength и passes?
Автор: shch_vg
Дата сообщения: 14.07.2014 14:28
driver1991

Цитата:
Какую директорию имеете в виду Вы?

Я имею в виду директорию task, которая ПОЯВИТСЯ в директории с исходными сканами после выполнения функции File->Create sub-task...
Автор: driver1991
Дата сообщения: 14.07.2014 15:07
bolega


Цитата:
Не понял вопроса


Я использую Акробат для создания пдф из файлов Ворд, Фотошоп и других текстовых и графических редакторов. Соответственно, настройки приходится иногда оптимировать.



Цитата:
СК не использует Acrobat и его настройки при создании pdf.

Все понятно. Даже более или менее ясно, в чем дело.

Все-таки, что за параметр radius в enhance contour? strength и passes - там более или менее все ясно.

shch_vg

Кажется, все уже прояснилось, спасибо.
Но вот насчет сканирования, Вы пишете:


Цитата:
лучше всего сканировать в vuescan в вариант raw


Я использую EPSON-Scan, программу от сканера просто по тем соображениям, что лучше всего к сканеру подходит драйвер от фирмы-изготовителя, во всяком случае, мне кажется, что так должно быть. Я уже много раз слышал о vuescan, пользователи довольны. Играет ли здесь драйвер какую-либо роль или это большого значения не имеет?
Автор: shch_vg
Дата сообщения: 14.07.2014 15:19
driver1991
Цитата:
Я использую EPSON-Scan, программу от сканера

Vuescan тоже использует как правило драйверы от фирмы-изготовителя, так что если у Вас он установлен, а vuescan его поддерживает, то проблем не будет.

Цитата:
Играет ли здесь драйвер какую-либо роль

Вряд ли драйвер играет какую-либо роль в этом вопросе.
А вот программа от сканера может влиять. Я не говорю, что именно у Вашей программы есть проблемы, но по умолчанию в ней могут быть настройки, которые дополнительно преобразуют получаемый скан, а raw в vuescan делает скан, наиболее приближенный к исходному виду. Например, формат tif в том же vuescan делает скан более светлым и читабельным, но менее удобным для последующей обработке в том же Сканкромсаторе. Если не лень, попробуйте найти в инете портабельный вариант vuescan. Если он поддерживает ваш сканер (а он поддерживает огромное количество сканеров), то сможете сделать сканы в указанных мной форматах и сравнить с получаемыми Вами в родной программе сканера. Тогда у Вас не будет вопросов к сканированию.

P.S. А в Вашем изначальном вопросе, как я понял, все дело не в создании пдф, а в настройках СК при обработке сканов.
Автор: driver1991
Дата сообщения: 14.07.2014 15:46
shch_vg


Цитата:
в настройках СК при обработке сканов


Да. именно в них. Я подумал, что если СК использует программы Акробата для преобразования тиф в пдф, то это может влиять на качество. особенно когда настройки изменены. Но bolega четко объяснил, что это не так.


Цитата:
портабельный вариант vuescan
- это, вероятно, значит переносимый с одного ПК на другой? Что такое портабельный? У меня есть vuescan 9 х64, версия 9. 2. 23, но, честно говоря, я оттягивал переход на нее. Видимо, сколько веревочка ни вейся....
Автор: shch_vg
Дата сообщения: 14.07.2014 16:11
driver1991

Цитата:
это, вероятно, значит переносимый с одного ПК на другой?

Это значит такой, который не оставляет следов в реджестри установленной системы и может быть выполнен без предварительной установки (setup) на любом компьютере. Я стараюсь пользоваться именно такими программами.
Автор: driver1991
Дата сообщения: 14.07.2014 16:23

Цитата:
который не оставляет следов в реджестри


Ну вот, и с этим разобрался, Спасибо.
Автор: driver1991
Дата сообщения: 15.07.2014 13:04
shch_vg

Я сделал сравнение сканов от VueScan (raw) и от EPSON Scan. Последний - в двух вариантах: с автоматическим управлением подсветкой и без него. Если есть время и желание - я их выложу на яндекс и можно будет обсудить результаты.

Еще один вопрос: есть ли где-нибудь ветка с подобной темой. Обычно все советы заканчиваются тем, что рекомендуюется отключить все настройки сканера и обрабатывать сырые сканы. Мне кажется, что несжатые - да, но вот отключать настройки сканера - это может быть и вопрос.
Автор: shch_vg
Дата сообщения: 15.07.2014 13:08
bolega
Создаю длинную узкую picture-зону. В основном окне она видна и удается зайти в ее свойства, а в RV она не видна ни в формате Zones (а, следовательно, нельзя ее почистить), ни в других форматах.
Вот пример страницы.
Такое ощущение, что СК игнорирует эту зону, т.к. попытка сделать мердж через меню приводит к сообщению: "Nothing to do!".
Автор: shch_vg
Дата сообщения: 15.07.2014 23:33
driver1991
Вопросы, которые Вы задаете, не имеют никакого отношения к данной теме.
Я, честно говоря, 7 лет использую vuescan по минимуму, и меня это вполне устраивает. Насчет веток по теме ничем помочь не могу, т.к. меня настолько этот вопрос не интересовал.
Автор: slava_kry
Дата сообщения: 16.07.2014 06:39
driver1991

Цитата:
но вот отключать настройки сканера - это может быть и вопрос.

Отключают для того, чтобы сканы были одинаковыми по контрасту/яркости/цвету. Это позволит в дальнейшем делать однотипные операции автоматом.
"Рыться" в сканировании имеет смысл только при работе с цветом, да и то если цвет важен, а в нашем случае это не нужно.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.