Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: NAATH
Дата сообщения: 16.09.2011 16:44
bolega 13:44 16-09-2011
Цитата:
С новой версией (5.95beta) таких проблем не будет: http://www.onlinedisk.ru/file/734333/


Респект и уважуха!


Лучший результат работы ресайзера + еще трех разных программ: http://webfile.ru/5549980
А вот так делает - ScanKromsator: http://webfile.ru/5549982

Никакой имидж-ресайзер - так сделать не сможет.

Спасибо, большое и человеческое!
Автор: Torino
Дата сообщения: 16.09.2011 16:49

Цитата:
А вот так делает - ScanKromsator

Здесь скорее всего применен фильтр Smart blur
Автор: shch_vg
Дата сообщения: 16.09.2011 16:58
NAATH

Цитата:
Никакой имидж-ресайзер - так сделать не сможет.

А что было сделано в новой версии СК?
Почему это же нельзя было сделать с предыдущими версиями?
Автор: shch_vg
Дата сообщения: 16.09.2011 19:10
bolega

Цитата:
Такие бредовые по структуре pdf создаются сканерами в составе МФУ (Canon и т.п.).

Поскольку следует ожидать появления все новых образцов "такого творчества", хотелось бы понять, что с ними можно делать в рамках СК.
Пока же я вижу следующее. После импорта подобного pdf возможности работы с ним ограничены. Чтобы получить доступ до picture-зон приходится предварительно обрабатывать загруженные файлы. Здесь возникает проблема выбора dpi для такой обработки.

Вопрос: Указанный Вами способ обработки может теоретически ухудшить качество страницы за счет выполнения каких-то дополнительных действий СК, или это просто апсемплинг основного скана с наложением на него сканов зон?

Dpi основного скана 150, сканов picture-зон - 300. Если приводить в 150, то как раз очень заметна указанная мной потеря читаемости текста на зонах, если же приводить к 300, то это приведет к резкому увеличению размера основного скана, что скажется на размере итогового pdf.
Таким образом, задача, поставленная NAATH по приведению всех страниц одного pdf к одинаковому размеру в рамках СК, решается следующим образом:
После импорта пдф в СК у всех страниц с увеличенным форматом (они не помечены красным после загрузки) нужно выставить их реальное разрешение (в случае приведенной книги заменить 96 на 300), затем обработать ВСЕ файлы, введенные в СК с выходным разрешением 300 (здесь возможна расширенная обработка, чтобы сделать все страницы одинакового размера с точностью до пикселя), потом объединить зоны с основными сканами и создать из получившихся выходных файлов пдф, задав на закладке Files значение списка DPI = 150 для неувеличения размера выходного пдф по сравнению с исходным.

Жаль, что нет возможности сразу после импорта такого пдф произвести массовое объединение основных сканов с зонами с возможным вопросом о dpi объединенного скана.
Автор: bolega
Дата сообщения: 16.09.2011 23:13
shch_vg

Цитата:
Поскольку следует ожидать появления все новых образцов "такого творчества", хотелось бы понять, что с ними можно делать в рамках СК.

Думаю, ничего. Это как раз тот случай, когда из pdf нужно не извлекать изображения, а экспортировать в заданном разрешении. Единственная польза тут от импорта в СК в том, что появляется возможность проанализировать результат на предмет выявления максимального dpi, с которым и выполнять потом экспорт. Ведь если задать его меньшим, то будут потери в качестве. Если задать большим - будут апсэмплы, ничего не добавляющие по качеству, а только увеличивающие размер. Ну и остается чисто теоритеческий интерес к тому, чтобы в деталях увидеть, насколько порой сложно и причудливо формируются изображения страниц в pdf-файлах. Чтобы в свою очередь понять, что извлечение изображений из Pdf - иногда бесполезная операция.


Цитата:
Жаль, что нет возможности сразу после импорта такого пдф произвести массовое объединение основных сканов с зонами с возможным вопросом о dpi объединенного скана.

Есть, но я ее пока заблокировал из-за того, что она еще недостаточна отлажена. Только без вопроса о dpi, у меня он берется как max из dpi страницы и лежащих на ней зон. Тут правда могут возникнуть большие проблемы, если dpi неправильны.

ghosty

Цитата:
С фильтром (все настройки на минимум):

Вы правильно все подметили. Но этот фильтр и не предполагалось использовать для хороших сканов (как у Вас в примере). Основное применение - для корявых букв со сколами, выступами и т.д.

Добавлено:
shch_vg

Цитата:
Если приводить в 150, то как раз очень заметна указанная мной потеря читаемости текста на зонах, если же приводить к 300, то это приведет к резкому увеличению размера основного скана, что скажется на размере итогового pdf.

Так и есть. Решений тут три: либо оставить как есть, либо переводить в 300dpi (300, потому что это максимальное dpi, которое встречается на страницах этого pdf; меньшие значения приведут к деградации), либо перевести в 300 и затем обработать по обычной схеме 300->600bw, с ручным выделением зон (это долго, нудно и при таком качестве оригинала неоправдано).
Автор: ndch
Дата сообщения: 17.09.2011 15:00
bolega

Цитата:
Такие бредовые по структуре pdf создаются сканерами в составе МФУ (Canon и т.п.). Налицо жалкие попытки выполнить автомат. разделение скана на слои. Результат как правило плачевный.

Ну а смысл винить автоматическое деление, реализованное по остаточному принципу ?
Автор: bolega
Дата сообщения: 17.09.2011 23:02
ndch
Чтобы убедить пользователей МФУ не сканировать на них книги в pdf. Они годятся для сканирования в tif, в pdf же можно сканить только офисные документы
Автор: ndch
Дата сообщения: 18.09.2011 04:07
bolega
Пользователи МФУ, сканирующие на них книги - это уже диагноз.
Не разу не видел приличного сканера в мфу.
Автор: shch_vg
Дата сообщения: 18.09.2011 22:28
Вопрос к работающим в winXP или Windows server 2003:
При первоначальном запуске СК 5.95beta02 появляется ли у вас сообщение об ошибке "Access violation...", которое я упоминал в своем сообщении выше?
Автор: ghosty
Дата сообщения: 18.09.2011 22:50
shch_vg
В WinXP SP3 не наблюдаю.
Автор: shch_vg
Дата сообщения: 18.09.2011 23:08
bolega
Зря Вы убрали в последней версии программы на закладке Book поле Merge pages after split, т.к. теперь нет возможности объединить два скана в один.
Автор: ghosty
Дата сообщения: 18.09.2011 23:10
shch_vg

Цитата:
Зря Вы убрали в последней версии программы на закладке Book поле Merge pages after split, т.к. теперь нет возможности объединить два скана в один.
А зачем это может быть нужно?
Автор: shch_vg
Дата сообщения: 18.09.2011 23:10
ghosty
Тогда интересно, почему у меня в WinXP SP3 это есть ???
М.б. что-то еще нужно подцепить по сравнению с предыдущей версией?

Добавлено:

Цитата:
А зачем это может быть нужно?

Простой пример:
имею одностраничные сканы, а хочу иметь развороты, чтобы было как в книге.
Могу придумать и другие варианты, например, получение скана формата А3 после сканирования на сканере формата А4.
И это еще не все.
Автор: ghosty
Дата сообщения: 18.09.2011 23:24
shch_vg

Цитата:
имею одностраничные сканы, а хочу иметь развороты, чтобы было как в книге.
Вот я и думаю, зачем? Это же при желании в любом ридере можно программно сделать.

Цитата:
Могу придумать и другие варианты, например, получение скана формата А3 после сканирования на сканере формата А4.
Так в этом случае еще и совмещение нужно делать - для этого есть специализированный софт.
Автор: shch_vg
Дата сообщения: 19.09.2011 00:23
ghosty

Цитата:
для этого есть специализированный софт

А Вы уверены, что СК делает пдф и дежавю лучше, чем "специализированный софт"?
Если нет, тогда зачем это делать в СК?
И кстати я задал вопрос не о добавлении в программу дополнительной функции, а об удалении функции, которой можно было пользоваться, что я и делал вместо привлечения еще какого дополнительного софта.
Автор: kriegsmarine
Дата сообщения: 19.09.2011 01:11
ghosty

Цитата:
А зачем это может быть нужно?

Пример: при добавлении обложки книги нумерация сбивается, чтобы этого не произошло, можно объединить 1-2-ю или 2-3-ю страницы - очень удобно, с помощью этой опции. Было бы неплохо, если эта опция не будет "похерена"


Автор: ghosty
Дата сообщения: 19.09.2011 01:40
shch_vg

Цитата:
А Вы уверены, что СК делает пдф и дежавю лучше, чем "специализированный софт"?
Если нет, тогда зачем это делать в СК?
Ну ладно, я уже ничего не понимаю

kriegsmarine

Цитата:
Пример: при добавлении обложки книги нумерация сбивается, чтобы этого не произошло, можно объединить 1-2-ю или 2-3-ю страницы - очень удобно, с помощью этой опции.
Если нумерация сбивается, это можно поправить, не объединяя страницы.
Объединение страниц - какой-то, я бы сказал, изуверский способ исправления нумерации
Автор: kriegsmarine
Дата сообщения: 19.09.2011 01:59
ghosty

Цитата:
Если нумерация сбивается, это можно поправить, не объединяя страницы.
Объединение страниц - какой-то, я бы сказал, изуверский способ исправления нумерации

Для djvu, - самый простой и быстрый. Но это частность. Все-таки, думаю, не стоит выбрасывать редко используемые, но рабочие опции.
Автор: bolega
Дата сообщения: 19.09.2011 02:20
shch_vg

Цитата:
Зря Вы убрали в последней версии программы на закладке Book поле Merge pages after split, т.к. теперь нет возможности объединить два скана в один.

Если сканы - развороты, и нужно объединить их попарно, как в оригинальных сканах, то можно использовать Page->Special->Merged page. Причем эта опция может применяться выборочно, к заданным разворотам. Для страниц-не-разворотов опция игнорируется! Merge page after из предыдущих версий работала по-другому, она сливала половинки/одиноч.сканы последовательно. Но я уже писал, что опция давно не поддерживается, с тех пор как появились picture-зоны. Проблема чисто техническая: в окне VR невозможно отображать зоны, находящиеся на других страницах (а это могло иметь место при Merge page after split). Кроме того, эта опция была плохо совместима с режимом без финализации.
Но не все так плохо. Будет отдельная команда, аналогичная по функционалу удаленной опции. Предполагается, что она будет применяться только к одиночным (не разворотам), уже обработанным сканам. Работать будет по типу команды "create out-task". При выполнении команды можно будет доп-но указать, в каких местах вставить пустые страницы, а какие не объединять. Возможно, такое решение покажется более сложным, но по-другому у меня просто не получается.

kriegsmarine

Цитата:
чтобы этого не произошло, можно объединить 1-2-ю или 2-3-ю страницы - очень удобно

А на мой взгляд, очень неудобно иметь в начале вдруг разворот. Подумайте о тех, кто захочет напечать книгу, например, брошюрой. Я честно говоря, не очень понимаю, почему нужно такой ценой выдерживать нумерацию. Ведь много книг имеют вкладки без номеров, что гарантирует несовпадение сквозной нумерации. Некоторые ради нумерации переносят их в конец, но это кощунство. Книга - не колода карт, и если автор/редактор поместил вкладки внутрь книги, то произвольно перемещать их в конец неправильно. Не говрю уже о том, что часто вкладки иллюстрируют близлежащий текст.
Впрочем, о вкусах не спорят. Каждый делает так, как ему нравится. И я готов предусмотреть любые варианты.
Автор: shch_vg
Дата сообщения: 19.09.2011 02:39
bolega

Цитата:
Будет отдельная команда, аналогичная по функционалу удаленной опции. Предполагается, что она будет применяться только к одиночным (не разворотам), уже обработанным сканам. Работать будет по типу команды "create out-task".

Вряд ли аналогичная, т.к. судя по Вашим словам "будет применяться ... к ... обработанным сканам".
Я же применял ее в основном к сканам, полученным на стороне.
Придется для этих целей использовать предыдущие версии программы .
Автор: bolega
Дата сообщения: 19.09.2011 07:20
shch_vg

Цитата:
Я же применял ее в основном к сканам, полученным на стороне.

"Обработаннм" - значит, уже не требующих новой обработки (кроме слияния), в том числе создания новых зон. Вы можете загрузить сторонние сканы и считать их уже обработанными.
Автор: Torino
Дата сообщения: 19.09.2011 14:44
bolega
Обнаружилось некорректное поведение программы:
Резаки расставлены, кромсание произведено.

После чего сказал программе Calculate book size
Смотрю результаты во View Results
Все устраивает

Устанавливаю на вкладке Book параметры Page width/height обратно в Auto.
Опять говорю Calculate book size, но приэтом в группе Calculate снимаю галку Height
Жму ОК
Положение резаков сходит с ума: т.е. они произвольно сдвигаются, нарушая результат DK.
Отрываю окно VR - положение текстовой области прыгает по листу, несмотря на то, что на вкладке Page оба выравнивания установлены в Centre

Я записал это на видео (ссылку на YouTube добавлю позже, очень медленно загружается)
Видео записано уже после того, как положение резаков "слетело" после Calculate book size

На видео я перезапустил SK не сохраняя задание и выполнил туже последовательность действий, однако глюк с резаками повторить не удалось. Но "прыжки" текстовой области видно.
Автор: bolega
Дата сообщения: 19.09.2011 15:43
Torino
Сдвиги резаков - это мне непонятно, что такое. Глюк какой-то.
А вот насчет второго подозреваю, что все правильно. На самом деле ничего не прыгает, а просто отключен режим book preview. Причем он отключен, т.к. Вы рассчитали только width книги, а height у Вас =auto т.е. с неопределенным значением (Вы же сняли галку, и он не рассчитался). Поскольку один из размеров неизвестен, book preview отключается автоматом. И Вы видите просто результат кромсания, без полей, т.е. область, отрезанную резаками и определенные в ее пределах границы текста. Поскольку отрезанные резаками области разные на разных сканах, то и создается впечатление прыганья, которое на самом деле вызвано тем, что во VR не выполнеа подгонка изображения под размер книги.
Напомню, что при book preview к обработанному изображению добавляются поля и применяется заданное выравнивание. Но поля прибавляются не физически (к файлу), а только на экране: юзеру показывается, как будут выглядеть страницы после унификации размеров страниц. При этом можно менять поля, размеры книги, выравнивание, двигать границы текста и т.д. без необходимости переобработки файла. После того, как все подогнано, можно дать команду финализации, которая сделает все то же самое, но уже физически над файлом.
Автор: Torino
Дата сообщения: 19.09.2011 16:29

Цитата:
На самом деле ничего не прыгает, а просто отключен режим book preview

Да, похоже так и случилось.
А по поводу резаков - можно будет увидеть в начале видео (до завершения закачки осталось 50 минут )

Видео закачалось.
http://youtu.be/E3sajWMTmoI

В самом начале видно положение резаков после сбоя.
Чуть дальше (после перезапуска SK) видно правильное положение резаков.
В самом конце можно не смотреть - я безуспешно пытаюсь повторить глюк.
Автор: monday2000
Дата сообщения: 23.09.2011 11:56
Умеет ли СК сохранять в PDF? Я так слышал, что вроде бы умеет.
Автор: Torino
Дата сообщения: 23.09.2011 12:35
Умеет. На вкладке File выбираем PDF. Задаем имя файла. На вкладке PDF устанавливаем параметры сжатия.
Автор: bearjrgm
Дата сообщения: 24.09.2011 15:59
Новая версия порадовала работой deskew (практически без промахов) и CSmoth.
Автор: juvaforza
Дата сообщения: 24.09.2011 21:06

Цитата:
В последнем СК есть возможность задавать градиент бинаризации, но настройки пока не совсем user-friendly

Наконец-то пришло время спросить про то, как этот градиент едят Имхо, настройки без информации совсем не user-friendly - непонятно само их назначение. Или хотя бы про рецепт (пример) приготовленных блюд - для аппетита.
Автор: shch_vg
Дата сообщения: 26.09.2011 20:19
bolega

Цитата:
- новый фильтр CSmooth (аппроксимирует контуры ч/б букв кривыми безье и сглаживает их). Неплохо работает для изначально 600dpi сканов (ч/б или серых/цветных). Для сканов, полученных 300dpi grey->600dpi bw, нужно проводить исследования. Фильтр можно применять как ко всей странице, так и к участку, с помощью соответствующей зоны. Хорошо сглаживает векторную графику (при любом dpi), включая шахм. диаграммы.

А нельзя более подробно о технологии применения этого фильтра?
Хотелось бы "провести исследование", но непонятно, с чего начинать.
Автор: monday2000
Дата сообщения: 27.09.2011 10:18
Torino
Спасибо!

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.