Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: bolega
Дата сообщения: 27.05.2014 22:21
shch_vg
step3.djvu не создался?
В общем случае не советую для страниц только с ч/б зонами с раскрашенным фоном задавать Downsample ratio. SK выбирает dpi фона для таких зон автоматически. Обратите внимание также на запись в логе "Resize Sjbz chunk". Это означает, что СК изменил фактич. размеры страницы в djvu, чтобы выдержать заданный Downsample ratio. Чтобы избежать этого, рекомендуется делать так, чтобы размеры страниц после обработки были кратны Downsample ratio. По умолчанию СК выдерживает кратность размеров равную 12 (см. size multiply на закладке Book), что обеспечивает также кратность на 2, 3, 4, 6, т.е. на все случаи жизни.
Теоретически, в случае отсутствия кратности, можно обойтись без Resize Sjbz chunk, ценой небольшого растяжения зон на 1-11 пикселей. Однако я посчитал, что оптимальнее изменить слегка размер страницы, чем растягивать слой с зонами.
Скажу также, что манипуляции с размерами и кратностью обусловлены требованиями стандарта djvu.
Автор: shch_vg
Дата сообщения: 27.05.2014 23:28
bolega

Цитата:
step3.djvu не создался?

нет

Цитата:
SK выбирает dpi фона для таких зон автоматически.

Вот это и настораживает, т.к. может привести к нежелательному увеличению размера дежавю.
В DJVU Small я менял Downsample ratio и получал разные размеры, в том числе и с фоном 50dpi.

Цитата:
По умолчанию СК выдерживает кратность размеров равную 12

В моем случае было как раз это (3756х5760).

Кстати, проверял еще такой вариант:
делал слияние всех зон, а потом пытался в СК получить дежавю, поместив все сканы в Step2 и пытаясь обработать их профилем, которым я обрабатывал в DJVU Small. Создание дежавю довольно быстро заканчивалось сообщением, что не найден какой-то временный файл.
А именно:
===========================
===========================
Step 2 start at 28.05.14 00:30
===========================
===========================

Prepare files... Done.
Run documenttodjvu.exe... Failed.
Use --help for usage instructions.
Error: [1-26007] The requested file 'C:\DOCUME~1\val\LOCALS~1\Temp\skfz029916AB.tif' does not exist..

===========================
===========================
Step 2 finished at 28.05.14 00:32
Encoding failed (20)
===========================
===========================

P.S. Похоже, задаче просто не хватает памяти, т.к. после такого вылета в Таск Менеджере за СК числится более 1,6 мб памяти.
Автор: bolega
Дата сообщения: 28.05.2014 08:23
shch_vg

Цитата:
Downsample ratio = 1 (фон = 600), =2 (300) и =3 (200) третий шаг отрабатывает нормально

Не совсем так. Т.к. есть только ч/б зоны с фоном, то СК выбирает dpi=150.
Фактически:
Downsample ratio = 1: out dpi фона =150 (т.к. фактически ratio=4)
Downsample ratio = 2: out dpi фона = 75 (и resize - т.к. размер не делится на 8 = 600/75)
Downsample ratio = 3: out dpi фона =50 (resize нет)
Downsample ratio =4: ошибка, и это правильно, т.к. фактически ratio=4*4=16 > 12!
Вывод: СК ведет себя в рамках заложенной логики правильно. Возможно, логику надо переделать: если задан Downsample ratio>1, то автоматом out dpi фона =150 делать не стоит. Но я против этого. 150 dpi – вполне нормальная величина. Подобрана опытным путем. При меньших значениях будут возникать артефакты.
Поэтому рекомендую не экспериментировать с подобными зонами, там и так все оптимально.

По поводу нехватки памяти – я уже рапортовал, что утечка найдена и исправлена. Подобных ошибок больше не возникнет.
Автор: shch_vg
Дата сообщения: 28.05.2014 15:16
bolega

Цитата:
Downsample ratio =4: ошибка, и это правильно, т.к. фактически ratio=4*4=16 > 12!

Спасибо за разъяснение!
Именно это мне пришло в голову после нескольких экспериментов.
Автор: rex
Дата сообщения: 28.05.2014 20:01
Если при обрезке страницы в ACDSee задать определенный размер, то в дальнейшем, при обрезке следующей страницы появляется рамка предыдущего размера, что очень удобно, хотя обрезать вручную получается все равно медленно.

А есть ли в ScanKromsator возможность жестко задать такую рамку? Чтобы даже если программа не угадала с обрезкой, просто перетещить в ручную рамку в нужное место и все?

Я пытался задавать фиксированный размер для обрезки, но все равно в конце получалось как-то не точно, да и с резаками возиться долго - время ручной пост обработки получается сопоставимо со временем ручной обрезки при помощи рамки.
Автор: rafRUD
Дата сообщения: 10.06.2014 10:48
Ребята помогите...При экспорте отредактированных страниц рисунки экспортируются отдельно.
Автор: Gazoved
Дата сообщения: 10.06.2014 14:23
rafRUD

Цитата:
При экспорте отредактированных страниц рисунки экспортируются отдельно

Что подразумеваете под экспортом, чуть подробней, что вы делаете и что хотите получить на выходе?

На первый взгляд, кажется, что вы хотите получить в итоге страницу с картинками, а команду "Merge" Вы делаете? В основном окне - меню Zones - > Picture Zones -> Merge zones
Автор: rafRUD
Дата сообщения: 10.06.2014 15:16

Цитата:
5-2006 | Отправ

меню Zones - > Picture Zones -> Merge zones...
у меня всплывает окно Merge zones
Автор: Gazoved
Дата сообщения: 10.06.2014 15:31
rafRUD

Цитата:
у меня всплывает окно Merge zones

Выбираете "All" и жмете ОК
Автор: rafRUD
Дата сообщения: 10.06.2014 15:50
Gazoved
[q][/q]
Выбивает окно warning: Nothing to do!
Автор: shch_vg
Дата сообщения: 10.06.2014 18:34
rafRUD
Вы не ответили на заданный Вам вопрос:

Цитата:
Что подразумеваете под экспортом, чуть подробней, что вы делаете и что хотите получить на выходе?

Автор: bolega
Дата сообщения: 10.06.2014 20:31
rafRUD
У Вас стояла наверное галка на create separate files. Поэтому зоны сливались в отдельные файлы. Если же еще стояла галка на delete zones after merging (введена по настоянию monday2000) то скорее всего, их больше нет и сливать более нечего.
Автор: rafRUD
Дата сообщения: 11.06.2014 12:10
[q][/q]
Нет не стояла галка ни там ни там...Я так понимаю что у меня не применяются заданные параметры этого окна потому что после того как я нажимаю ок у меня выскакивает окно
warning: Nothing to do!
Автор: rex
Дата сообщения: 12.06.2014 17:58
bolega

После нескольких экспериментов почти подобрал в программе подходящий набор настроек, но осталось полтора вопроса.
Если на странице почти нет текста, например нет ничего кроме "Часть 1", то программа аккуратно обрезает текст и помещает его в левый нижний угол страницы. Установка фиксированного размера страницы не помогает.
Есть ли возможность отключить сверхобрезку таких фрагментов или хотя бы задать центрирование обрезанного фрагмента?

Второй вопрос не столь важен, но все-таки - как зафиксировать на вкладке Quality опцию "DPI - Original Color - Original"?
Автор: VadimirTT
Дата сообщения: 12.06.2014 21:35

Цитата:
программа аккуратно обрезает текст и помещает его в левый нижний угол страницы

На первой вкладке настроек (Page) - Page v. align и Page h. align
Автор: Gazoved
Дата сообщения: 13.06.2014 00:05
rex

Цитата:
как зафиксировать на вкладке Quality опцию "DPI - Original Color - Original"?

Для того, чтобы распространить какую-либо опцию на все страницы, выставляем необходимые параметры с нажатой кнопкой CTRL
Автор: rex
Дата сообщения: 13.06.2014 11:51
VadimirTT
Gazoved
Спасибо. Из-за того, что в программе масса опций необходимой для тонкой настройки, найти описание настройки стандартных параметров оказалось достаточно сложно.

А можно все-таки вообще запретить обрезку страницы сверх размера зафиксированного пользователем на вкладке Page?
Автор: bolega
Дата сообщения: 13.06.2014 11:52
rex

Цитата:
Есть ли возможность отключить сверхобрезку таких фрагментов или хотя бы задать центрирование обрезанного фрагмента?

Рекомендую использовать режим обработки без финализации. В этом случае можно будет менять/подгонять выравнивание/размер/поля страниц без необходимости переобработки. И когда все устроит, выполнить финализацию.


Цитата:
на вкладке Quality опцию "DPI - Original Color - Original"?

На вкладке Quality нет и никогда не было такой опции. И не понятно, что нужно: dpi или color?
Автор: rex
Дата сообщения: 13.06.2014 12:43
bolega

Цитата:
И не понятно, что нужно: dpi или color?

DPI влезло случайно при копи-паст.
Нужно зафиксировать на вкладке Files Color - Original и на вкладке "Quality - don't change out color" для всех проектов, так как если в книге есть рисунки, даже черно-белые, отбеливание не желательно. Кроме того желательно зафиксировать и центрирование страниц для всех проектов.


Цитата:
Рекомендую использовать режим обработки без финализации. В этом случае можно будет менять/подгонять выравнивание/размер/поля страниц без необходимости переобработки. И когда все устроит, выполнить финализацию.


Я жму на значок черновая обработка (иконка с ножницами на Commands Toolbar), после подгонки резаков выбираю Process с включенным Do not finalize, но передвинуть обрезанный фрагмент в нужное место все равно не удается.
Кроме того, двойной просмотр требует таких затрат времени, что может оказаться быстрее обрезать страницы вручную фиксированной рамкой в обычном графическом редакторе.

Но поскольку мои цели вполне утилитарны и простого центрирования мне вполне достаточно, я попрробовал обработку с вариантом настроек подсказанных VadimirTT и Gazoved и мне этого хватило.

Хотя конечно хотелось бы иметь вариант, где при задании фиксированного размера страницы, обрезка сверх этого размера вообще не проводилась.

Автор: rex
Дата сообщения: 13.06.2014 17:13
bolega
Вознико два варианта использования программы - либо копировать папку out до финализации - тогда обрезка вполне корректна, но размеры рисунков пляшут, либо финализировать процесс и затем вручную обрезать и заменять файлы с малой площадью текста.

Вообще после довольно многочисленных и не вполне успешных попыток приспособить вашу очень интересную и чрезвычайно нужную прграмму для решения своих примитивных, но в целом вполне соответствующих названию программы задач, у меня возникла просьба включить в целевую аудиторию следующей версии и обычных пользователей.

Обычному же пользователю в 99% случаев нужно просто вырезать из отсканированных разворотов одинарные страницы одинакового размера, по возможности ничего не меняя ни в их виде ни в их качестве. Все остальное он может сделать и потом.
В качестве примера такой корректной обрезки - https://ia700508.us.archive.org/3/items/xenophon03xeno/ и https://ia600806.us.archive.org/33/items/wholeworksofxen00xeno/. Правда на этом сайте и черно-белых сканов много, но это скорее всего следсвие не отбеливания, а экономии времени при сканировании.

И обрезку простому пользователю желательно делать без ползанья по многочисленным вкладкам настроек, а просто нажать кнопочку "обрезать страницы", задать сплит и размер или дать программе самой определить размер по размеру самой большой страницы и все. Конечно просматривать черновой результат все равно придется, но здесь, как я убедился, ваша программа работает в основном корректно. Вот только с финальной обработкой страниц с малой площадью текста пока никак не получается .
Автор: trion1
Дата сообщения: 16.06.2014 07:45
bolega,
если уж про обрезку идет речь, то еще бы сделать функцию увеличить/уменьшить страницу после обрезки, подогнав ее размер под какой-то средний или указанный пользователем.
Это чаще всего нужно для книг снятых на фотоаппарат - размеры страниц существенно отличаются друг от друга. Приходится после обрезки проект частично или полностью загонять в другую программу, например, IrFanView, и уже в ней играться с масштабом. А затем назад в кромсатор - делать поля.
Автор: Varyag2014
Дата сообщения: 16.06.2014 12:36
Подскажите, пожалуйста, можно ли обойти ошибку "Out of memory" при обработке больших изображений (чертежей)?
Скан размерами: 8500X12000 не обработался, выдав ошибку, а размером 7800X11000 обработался без проблем.

Оба скана в градациях серого, 600 дпи.
Свободной оперативной памяти при обработке самого большого файла 12 Гб, ОС Win7 64.
На ХР не обработался даже второй (меньший) скан.
Автор: Gazoved
Дата сообщения: 17.06.2014 08:29
Varyag2014

bolega как-то уже писал об этом:
"СК не может использовать памяти больше гига, это ограничение компилятора...
...Здесь поможет Files->Options->Processing->optimized resampling=откл. Будет намного медленнее, но зато менее требовательно к памяти. На то, что это resampling, внимания не обращайте - это и на rotation влияет"

Какой выходной формат и разрешение ставите?
Обрабатываю иногда карты к книгам, сейчас глянул, средняя карта - 12800х9800 при 300 DPI (в Tiff (цветной) - около 500 Мб) на выходе - цветной TiFF LZW 300 DPI.
Автор: Varyag2014
Дата сообщения: 17.06.2014 10:37
Спасибо за информацию,Gazoved.
Теперь буду знать, что сканы размером более 8000Х12000 перед обработкой в СК нужно разрезать на части, а после обработки склеивать, "Files->Options->Processing->optimized resampling=откл", к сожалению, не помогло.

Автор: shch_vg
Дата сообщения: 24.06.2014 15:55
bolega
Обрабатываю бюллетень в ч/б 300дпи с пикчер-зонами в сером и в ч/б с заливкой.
Создаю дежавю по умолчанию, получаю текст/фон 300/300.
Хочу иметь 300/150.
На закладке step3 в поле Downsample ratio устанавливаю 2, запускаю выполнение третьего шага и получаю:

===========================
Step 3 start at 24.06.14 16:47
===========================
===========================

Dump structure of step2.djvu... Done.
Convert djvu to indirect format... Done.
---------------------------
Processing file 1 (Page 1)
---------------------------
Extract chunks from page 1 of step2.djvu... Done.
Merge color picture zones... Failed.
Fail saving merged file

===========================
===========================
Step 3 finished at 24.06.14 16:47
Zone merging error: Fail saving merged file
===========================
===========================
Автор: Dracula
Дата сообщения: 01.07.2014 18:01
Не подскажете, как объединить по новой зоны? У меня учебник текст и рисунки. Рисунки я выделял отдельно и решил потом обработать рисунки (улучшить качество и т.д.).
Но, я короче объединил рисунки Zones > Picture zones > Merge zones.
А только потом понял, что я не обработал рисунки-то.

Теперь как заново переобъединить зоны - я сейчас все рисунки обработал - но при нажатии на объединить (там вообще кнопка неактивна даже Zones > Picture zones > Merge zones).

Помогите - а то рисунки блёклые в первом объединении остались.

Добавлено:
Может нажать на "process marked zones for files" и затем "All" - изображения объединяться новые (обработанные) или нет?

Добавлено:
Нажимаю, но выходит такое:
"Command unavailable for current Page Type option value (Auto)".

И ничего не происходит. Помогите объединить по новой зоны.
Автор: shch_vg
Дата сообщения: 01.07.2014 19:21
Dracula
Их нужно заново обработать!
Для этого сначала нужно все зоны пометить (Zones->Picture zone->Marked zones->In all files), а затем их все обработать (Zones->Picture zone->Process marked zones for files->All).

P.S. Не забудьте предварительно сохранить обработанные Вами зоны (Вы наверняка их уже поместили в директорию out), т.к. при переобработке они будут перезаписаны.

P.P.S. Заметка на будущее: перед полным слиянием зон с текстом имеет смысл сохранить текущее состояние задания, тогда не нужно будет переобрабатывать зоны.
Автор: Dracula
Дата сообщения: 01.07.2014 19:27
shch_vg
Нажимаю что сказали - ничего не объединяется.

Добавлено:
shch_vg

Цитата:
Нажимаю, но выходит такое опять:
Error "Command unavailable for current Page Type option value (Auto)".



Добавлено:
shch_vg
Не работает говорю же. Подскажи что делать?
Автор: shch_vg
Дата сообщения: 01.07.2014 23:50
Dracula
Что делать, я уже написал выше.
Что Вы нажимаете, я видеть не могу, единственное, что могу добавить, это то, что после указанных мной действий никакого объединения не должно происходить.
Просто зоны обработаются заново, в задании они не будут привязаны к своим страницам, и при желании их можно будет заменить на обработанные Вами, после чего объединить с текстом.
К вышесказанному добавить ничего не могу.
Если Вы так и не поняли, что надо делать, выберите в Вашем задании ОДНУ страницу, на которой есть хотя бы одна зона, затем создайте sub-task на нее (File->Create sub-task...->OK), затем заархивируйте получившуюся директорию task и выложите ее на какой-нибудь обменник.
Автор: Dracula
Дата сообщения: 02.07.2014 00:46
shch_vg
Да, честно говоря не понял как это заменить обработанные мной, если они уже объединились (к примеру текст и 1 картинка на странице уже внедрена).
Вот залил 1 разворот книги - сорри за размер 13,7 мб (заархивировал, изначально было вообще 25 мб - цветная страницы tiff как Вы знаете столько занимает при сканировании).
http://rghost.ru/private/56682864/82bb2c630d827cda1914e8cf480a7195

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.