Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: StanFreeWare
Дата сообщения: 18.03.2010 20:47

Цитата:
откуда такой вывод

Имелось в виду если копировать автоматически определенную СТ полезную область. В таком случае малейший сдвиг страницы, на которую производится копирование, чреват обрезанием кусков букв.
Однако вы, видимо, имели в виду копирование вручную созданной зоны, в которой собираетесь заложить запас против такого обрезания. Тогда мое утверждение неверно, и из отрицательных эффектов остается только необходимость выравнивания каждой страницы на этапе "Макет страницы" (ну и все те опасности, о которых выше говорил Tulon - но в меньшей степени чем для предлагаемого мною ранее режима "рамка во всю страницу")
В принципе, вполне может хватить кнопки "Применить к.." на этапе Полезная область.
Все-таки проект "режима с фиксированной рамкой контента", описанный на сайте черезчур сложный, на мой взгляд.
Автор: StanFreeWare
Дата сообщения: 18.03.2010 23:12
Tulon
Скажите, содержимое зон в смешанном режиме соответствуют выводу в цветном/сером с установленной или снятой галочкой "Выровнять освещение"?
Я к тому, чтобы потом проводить групповую коррекцию яркости/контрастности над максимально одинаковыми субсканами иллюстраций.
Автор: Tulon
Дата сообщения: 19.03.2010 00:37
iit512

Цитата:
Чтобы сэкономить время, я, пока идет вывод, обрабатываю первые страницы, а ST портит результат, переписывая первую страницу поверх обработанной.

Наделять первую страницу особыми свойствами я не хочу, но можно наверное по окончании пакетной обработки не переходить на первую страницу, а оставаться на последней. Возражения будут?


Цитата:
И очень хочется расширить диапазон бинаризации.

Планирую сделать -30 .. +30, но если кто предоставит пример, где нужен больший диапазон - может еще больше сделаю.

Olive77

Цитата:
у меня почему-то при загрузке файлов их иконки полностью черные, до тех пор пока не пройду последнего этапа.

Не воспроизвелось. С одним файлом в проекте у вас воспроизводится?


Цитата:
Отработка выбора полезной области очень не надежна.
Часто ошибается, если внизу страницы график, номер страницы в цветном прямоугольнике, название главы и т.д. сверху крупными буквами.

Бывает конечно. Тем не менее в ближайшие месяцы я этим заниматься не буду. Приоритетом после выпуска 0.9.8 станет нормально работающий dewarping.


Цитата:
Что мешает дать возможность скопировать границы полезной области с одной страницы на другие?

То, что положение рамки на каждой странице ощутимо гуляет. Даже на специализированных сканерах для книг положение будет гулять по горизонтали, из-за изменения толщины корешка справа / слева по мере листания. На обычных сканерах вообще труба с этим.

StanFreeWare

Цитата:
При масштабировании до 600dpi 300dpi-скана высотой, скажем, 1999pix можем в СТ получить результат высотой 3999 пикселей.
Это усложняет кодирование оптимальной вариацией метода разделённых сканов - "текст в 600 dpi, иллюстрации в разрешении сканирования", т.к. csepdjvu считает, что 300dpi-скан должен в таком случае иметь высоту 2000pix:

Я подумаю, что с этим можно сделать, но уже после релиза 0.9.8.


Цитата:
В принципе, вполне может хватить кнопки "Применить к.." на этапе Полезная область.
Все-таки проект "режима с фиксированной рамкой контента", описанный на сайте черезчур сложный, на мой взгляд.

Я вижу решение проблемы в улучшении соответствующего алгоритма, а не во введении костылей. Это для книг. Для журналов костыль все же понадобится.

Mandor Sawall

Цитата:
1. Если меняю режим деспекля, после обработки знак вопроса остаеться на страницу в превю-бар (только если активна закладка „Despecling“).

Хороший вопрос. Задается впервые, но явный кандидат в FAQ.
На вкладке Despeckling сделан упор на скорость отклика. Кому понравится, если после смены уровня деспеклинга, результата придется ждать 20 секунд, Попробуйте сравнить - смените уровень на вкладке Output, а потом на вкладке Despeckling. Ради производительности было принято решение не писать результат на диск, когда изменяете уровень из вкладки Despeckling. Есть еще одна причина - в будущем на этой вкладке могут появится ручные инструменты для коррекции деспеклинга. В этом случае будет вообще не понятно, в какой момент пересчитывать деспеклинг и писать результат на диск. Разумным будет только один вариант - делать это в момент переключения на другую вкладку. Это как раз то, что делается сейчас.
Предгагаются два режима работы:
1. Делаете вывод в пакетном режиме -> переключаетесь на вкладку Despeckling -> проходите все страницы вручную, переключая уровень где надо -> прогоняете пакетную обработку второй раз (второй прогон будет гораздо быстрее первого).
2. Каждый раз, когда меняете уровень деспеклинга, переключаетесь во вкладку Output для записи результата на диск. В будущем возможно сделаю более очевидный способ сохранения.


Цитата:
2. Если на странице нет контента, на превю-бар вообще не отображаеться последний етап – знак вопроса стоит.

Должен исчезать после обработки данной страницы.


Цитата:
3. Если на странице нет контента, на превю-бар выводиться только нижная половина странице. Думаю, что понимаю почему ето так, но все-таки неприятно смотриться. Два раза етот (д)ефект появился на все страницы в превю, хотя тогда изчезала нижная 1/4 странице, а верхные 3/4 показывались нормально (только на превю; страницы были обработаны нормально), но так и не сумел воспроизвести.

Это из-за того, что выравнивание по умолчанию идет по верхней границе. Чисто эстетическое неудобство на самом деле. Не хочу на данном этапе об этом беспокоиться.


Цитата:
Болгарский перевод – да, если автор забросит ето, я возмусь. Пожалуйста, сообщите когда есть информация об етом.

Автор перевода пока не ответил. Подписывайтесь на список рассылки - я там в ближайшие дни сообщу о статусе каждого перевода. Их на данный момент всего три, причем русский я делаю сам, но мне все равно удобнее писать в список рассылки, чем каждому в отдельности.


Цитата:
Да, и еще – если добавить новой файл в проект через „Insert after“ после етапа „2. Split pages“ (для двойной скан), новой файл появляеться между левого и правого разворота, а не после правого разворота.

Это особенность архитектуры. Две половинки одной страницы являются неделимым целым. Например удаление половинки реализовано как изменение режима на "страница с огрызком" и установка соответствующей ручной зоны.

Dashout

Цитата:
в настоящее время, операция ориентации страниц в СТ настроена на горизонталь текстовой строки.
не понятно, что лучше, по вертикали, по горизонтали если страница искривлена (угол не прямой).
по логике, нужно измерять диагональ (по обеим позициям) и если есть расхождение - приводить изображение к прямоугольному (исправлять призму).
можно ли это учесть?

Я не знаю ни одного алгоритма deskew, выравнивающего по вертикали. Это потому, что по вертикали мало информации, за которую можно зацепиться. А вообще, устрание призмовидных искажений - задача dewarp'а.


Добавлено:
StanFreeWare

Цитата:
Скажите, содержимое зон в смешанном режиме соответствуют выводу в цветном/сером с установленной или снятой галочкой "Выровнять освещение"?
Я к тому, чтобы потом проводить групповую коррекцию яркости/контрастности над максимально одинаковыми субсканами иллюстраций.

Соответствует - с установленной.
Автор: iit512
Дата сообщения: 19.03.2010 01:55

Цитата:
но можно наверное по окончании пакетной обработки не переходить на первую страницу, а оставаться на последней.

Это именно то, что нужно!

Цитата:
Планирую сделать -30 .. +30

Ура! Спасибо!
Автор: StanFreeWare
Дата сообщения: 19.03.2010 05:51

Цитата:
по окончании пакетной обработки не переходить на первую страницу

А по-моему архинеудобно получится. Такое вообще нужно (ли?) только на этапе вывода.
Я, например, предпочитаю оставлять Out в неизменном после СТ виде, а всю необходимую обработку производить в отдельных папках. Причем над разделенными субсканами и пакетно. Сейчас это стало делать просто как никогда.

Цитата:
Планирую сделать -30 .. +30, но если кто предоставит пример, где нужен больший диапазон

По-моему это физически невозможно без версии +-30
Автор: Mandor Sawall
Дата сообщения: 19.03.2010 09:31
Tulon

Цитата:
Разумным будет только один вариант - делать это в момент переключения на другую вкладку. Это как раз то, что делается сейчас.
Понял. Согласен о том, что будет лучше, если не делаеться запис при смени режима, но не понял почему нельзя записать страницу, когда переходим к другой странице.

Цитата:

Цитата: 2. Если на странице нет контента, на превю-бар вообще не отображаеться последний етап – знак вопроса стоит.
Должен исчезать после обработки данной страницы.
Автор: StanFreeWare
Дата сообщения: 20.03.2010 08:34
Tulon
Для некоторых страниц с оглавлением средний веник оказался черезчур мощным. Может, по-умолчанию лучше оставить минимальный маленький веник?
Автор: Tulon
Дата сообщения: 20.03.2010 13:09
Mandor Sawall

Цитата:
Понял. Согласен о том, что будет лучше, если не делаеться запис при смени режима, но не понял почему нельзя записать страницу, когда переходим к другой странице.

Потому что это неоптимально при таком сценарии:
1. Пакетный вывод.
2. Переключаемся на вкладку Despeckle и вручную пролистываем все страницы, меняя уровень деспеклинга где надо.
3. Прогоняем пакетную обработку еще раз.
При таком сценарии вы хотите завершить шаг 2 как можно быстрее, и лишних полторы секунды для записи каждой страницы вам совершенно не к чему.


Цитата:
Не изчезает – не смотря на активной вкладке – Output или Despeckling.

Будет это воспроизводится на проекте из одного-двух файлов? Если да, выкладывайте их сюда.


Цитата:
И я так думал – что они неделими, поетому и спросил почему новой файл появляеться посередине – после левого и перед правого разворота; т.е. „разрывает“ двойную страницу.
В общем, ето не важно. Сойдет и так.

Надо полагать что после перехода на другую стадию а потом обратно, вновь вставленная страница таки переместится либо после обоих половинок, либо перед. Если так, то это мелкая недоработка. Будет время / желание - поправлю. Если нет - значит я чего-то не понимаю.

Добавлено:
StanFreeWare

Цитата:
Для некоторых страниц с оглавлением средний веник оказался черезчур мощным. Может, по-умолчанию лучше оставить минимальный маленький веник?

Да, далековато там точки расположены и от букв и от номеров страниц. Попробую придать еще больший вес близости по горизонтали. А в принципе не имею ничего против слабого веника по умолчанию.
Автор: Tulon
Дата сообщения: 21.03.2010 01:05
Еще одна сборка: http://www.onlinedisk.ru/file/384781/

Расширил диапазон порога бинаризации и подкрутил параметры для авто выбора того или иного алгоритма выравнивания освещения.
Автор: StanFreeWare
Дата сообщения: 21.03.2010 09:52
Tulon
А что это за алгоритмы и в каких случаях должен применяться тот или иной алгоритм? А то непонятно, на что обращать внимание..

Предлагаю для режима цветной/серый не делать по умолчанию апскейл dpi, а оставлять его в родном разрешении скана. Столкнулся с книгами, в которых 90% объема занимали именно обложки после апскейла по умолчанию...
Автор: VadimirTT
Дата сообщения: 21.03.2010 10:06
StanFreeWare
Так обложки можно будет отдельно переделать, а вот отказ от повышения разрешения для серых сканов заметно скажется на качестве, даже более того, во многом утратится весь смысл применения программы (имхо).
Автор: StanFreeWare
Дата сообщения: 21.03.2010 10:51
VadimirTT
Насколько мне известно - повышение разрешения суть необходимость сохранения информации при бинаризации (см. Теорема Котельникова). Нет бинаризации - нет смысла в увеличении разрешения.
Автор: VadimirTT
Дата сообщения: 21.03.2010 11:33
StanFreeWare
А разве не все (почти) книги бинаризируются?
Кстати, не могли бы Вы закончено сформулировать про бинаризацию и теорему Котельникова, чтобы "научно" разъяснять о необходимости сканировать в полутонах ч/б книжки.
Автор: StanFreeWare
Дата сообщения: 21.03.2010 11:47
VadimirTT
Цитирую самого же себя:

Цитата:
Предлагаю для режима цветной/серый

Т.е. для страниц, выводимых в режиме без бинаризации.
Научно - сходу не смогу. Пока что это не более чем ассоциация на интуитивном уровне...
Автор: Tulon
Дата сообщения: 21.03.2010 13:41
StanFreeWare

Цитата:
А что это за алгоритмы и в каких случаях должен применяться тот или иной алгоритм? А то непонятно, на что обращать внимание..

Чуть выше я писал об этом.


Цитата:
Предлагаю для режима цветной/серый не делать по умолчанию апскейл dpi, а оставлять его в родном разрешении скана. Столкнулся с книгами, в которых 90% объема занимали именно обложки после апскейла по умолчанию...

Не нравится мне эта идея. Поведение программы должно быть как можно более однородным, так чтобы у пользователей не возникало лишних вопросов. Хотите понизить DPI вывода для страниц без текста? Нет проблем - "Применить к выбранным" вам в помощь.
Автор: StanFreeWare
Дата сообщения: 21.03.2010 14:28
Пример невоспринимаемого ST скана. FastStone говорит, что 16 бит на цвет.
Автор: U235
Дата сообщения: 21.03.2010 15:28
StanFreeWare

Цитата:
FastStone говорит, что 16 бит на цвет

Да, 16 битный серый, хотя вполне хватило бы и обычных 8-ми (это же скан ч/б книги, а не фото или слайд).
ИМХО, проще сконвертировать данный скан в 8 бит, чем вводить поддержку в ST 16 битности.

Цитата:
необходимость сохранения информации при бинаризации (см. Теорема Котельникова

Теорема Котельникова тут ни при чем. Хотя бы потому, что идеальный (векторный) скан как сигнал имеет ограниченную амплитуду и неограниченный спектр.
Автор: StanFreeWare
Дата сообщения: 21.03.2010 16:29
U235
Сделали проще - нашли и поправили соответствующие настройки сканера.
Если не вностить поддержку 16разрядного цвета в СТ, то можно просто прописать об этом в "Советах по сканированию".

Цитата:
Теорема Котельникова тут ни при чем.

Похоже, вы правы. Тем более, что в данном случае мы говорим не о квантовании векторного (аналогового) скана, а о максимальном сохранении информации при понижении степени квантования с 256 до 2х уровней.
Автор: Mandor Sawall
Дата сообщения: 22.03.2010 09:20
Tulon

Цитата:

Цитата: Не изчезает – не смотря на активной вкладке – Output или Despeckling.
Будет это воспроизводится на проекте из одного-двух файлов? Если да, выкладывайте их сюда.
Автор: Salvatorul
Дата сообщения: 22.03.2010 18:19
Tulon
А можно выложить последний пре-релиз в виде исходников?
Автор: StanFreeWare
Дата сообщения: 22.03.2010 23:37
Попалась книжка, где выравнивание полезной области осуществляется по правому и левому краю на четных и нечетных страницах. Можно ли добавить соответствующую область применения к панели Выравнивание этапа Макет страницы?
Автор: Tulon
Дата сообщения: 22.03.2010 23:41
Salvatorul

Цитата:
А можно выложить последний пре-релиз в виде исходников?

Возьмите из Git. Веб интерфейс к Git даже позволяет скачать снапшот в виде .tar.gz.
Автор: StanFreeWare
Дата сообщения: 22.03.2010 23:45
Предлагаю по умолчанию установить галки Белые поля и Выравнивать освещение для режима Цветной/Серый. Раз этот режим максимально соответствует режиму смешанный...

Добавлено:
!! Похоже, для режима Цветной/Серый обрезание динамического диапазона (для метода U235) выключено. Imho, нужно включить. Это дает возможность в последующем пакетно обрабатывать одними алгоритмами как полностраничные, так и перемежаемые текстом иллюстрации. В том числе пакетно кодировать обложки вместе с иллюстрациями с помощью FSD или Djvu Imager не используя DEE.
Автор: iit512
Дата сообщения: 23.03.2010 08:59
Протестировал последнюю сборку. Все работает хорошо, спасибо! Деспекл (даже самый маленький порой) иногда стирает точки, но гораздо реже, чем раньше.
Автор: domo22
Дата сообщения: 23.03.2010 15:16
Можно ли как-то подправить программу, чтоб она поменьше ошибалась при:

- повороте страниц



- определении полезной области (справа на миниатюрах видно, что на многих страницах)



- очистке и конечной бинаризации, чтоб не рвала буквы "а", "я", "в"



Ну и, конечно, хотелось бы иметь возможность явно (поставить галочку) или неявно (передвинув ползунок в ноль или типа этого) пропускать любые этапы, чтобы пользователь был главным в определении того, что обрабатывать, что - нет.
Автор: StanFreeWare
Дата сообщения: 23.03.2010 16:11
domo22
По поводу бинаризации - постарайтесь использовать более качественные источники. Подобный вид обычно имеет экспорт из сделанных Finereader'ом pdfов, либо JPEG-сканы.
Ну, еще можете попробовать передвинуть ползунок до 30й жирности. Может помочь до некоторой степени.



Автор: Dashout
Дата сообщения: 23.03.2010 17:37
StanFreeWare

Цитата:
постарайтесь использовать более качественные источники

совет достаточно условен...
Автор: StanFreeWare
Дата сообщения: 23.03.2010 17:45
Dashout
Совет, как совет. Там и на сером рисунке перемычек почти не видно. Могу конкретнее - официальные рекомендации по сканированию...
Автор: domo22
Дата сообщения: 23.03.2010 17:51
StanFreeWare

Цитата:
можете попробовать передвинуть ползунок до 30й жирности

Никакое сдвигание ползунков не помогает, опробовано еще прежде чем постить. Скан 300 dpi 256-серого, перемычки везде видны. Это типичная проблема для СТ (разрыв буквы "а", "в" и некоторых других), в связи с чем и пишу сюда. Пока пользуюсь PaintShop, а СТ - доводит поля до ровности и красоты. Так что хотелось бы вручную отключать все, что можно, и включать все, что можно, а буквы не рвать или рвать лишь изредка.
Автор: StanFreeWare
Дата сообщения: 24.03.2010 06:02
Tulon
Была бы очень удобна и в тему аккуратная кнопочка >0< (или Х) рядом с полем значения угла наклона. В FastStone, кстати, такая появляется только при ненулевых значениях регулируемого параметра.

Добавьте, пожалуйста в статусную строку подсказку о том, что нажатие Ctrl увеличивает шаг вращения с колесика. Такая удобная фича, а нигде не была документирована. Внес в wiki.

А еще лучше - сделать так, чтобы для вращения с Ctrl не нужно было щелкать по текстовому полю. Насколько я понимаю, шаг в 0.1 градус ведет для книги высотой 20 см к вполне допустимому для большинства применений отклонению всего лишь на 0.35мм. А существующий механизм оставить для возможности задания предельной точности 0.01 градус.

domo22
Вы бы все-таки выложили образец скана. Может быть, это как раз случай, для которого верхний порог бинаризации требуется поднять, скажем, до 50...

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.