Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: monday2000
Дата сообщения: 07.04.2011 14:02
alpopo

Цитата:
Сортировка была нужна для поиска грубых отклонений от истины при определении Полезной зоны

Так она что, где-то уже реализована?

Добавлено:
Посмотрел я Scan Tailor Plus, и попробовал там увеличение жирности при бинаризации до 50-ти. На 50-ти получилось интересно.

Единственно, я подумал, что всё же, пожалуй, нельзя ограничиваться одним лишь только методом бинаризации (Otsu). Иногда попадаются такие сканы, где мне больше нравится Букресторерная бинаризация для них - нежели чем скантейлорная даже на 50-ти.

Это я к тому, что если и когда кто-нибудь будет встраивать вывод разделённых сканов в СТ, то одновременно имеет смысл всё же предусмотреть вывод передних субсканов в режиме серого (цветного) - чтобы оставить юзеру свободу бинаризовывать их в сторонней программе.

Tulon, ясное дело, вольно или невольно, хотел бы "замкнуть" весь процесс на СТ. Если бы так было можно - да ради бога, но лучше всё-таки встроить вывод разделённых сканов прямо в СТ - чтобы дать юзеру побольше свободы для пост-обработки разделённых сканов.

И ещё я вношу такую идею на обсуждение - в режиме "Цветной\Серый" предусмотреть опцию "Заливка полей усреднённым цветом фона" - а не только белым. Это нужно, чтобы потом BR не сбивался с толку белыми полями - при выравнивании освещённости. В то же время заливка полей нужна, так как при этом стирается львиная доля грязи со скана.
Автор: StanFreeWare
Дата сообщения: 07.04.2011 14:21

Цитата:
Так она что, где-то уже реализована?

Давно уже. На этапе Полезная область и Поля - раскрывающийся список под полосой предпросмотра.
Автор: amosopher
Дата сообщения: 07.04.2011 16:55
Мне кажется, или Cli-версия действительно работает побыстрее предыдущих версий?
Автор: alpopo
Дата сообщения: 08.04.2011 11:24
DikBSD В план. Замечание. Нельзя ли при загрузке изображений в СТ, если он их не берет, указывать не только возможность выбора "особый формат" (300-600дпи), но и формат исходных изображений по выделенным группам. Чтобы сообразить, что прописать в "Особом формате"
Автор: denver 22
Дата сообщения: 08.04.2011 15:45
В опрос к тем, кто использует dewarping в последних версиях. Авторежим уже работоспособен? Какие есть недостатки?
Автор: DikBSD
Дата сообщения: 08.04.2011 16:03

Цитата:
DikBSD В план. Замечание. Нельзя ли при загрузке изображений в СТ, если он их не берет, указывать не только возможность выбора "особый формат" (300-600дпи), но и формат исходных изображений по выделенным группам. Чтобы сообразить, что прописать в "Особом формате"

Хорошо, я занес в TODO

Добавлено:

Цитата:
Я ещё Тулону предлагал одну рюшечку сделать удобную, но он сказал, что ему некогда:

Под каждой миниатюрой скана сделать махонькую иконку или цветное пятнышко, обозначающее тот режим вывода (1 из 3), в котором находится данный скан сейчас.

Иногда бывает так, что скан находится в режиме "Смешанный" - а этого на ленте миниатюр никак не видно, и какие-то кусочки этого скана из-за этого несанкционированно попадают в авто-зоны иллюстраций.

Я занес в TODO

Добавлено:

Цитата:
А сортировка по режиму вывода - тоже неплохо.

А это уже завно есть в TODO
Вообще-то, хорошо бы было бы сдделать сортировку на всех этапах обработки по всепх (нужным) настройкам - поля (по расположению), вывод (порог бинаризации, режим вывода) и т.д.
Автор: VidelSamogO
Дата сообщения: 08.04.2011 17:44
StanFreeWare
Я слышал, у вас есть планы перевести вши утилиты на более доступную платформу? А то у меня например места не хратает для всех этих framework'ов.
Автор: StanFreeWare
Дата сообщения: 08.04.2011 18:05
VidelSamogO
Планы были у DikBSD. Я максимум что могу - понизить требования до NET 2.0... Кстати, дошли руки почитать про клеточные автоматы. Скорее всего скоро будут новые версии сепаратора и аутлайнера с его использованием.
Автор: VidelSamogO
Дата сообщения: 08.04.2011 18:13
Поздравляю Тулона. АВТОдеворпинг вышел на уровень букресторера. Ну или почти вышел.




Оригинал Букресторер Скантэйлор
Автор: DikBSD
Дата сообщения: 09.04.2011 20:01
В первом абзаце выравнивание строк у Tulon`а даже лучше, чем в БукРесторере, на мой взгляд.
Автор: StanFreeWare
Дата сообщения: 10.04.2011 15:30
Выпустил версии ST Separator 3.0 и ST Outliner 0.3 на клеточных автоматах.
Оптимизированием еще не занимался - памяти кушают немало. И есть некоторое подозрение, что для выделения отдельных символов и анализа их границ есть алгоритмы и поаккуратнее )

Пример закраски фона без и с удалением мусора.

Кому интересно - для раскраски маски используется hsv-диапазон полученной из буфера обмена области +- 5% диапазона для H, и +-10% диапазона для SV - частей.

В принципе, кодировать с размещением фона в bg можно и сканы из папки-до. Фон сканов из папки-после можно и в fg засунуть. Пара светлых символов на черном фоне закрасилась не в свой цвет, но и исходный скан был не супер качества.
Автор: alpopo
Дата сообщения: 13.04.2011 06:58
DikBSD В план. Замечание. Нельзя ли на этапе Полезная область подсвечивать пунктиром максимальную полезную область. Иногда при корректировке Полезных областей не хочется выйти за некоторые рамки. Например выделил Полезную зону самой информативной страницы (максимальную), а затем хочу увеличить "обзор" на неинформативных листах, но не выходя за пределы максимального
Автор: C0USIN
Дата сообщения: 13.04.2011 08:39
alpopo
Зачем увеличивать? Чтобы мусора на страницах стало больше?
И где рисовать этот пунктир? Размеры сканов же могут быть разными.
Автор: alpopo
Дата сообщения: 13.04.2011 11:00
C0USIN
Цитата:
где рисовать этот пунктир
Примерно как на этапе Поля. Тут попалась книжка с иллюстрациями (картинки с левого боку, которые были больше текста). Выбрал полезную область с максимальным текстом и остальные страницы с картинками подровнял под эту зону, потому что что иначе картинки на страницах с малым текстом обрежутся. Хотелось бы видеть зону до которой можно полезную зону увеличить на страницах с малым текстом
Автор: slava_kry
Дата сообщения: 14.04.2011 17:15
МОжно ли полезную область перемещать как прямоугольник, а не корректировать перетаскивая границы области?
А то ~1000 страниц с одним размером полезной области, но смещением относительно друг друга.
Просто, можно или нет?
Автор: ycheff
Дата сообщения: 14.04.2011 18:11

Цитата:
~1000 страниц с одним размером полезной области, но смещением относительно друг друга.

Что Вы считаете смещением? Если оно не входит в полезную область, оно исчезнет.
В выходном скане будет полезная область плюс заданные поля (которые можно менять или, если надо, убрать вовсе).
Автор: slava_kry
Дата сообщения: 14.04.2011 18:22
ycheff
Страницы сдвинуты относительно друг друга, а размер полезной площади на странице одинаков. Я попытался один раз определить блок полезной области, а на остальных страницах просто его смешать в нужное мне место... оказалось "фигвам", приходится на каждой странице поправлять границы, что утомляет.
Надеюсь высказался внятно
Автор: ycheff
Дата сообщения: 14.04.2011 19:31
Таскать полезную область нельзя.
Я обычно пользуюсь упорядочиванием страниц по высоте (а потом по ширине).
Тогда править надо лишь сколько-то последних и сколько-то первых - обычно это существенно экономит время.
То же самое использую при установке полей - где-то наращиваю, где-то сокращаю.
Автор: slava_kry
Дата сообщения: 14.04.2011 19:52
ycheff
Понял, спасибо, жаль
В данном случае выравнивание не поможет
Автор: arsvrn
Дата сообщения: 14.04.2011 20:01
slava_kry
Просьба о возможности перетаскивания полезной области уже была тут. Почему-то Tulon не захотел ее реализовывать.
Автор: LazyKent
Дата сообщения: 14.04.2011 20:43
По-моему, кто-то из разработчиков делал такую опцию.
Автор: C0USIN
Дата сообщения: 15.04.2011 15:53
alpopo

Цитата:
Тут попалась книжка с иллюстрациями (картинки с левого боку, которые были больше текста).

Так там надо было не полезную область увеличивать на страницах без иллюстраций, а уменьшать левое поле на этапе макета для страниц с картинками. И все. Выделить такие страницы и один раз поправить одну циферку гораздо легче чем руками править полезную область на многих страницах.
Автор: iit512
Дата сообщения: 19.04.2011 20:29
Обрабатывал книгу с фотографиями, прилегающими к краю страницы, без полей.
Это просто какой-то ужас! СТ (1) засвечивает края (http://www.djvu-scan.ru/forum/index.php?topic=293.0), (2) вылетает на каждой второй странице, (3) не сохраняет результатов (а сколько не нажимай Ctrl-S, где-нибудь да забудешь), (4) каждый раз выделяет совсем другие автозоны. Приходилось на каждой засвеченной странице идти в GIMP, отрезать часть края, заливать ближайшим к фону серым, сохранять, идти в СТ обратно, менять границы полезной области, идти в вывод и молиться, чтобы СТ не вылетел или не стал выделять новые автозоны. К тому же, поскольку идет работа на краях страницы, всегда есть опасность, что после редактирования станица внезапно станет наибольшей, и все уже с таким трудом полученные результаты заменятся на знаки вопроса...
Пожалуйста, очень прошу, умоляю:
1) Автосохранение, особенно на этапе вывода и особенно при смешанном режиме
2) Маленькую галочку в смешанном режиме: "Не выравнивать освещение" (ведь есть такая галочка в цветном, почему нельзя здесь?!)
СТ ведь предназначается, по идее, для полуавтоматической обработки сканов? Так вот, получается, что обработка в СТ хуже ручной -- мало того, что надо каждую страницу обработать в графическом редакторе, так еще и результат каждой последующей обработки в СТ практически непредсказуем! Некоторые страницы приходилось обрабатывать по 5-7 раз!
(Прошу прощения за восклицательные знаки -- наболело).
Автор: DikBSD
Дата сообщения: 19.04.2011 21:11
Я сейчас работаю над автосохранением... Насчет галочки "Не выравнивать освещение" - в планах есть . но там - масса сложностей. Так что делать буду долго (сам страдаю из-за отсутсвия этой опции, поэтому буду копать...)

Добавлено:
И еще - у вас вылетает скан тэйлор на какой системе - Виндовс или Линукс? У меня ни разу такого не было - воспроизвести бы. Вы не могли бы прислать мне ваш проект и сканы, на которых вылетает программа с подробным орписанием что вы делали и когда и где вылет.
Tulon по-моему хорошо отладил эту проблему вылета. Но вполне возможно что-то не было учтено... Буду ждать ваши сканы и пороект к нему...

Добавлено:
Новая версия Scan Tailor Plus 1.0beta10
1. Влит последний код из ветки master :
added short description for --layout option master
Add scantailor-batch.exe to the Windows installer.
Fix scantailor-batch being a GUI instead of a CLI appli..
Fix a crash on despeckling.
2. В диалоге Настройки появилась вкладка Вывод. Сделана возможность задавать значения по-умолчанию для
1) Нижнего и Верхнего Уровеня Порога бинаризации,
2) Порога бинаризации,
3) Степени очистки пятен.
Нижний (-) и Верхний (+) Уровень Порога бинаризации задается от 15 до 99. По-умолчанию задано 50. На некоторых книгах мне и -50 было мало. Теперь можно задавать границы Порога более "демократично". Только Нижняя граница всепгда будет равна Верхней (по модулю) - так проще.

Контроллы использованы, как и на этапе Вывод сканов - так интуитивнее.
Ссылка для скачивания: http://narod.ru/disk/10630100001/ScanTailorPlus-1.0beta10.rar.html

В ближайшее время буду заниматься автосохранением и Настройками Полей по-умолчанию
Автор: iit512
Дата сообщения: 20.04.2011 11:18
Спасибо за ответ.
Вылетает на Ubuntu 10.04, ST 1.0beta10, собран из git. Вылеты часто воспроизводимы, но иногда -- нет. Вылетает обычно на сложных зонах и большеформатных книгах. Цели сохранять такое не стояло, вспомню -- сохраню.
А как собрать под Linux Scan Tailor Plus? Я вот так скачиваю сейчас: "git clone git://scantailor.git.sourceforge.net/gitroot/scantailor/scantailor". А как скачивают ветку Plus?
Автор: DikBSD
Дата сообщения: 20.04.2011 14:07
В удаленном git репозитории есть ветка plus.
У себя в локальном склонированном git репозитории создайте 2 бранча plus и plus_build.
Когда вы переключаетесь на какую-нибудь ветку у себя в локальном репозитории и выполняете git pull - то git автоматически скачивает именно эту ветку из удаленного репозитория, конечно, если она там есть. Т.е. можно не указывать название ветки при git pull.

Переключитесь на ветку master: git checkout master и сделайте sudo git pull. Потом переключитесь на созданную у себя ветку plus: master git checkout master и выполните git pull. Теперь переключитесь на ветку plus_build: git checkout plus_build и выполните слияние веток master и plus в ветку plus_build строго в такой последовательности: git merge master и только потом - git merge plus.
В процессе слияния веток может возникнуть конфликт - при изменении кода в указанных гитом файлах приоритет отдавайте коду из ветки plus!!!! Но, возможно конфликта кода и не будет.

Скоро хочу открыть форк ST Plus и заливать туда уже слитый воедино код из веток master и plus - чтобы люди не мучались, а просто клонировали или push оттуда. Когда сделаю форк - напишу.

И еще - пожалуйста, когда будет у вас снова вылет - пришлите мне сканы и файл проекта - мне надо погонять программу!!!
Автор: iit512
Дата сообщения: 20.04.2011 17:43
Спасибо! А можно, для дураков -- полную последовательность команд? А то я не очень хорошо понимаю git (я обычно работал в SVN), и боюсь запутаться.
Будут вылеты -- пришлю сканы.
Автор: DikBSD
Дата сообщения: 20.04.2011 20:14

Цитата:
Будут вылеты -- пришлю сканы.

И файл проекта тоже.

Получение кода STPlus:
1. Если нет локального репозитория на жестком диске, то клонируем удаленный так:
git clone git://scantailor.git.sourceforge.net/gitroot/scantailor/scantailor
2. Создаем в своем лок. репозитории ветку plus, связанную с одноименной веткой на удаленном git:
git checkout --track -b plus origin/plus
3. Создаем у себя ветку plus_build:
git checkout -b 'plus_build'
4. Переключаемся на ветку master:
git checkout master
5. Скачиваем код из этой ветки из удаленного репозитория:
git pull
6. Переключаемся на ветку plus:
git checkout plus
7. Скачиваем код из этой ветки из удаленного репозитория:
git pull
8. Переключаемся на ветку plus_build:
git checkout plus_build
9. Сливаем в эту ветку plus_build код из ветки master:
git merge master
10. Сливаем в эту ветку plus_build код из ветки plus:
git merge plus
11.Мы остаемся в ветке plus_build Теперь можно компилировать код.

В дальнейшем при обновлении кода надо просто повторить шаги 4-11

git branch выводит список веток в локальном репозитории

Итак:
Ветка master содержит официальный код ST
Вестка plus - фичи и различные доработки программы, которые не будут включены в основной код ST
Ветка plus_build - ветка, где объединяется код двух описанных веток. Именно этот объединенный код и компилируем.

Если при слиянии веток будет конфликт кода (в консоли об этом будет сообщение с указанием конкретных файлов), то откорректируйте код, найдя там символы. типа >>>>>>> head ... строки кода ... ===== строки кода <<<<<<< plus Надо удалить строки от >>>>> до ======== включительно.
Автор: Salvatorul
Дата сообщения: 20.04.2011 21:25

Цитата:
git branch master


Может git checkout master?
Автор: DikBSD
Дата сообщения: 20.04.2011 21:39
Да, вы правы - спутал с просмотром веток. Сейчас исправлю в предыдущем сообщении

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.