Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: anagnost96
Дата сообщения: 07.02.2010 08:09
StanFreeWare

Это довольно очевидная идея. Собственно, это было первое, что я попробовал, прежде, чем заняться модификацией СТ. Проблема в том, что на картинках черные пиксели всё-таки попадаются. После разделения по этому методу у меня на многих текстовых страницах получалась как бы черная вуаль на месте картинок.
Автор: StanFreeWare
Дата сообщения: 07.02.2010 08:11
anagnost96
А чуть подсерять (на 1 шаг) черные пикселы в сканах перед обработкой в СТ пробовали?
В принципе можно модифицировать корректор до возможности задания пользователем произвольной яркости максимально темных пикселов обработанных сканов.

Недостатки методики понятны и даже документированы. Интересуют границы применимости.

Добавлено:
U235 справдливо заметил, что программу "Корректор" вполне можно заменить групповым увеличением яркости (должно хватить даже 1 шага).
Поправил "Сепаратор", теперь он разбивает и 8-битные индексированные тифки.
Separator 0.5

Интересно, что смешанный индексированный файл превращается в файл без текстовой части всего одной строкой: sourceOut.Palette.Entries[0] = Color.White;

Кроме того, в топике Сканирование и обработка есть варианты Сепаратора от U235. Они консольные и не требуют .NET. Если методика попрёт (а я лично не вижу особых причин против этого), то, думаю и GUI-версии от U235 не за горами.

Кстати, только что еще раз проверил методику на своих сканах. Все работает замечательно! Кстати на моих сканах максимально темный цвет картинки был в районе RGB=[40,40,40], так что никакой предварительной корректировки не потребовалось.

Добавлено:
Попробовал увеличивать яркость с помощью FS ImageViewer.
Вердикт такой: можно, но есть нюансы.
1) Из-за того, что корректируется яркость всех пикселей, а не только самых темных, работа идет медленней (по сравнению с Корректором - примерно в три раза).
2) Даже установка шага яркости = +1 увеличивает яркость черных участков не до [1,1,1], а минимум до [3,3,3], что несколько избыточно.
Автор: dma200899
Дата сообщения: 07.02.2010 13:46
Пытаюсь двигать руками резак при увеличении.
и почему-то он начинает вращаться !!!!!
Т.е. я двигаю верхнюю жирную точку влево, а нижняя вместо того чтобы стоять смирно, едет вправо ! ??????????????

Ага, понял.
при увеличении зума нижней жирной точки не видно, и СТ фиксирует точку, где резак проходит через границу экрана.
соответственно резак вокруг нее и начинает вращаться.
ИМХО - так быть не должно.


Tulon !!
ради бога не слушайте весь этот галдеж. Вы сделали замечательную программу.
Стандартной процедуры оцифровки не существует; у каждого своё видение процесса.
Концептуальные изменения убьют проект.
Сделайте маленькие но очень необходимые детальки.
1) Исправление дпи, в том числе сразу для группы файлов (тем более, что если СТ не нравятся 100% правильные дпи, их приходится корректирвать);
2) Возможноть пропускать любой этап. Сейчас это только добавить возможноть задать 0 поворот для группы файлов и определить полезную зону по границе файла;
3) ластик
4) рамку

Пример с черными объектами готовлю.
Автор: amz01
Дата сообщения: 07.02.2010 15:07
dma200899
Цитата:
Tulon !! ради бога не слушайте...

Ага. ещё один умник нашёлся. Значит - "все лохи, один я знаю, шо надо делать"...
Дежавью, одним словом.
Автор: StanFreeWare
Дата сообщения: 07.02.2010 15:51
dma200899

Цитата:
Возможноть пропускать любой этап.

Можете попробовать пока использовать мой "велосипед".
И Tulon вроде бы уже сам нашел этот глючек с поворотом на масштабе. Ссылка.
Автор: woodyfon
Дата сообщения: 07.02.2010 20:01
Выкладываю результаты dewarp-инга по алгоритму Рамиза Зейналова:
До обработки:

После обработки:

Прошу еще раз, присоединитесь к тесту алгоритма.
Автор: StanFreeWare
Дата сообщения: 07.02.2010 20:12
woodyfon
С радостью бы, но есть ли смысл, ведь требования автора алгоритма противоречат GPL?
Автор: woodyfon
Дата сообщения: 07.02.2010 20:25
StanFreeWare
Не противоречят. Авторские права необходимо писать в исходниках. В бинарниках - по усмотрению автора проекта. Поэтому второй Tulon может и не писать в окошке About данные о авторских правах.
Автор: U235
Дата сообщения: 08.02.2010 07:08
StanFreeWare

Цитата:
GUI-версии от U235 не за горами.

http://alexrey036.narod.ru/LayerTailor/LayerTailor.zip
Описание внутри .pas и .au3 файлов.
Автор: amz01
Дата сообщения: 08.02.2010 07:45
U235
Цитата:
.au3

А этот файл к чему прикладывать?

Проверил я твою шнягу. Обомлел. Все тексты получились белыми буквами на черном фоне. Куски текста уходят в картинки. И что потом с ентим делать?
Что-то тут не то...
И во время работы никакой видимости процесса, даже счётчика нет, у Тулона хоть картинки меняются. А если сканов будет 2000?

Может ещё проверять и глубину соседних пикселей? Если вокруг однотонный фон, то буква, если спектр, то картинка. Хотя это тоже проблемно.

Если хочешь, я переделаю твою прогу на Билдере с выводом на форму картинок.
Автор: StanFreeWare
Дата сообщения: 08.02.2010 08:37
amz01
Ссылка1, Ссылка2
Вы точно уверены, что вы не Monday2000? И что это за тяга такая к запутыванию топиков? ST_XmlPatch выкладывался здесь.

Цитата:
Нужна прога, которая выцарапывает из ST файлы, обработанные до предпоследнего шага и сохраняет их для дополнительной обработки, которую ST не делает.
А потом можно их прогнать в ST по последнему этапу .

Делаете вывод в режиме только изображения, производите нужную обработку, открываете обработанные файлы через XmlPatch и проходите последний этап на созданном патчем проекте.

Добавлено:
По поводу метода U235 можете пока использовать мой сепаратор. Только предварительно, во избежание ненужных вопросов пожалуйста rtfm
Автор: amz01
Дата сообщения: 08.02.2010 09:13
StanFreeWare
Уверен.
Что ты гоняешь постоянно то туда, то сюда. Я уже окончательно запутался что - где.

А что, обработанные файлы без XmlPatch нельзя будет открыть в ST? А что будет?

Посмотрел ссылки про Monday2000. Что, получается, всех тех, кто не "одобрямс!" в одну кучу сваливаем? Нехорошо-с...
Автор: StanFreeWare
Дата сообщения: 08.02.2010 09:21
amz01
Может сделать поворот не туда (что маловероятно), и полезную область задать не по границам, полученным при первом прогоне в СТ (а это скорее всего так и будет). В каких-то случаях так и нужно. В других лучше оставить углы и границы неизменными, и тогда предлагается использовать патч.
Автор: amz01
Дата сообщения: 08.02.2010 09:26
StanFreeWare
Да, но ведь, согласно описанию, на входе будут тогда одни картинки, а как с текстом?

Было бы хорошо, если бы ты описал весь процесс применения по этапам, с сначала исходного ввода в ST до твоего патча, а потом - про патч. Что он даёт и что без него мы теряем? Я уже совсем запутался и ничегонепонимаю...
Может он жутко полезный, но я этого не увидел. В силу своей природной малограмотности.
Автор: StanFreeWare
Дата сообщения: 08.02.2010 09:32
amz01
Действительно, ошибся в формулировке. Я имел в виду первый проход в режиме вывода Цветной/Серый СТ.
Автор: amz01
Дата сообщения: 08.02.2010 09:37
StanFreeWare
Т.е. сначала стандартно выводим цветной/серый пакет.
Потом правим на стороне.
Потом твоим патчем закидываем обратно, пропуская первые 4 этапа, чтобы ST не портил границы.
А потом?

А зачем править на стороне комбинированные сканы, если есть смысл править только разделённые на текст и графику? Я лично в этом уверен.

Или я опять не понял?
Автор: StanFreeWare
Дата сообщения: 08.02.2010 09:48
amz01
Вы все правильно поняли. Возможно, в данном виде патч может пригодиться при коррекции геометрических искажений.
Но, по большому счету он является демонстрацией возможностей правки xml-файла проекта как подхода, альтернативного выпрашиванию фич. Изначально задумывался именно как патч, т.е. утилита, которая получает на входе проект ST, и выдает на выходе тот же проект, но с групповой корректировкой параметров той или иной стадии. Теперь интересно услышать, какие стадии и в каких случаях реально нужно пропускать или как-то править.
Автор: amz01
Дата сообщения: 08.02.2010 09:56
StanFreeWare
Хорошо, но тогда получается, что придётся 3 раза прогонять этап 6, вместо двух при окончательном разделении в STA. Это жутко долго. 3-4 часа на каждый заход при 1000 страницах. Геометрию можно исправить и на исходных сканах.
Автор: StanFreeWare
Дата сообщения: 08.02.2010 10:09
amz01
Есть предположение, что в случае сканов разворотов лучше править геометрию на уже разрезанных сканах.
И все-таки попробуйте еще разок метод U235. С предварительной коррекцией тем же Корректором или каким-нибудь вьюером (см инструкцию). Глядишь, проход-другой скостите.
Автор: amz01
Дата сообщения: 08.02.2010 10:17
StanFreeWare
Метод U235 больше проверять не буду. Это всё сырое и непригодное для пакетной обработки. Буду пока по-старому делать, хоть и долго. А параллельно сам что-нибудь наваяю. Но сыряк не буду выставлять - сначала доведу до минимальной кондиции.

Я вообще думаю, что постоянное втавление своих 3-к копеек, в виде сырых, непродуманных алгоритмов, только запутывает всех. Тяжело юзать примочки, которые меняются по 10 раз на дню, и, иногда, с разворотом на 180 градусов. Ничего личного.

Кстати, насчёт моего скана. Получилось улучшение картинки при лучшем сжатии, или нет?
Автор: StanFreeWare
Дата сообщения: 08.02.2010 10:49
amz01

Цитата:
Это всё сырое и непригодное для пакетной обработки.

Уверен, что вы пытались применить методику не ознакомившись с инструкцией и не произведя предварительную коррекцию.
Методика U235 имеет большое значение и как самостоятельное решение, и как идея выделения текстового слоя на выходе смешанного режима через коррекцию яркости области иллюстраций на -1 (вместо многослойных tif-ов, анализа зон в xml и прочего).
Если не выставлять "сыряк", а говоря корректно, если не делиться с сообществом своими идеями, то есть очень большой шанс довести до кондиции идею, которая никому никогда не понадобится.
По поводу вашего скана. Это ndch обещал в лицах изобразить, как его улучшить. Мне тоже интересно было бы крайне интересно почитать этот сценарий. На всякий случай вот ссылка на мой пост с вариантами грубой обработки этого и еще одного скана.
Автор: woodyfon
Дата сообщения: 08.02.2010 10:51
StanFreeWare
Несмотря на требования, выложите изображения, которые нужно обработать. Пожалуйста.

Такое ощущение, что как только появилось что-то рабочее, так это уже никому не нужно. Не нужно так не нужно. Если все-таки это никому уже ненадо, скажите, чтобы зря автору голову не морочил.
Предлагаю уже создать новую тему, где обсуждать модификации Scan Tailor - a.
Автор: StanFreeWare
Дата сообщения: 08.02.2010 11:30
woodyfon
Прошу прощения за небольшую задержку. При внимательном рассмотрении оказалось, что мои сканы не так уж и искажены. Максимум - так.
Лучше всего, конечно попытаться включить алгоритм в СТ, тогда свое мнение выскажет большее количество народа.
Автор: woodyfon
Дата сообщения: 08.02.2010 12:11
А исходных изображений с искажений именно строк текста у вас нету?
Если алгоритм dewarp и будут внедрять в ST, то только усилиями ОДНОГО Tulona-a. Чтобы человек не делал лишнюю работу, нужно определиться сразу нужно ли нам это или обойдемся.
Автор: amz01
Дата сообщения: 08.02.2010 12:29
StanFreeWare
Цитата:
Уверен, что вы пытались применить методику не ознакомившись с инструкцией

Справку принести?
Я же писал сегодня, что у него на выходе белые буквы на чёрном фоне. Мне что, сканы в негатив перевести, сначала? Крутая методика...
Автор: StanFreeWare
Дата сообщения: 08.02.2010 13:10
amz01

Цитата:
Справку принести?

Вполне достаточно просто архив с проблемным сканом на входе СТ, результатом на выходе СТ и результатами, получаемыми на выходе сепаратора (желательно моего сепаратора, пока U235 не поправит свой). Можно на всякий случай приложить проект СТ. Сразу все станет ясно.
Автор: ndch
Дата сообщения: 08.02.2010 13:38
StanFreeWare

Цитата:
то ndch обещал в лицах изобразить, как его улучшить.

На словах - поправить уровни, убрать шум, уменьшить число цветов. Постараюсь изобразить в лицах сегодня.

Добавлено:
Надеюсь Вы понимаете что на "скриншоте" очень маленькое разрешение и книга напечатана на плохой бумаге не самой хорошей краской. отсюда и ожидаемое качество результата.

Но читабельнее можно сделать.
Автор: amz01
Дата сообщения: 08.02.2010 15:46
ndch
Разрешение 300 ppi. Куда больше?
Автор: monday2000
Дата сообщения: 08.02.2010 16:55
StanFreeWare

Цитата:
Традиционно требует .NET 2.0 для запуска.

Не хотите ли взамен начать изучать Qt? Тем более, что знание Qt может каким-либо образом в будущем пригодиться относительно СТ (который тоже сделан на Qt).

Мне вообще кажется - что наилучший путь - чтобы хотя бы кто-то ещё (кроме anagnost96) научился делать свои клоны СТ. Например, Вы, или U235 (мне некогда). Начинать тут надо явно с изучения Qt. Понятно, чем городить всякие там "приставки" к официальному СТ, оптимальнее всего было бы научиться делать свои клоны СТ с желаемыми свойствами.

Подумайте над этой идеей.


Добавлено:
StanFreeWare
Что такое Ваши "Сепаратор" и "Корректор"?.


Добавлено:
anagnost96
Что Вы решили, будете ли Вы как-либо дорабатывать свой клон СТ (т.е. СТА), и, если да, то как именно?


Добавлено:
woodyfon

Цитата:
Прошу еще раз, присоединитесь к тесту алгоритма.

Что-то я пропустил: Вы дадите исходники алгоритма
Цитата:
dewarp-инга по алгоритму Рамиза Зейналова:
?


Добавлено:
StanFreeWare
Вы могли бы уже сделать себе сайт на Народ.ру - и там всё своё публиковать. А то эти ссылки на onlinedisk - вещь недолговечная, да и искать их тут на Руборде не очень удобно. Свой сайт - это возможность навести чёткий порядок в своей продукции.

Автор: StanFreeWare
Дата сообщения: 08.02.2010 18:30
monday2000
Ну что вы так горячитесь править эту шапку. LayerTailor еще чуть сыроват, инверсные файлы в txt создает.. Некоторых это может сильно испугать.
Зачем мне еще что-то на narod.ru создавать? Мне и на sourceforge пока нравится: ссылка.
Сепаратор и Корректор - это временное решение, до появления окончательно отлаженных версий от U235. Функционально Сепаратор = LayerTailor, Корректор впервые описан здесь
amz01
Подсовывал-подсовывал вам сегодня целый день свою версию separator, а она с вашими сканами как раз не заработала. Поправил.
Separator 0.6, Corrector 0.2

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.