Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: domo22
Дата сообщения: 21.10.2009 09:05
U235

Цитата:
воспользоваться Irfan/XnView

Irfan почему-то не смог справиться с этой задачей, слегка подпортив чисто белый фон, хотя настройки этого и не позволяли. Наверно баг, надо написать автору. XnView сделал все как надо и всего за минуту. Спасибо.
Автор: Tulon
Дата сообщения: 21.10.2009 22:43
Ну что, получил сегодня исходники алгоритма коррекции геометрических искажений. Уже адаптированные для встраивания в ST. Конечно над ними еще предстоит поработать, в основном в плане интеграции, но прогресс уже не остановить!
Человек за две недели написал этот алгоритм на Java, и потом за два дня перенес его в ST. При этом единственный вопрос, заданный мне, был: "куда вставлять этот код?". Даже не нахожу слов, чтобы выразить восхищение.

Первые сборки с этой фичей ждите после сделующего релиза, то есть недели через три.
Автор: U235
Дата сообщения: 21.10.2009 22:53
Tulon
По поводу dewaring'а: ИМХО, следует иметь ввиду, что искажения сканированного изображения и фотографированого имеют принципиальные отличия: если базовую линию на фото можно целиком аппроксимировать квадратичной(полиномиальной) функцией, то на скане, базовая линия - "смесь" линейной (там где скан прижимается к стеклу) и нелинейной (~ нескольких см у корешка книги) функции.
Автор: Tulon
Дата сообщения: 21.10.2009 23:06
U235
Да, алгоритм делался в первую очередь для фотоаппаратов, и вроде там используется как раз квадратичная функция.
Можно попробовать взять степень повыше. У меня например при нормализации освещения используется полином довольно высокой степени - какой именно уже не помню. Так или иначе, имея фундамент, работать над улучшениями будет гораздо проще.

Если честно, я не особо ценю необходимость выравнивания геометрических искажений на сканированном материале. Ну уезжают буквы немного вверх в районе корешка - ну и что? Читать не мешает, и практически не раздражает.
Автор: dma200899
Дата сообщения: 22.10.2009 06:10
Tulon,
а может перекинуть иностранцам те статьи про деварпинг, которые я вам на натахауc-форуме размещал ?
Автор: monday2000
Дата сообщения: 22.10.2009 08:36
dma200899

Цитата:
а может перекинуть иностранцам те статьи про деварпинг, которые я вам на натахауc-форуме размещал ?

Можете и сами перекинуть - вот сюда: http://diybookscanner.org/forum/viewtopic.php?f=3&t=110&start=70

Добавлено:
Scan Tailor скомпилирован для платформы Mac :

http://diybookscanner.org/forum/viewtopic.php?f=3&t=132
Автор: kaz6yr
Дата сообщения: 22.10.2009 10:37
Деварпинг есть тут:

http://www.visionbib.com/bibliography/char981.html
Автор: monday2000
Дата сообщения: 22.10.2009 13:39
Tulon

Цитата:
Ну что, получил сегодня исходники алгоритма коррекции геометрических искажений.

Если можно - выкладывайте. Я, конечно, скачал вот эти: http://diybookscanner.org/forum/viewtopic.php?f=3&t=110&start=70#p1226 - но там же надо ещё разбираться.

Я бы хотел "перебить" под FreeImage этот алгоритм.

Добавлено:
kaz6yr

Цитата:
http://www.visionbib.com/bibliography/char981.html

Но там же без исходников вроде...
Автор: Tulon
Дата сообщения: 24.10.2009 15:55
Вот патч файл относительно версии 0.9.6: http://pastebin.ca/1641504
Перебить алгоритм под FreeImage будет не просто - там используются морфологические операции Scan Tailor'а. Помнится встречал я расширение FreeImage, где по крайней мере бинарная морфология была.
Автор: monday2000
Дата сообщения: 25.10.2009 12:54
Tulon
Спасибо, посмотрю.
Автор: ndch
Дата сообщения: 25.10.2009 21:22
Tulon

Цитата:
получил сегодня исходники алгоритма коррекции геометрических искажений

неужели от индийского Шахиджаняна ?
Автор: Tulon
Дата сообщения: 25.10.2009 21:48

Цитата:
неужели от индийского Шахиджаняна ?

Естественно нет. После этак восьми часов общения с ним по скайпу у меня не осталось никаких сомнений, что кода для СТ он писать не собирается.

А этот товарищ с англоязычного форума, ссылка на который есть в шапке. Rob его зовут. Никаких диаграмм и документаций не требовал, сам разобрался в тех частях СТ, которые были ему нужны, и в итоге на перенос кода из Java + leptonica в СТ у него ушло два дня.

Кстати почти закончил переделку архитектуры поддержки интерактивности. Сегодня-завтра выпущу новую сборку.
Автор: Michaello36
Дата сообщения: 26.10.2009 21:28
Спасибо за программу!!!
ВЕЛИКОЛЕПНО!!!


Некоторые предложения.
1. Нельзя ли сделать панели инструментов убирающимися, как, например, в PureImage? Превьюшное окно на мониторе с низким разрешением мелковато...
2. IMHO, есть смысл сделать обработку выборочной, дав пользователю возможность выбрать самому нужные этапы "конвейера" в чекбоксах. Например, если нужно только порезать развороты на страницы и выровнять строки, а "полезные области" выделять не планируется.
3. Возможно ли сделать полноэкранный режим?
4. При определении "полезных областей" есть смысл сделать их границы не "впритык" к символу/линии, а с отступом в несколько пикселей (атуально для работы со сканами, содержащими таблицы).
5. Так и не понял, что делает кнопка над панелью эскизов.

С уважением и наилучшими пожеланиями,
Michaello
Автор: Dashout
Дата сообщения: 26.10.2009 21:32
Tulon
Все ребята, кто занимается этой темой
Вы молодцы!
Автор: Tulon
Дата сообщения: 26.10.2009 22:01
Новая сборка: http://www.onlinedisk.ru/file/251980/
Зоны работают, драг работает, в остальном можно считать - изменений нет.
Не исключено, что вернется один из багов с падением - тот, что из-за Qt. Новую версию Qt я не патчил - хочу проверить, остался там этот баг или наконец пофиксили.
Перевод по прежнему не полный. Вспомнил про это проблему уже после окончания сборки.
Еще одно: зоны, сделанные на предыдущих пре-релизах, грузиться не будут.
Автор: steve12345
Дата сообщения: 27.10.2009 04:59
Apologies if I'm asking something any newbie already knows. What advantage does ST (C++) have over artscan (Python) other than minimal runtime advantage ?

http://diybookscanner.org/forum/viewtopic.php?f=3&t=129

Translation: English » Russian
Извинения, если я чего-то прося любого новичка уже знает. Итак, какое преимущество делает ST (C++) имеют более artscan (Python), помимо выполнения минимальным преимуществом?

Автор: ndch
Дата сообщения: 27.10.2009 08:49
Tulon
Мне кажется, или "полезная область" стала работать лучше ?

Добавлено:
steve12345
What is artscan ?

Добавлено:
Tulon
Теперь ч.б. снова Group 4 Fax Encoding
Это бага или фича ?

Собственно переход на gray был вызван этим:

Цитата:
Проблема в Photoshop появляется только при сжатии в CCITT Group4 (G4Fax)


Цитата:
Хм, для меня не проблема переключиться на LZW и для черно-белых картинок тоже. Если общественность попросит, так и сделаю. Но вообще, попиксельная пропорция, на которую ворчит фотошоп, не должна по идее зависеть от метода сжатия.


Добавлено:
Насчёт зон и mixed-режима:
не очень приятно ждать десяток секунд пока обработается изображение, что бы потом перейти в "зоны". Сильно раздражает если нужно на десятке страниц добавить зоны. Брррр.

Добавлено:
и сама навигация по зонам не очень приятна.
Автор: monday2000
Дата сообщения: 27.10.2009 09:22
ndch

Цитата:
What is artscan ?

ArtScan - новая программа для сканобработки. Открытые исходники и свободно-бесплатная лицензия GPL v3.

Сайт: http://code.google.com/p/artscan/

Форум: http://diybookscanner.org/forum/viewtopic.php?f=3&t=129

Автор: рубордовец ukpyr.

P.S. Почему-то ukpyr никак не хочет открыть где-нибудь русскоязычный топик по своей программе, сколько я его ни просил в ПМ...
Автор: ndch
Дата сообщения: 27.10.2009 09:28
Т.е. для перемещения по зонам хотелось бы (вероятно) так:
удерживание левой мыши + перемещение манипулятора = перемещение по скану

сейчас же если зумим скан и хочется переместится за предел видимого-случается какая-то невнятная заминка, при которой действует вышеописаное поведение
но при последующей установке контура мыш иногда "залипает" и
перемещение манипулятора = перемещение по скану

если кто может подсказать подскажите чем удобно сделать видео с дальнейшей добавкой текстовых коментариев. camtasia ?

Добавлено:
monday2000
artscan: каковы отличительные (от ст,ск) черты ? Плюсы, минусы ?
Автор: ukpyr
Дата сообщения: 27.10.2009 10:33

Цитата:
Почему-то ukpyr никак не хочет открыть где-нибудь русскоязычный топик по своей программе, сколько я его ни просил в ПМ
потом, еще не все работает

Цитата:
artscan: каковы отличительные (от ст,ск) черты ? Плюсы, минусы ?
главное отличие - отсутствие жестко заданного сценария обработки, пользователь сам выбирает нужные фильтры и выполняет их над всеми/избранными страницами. Похожий интерфейс - пакетный режим XNView. Легкость расширения путем создания простых модулей-плагинов. В данный момент доступны все возможности из библиотек Imagemagick,Graphicsmagick,OpenCV. Возможность послойной обработки страниц (например можно выделить картинки, перенести их на другой слой, обработать разными фильтрами текст и картинки, потом слить слои обратно в один или послойно сжать в Djvu; или сделать послойный импорт Djvu с раздельной обработкой переднего плана/фона). Возможность прямого скриптования из самой программы (у скрипта есть полный доступ к GUI, документам, страницам, слоям, выделенным зонам и т.д. - тут возможности обработки просто безграничны). Интеграция разных OCR движков - OCropus/Tesseract, Cuneiform, редактор текста с наложением на изображение страницы.
Автор: dabudada
Дата сообщения: 27.10.2009 11:40

Цитата:
если кто может подсказать подскажите чем удобно сделать видео с дальнейшей добавкой текстовых коментариев. camtasia ?

Да, текущая актуальная версия 6.0.3.
Автор: denver 22
Дата сообщения: 27.10.2009 16:50
Tulon
Последняя сборка классная. Пока глюков нет. Правда с глюком Qt и раньше не сталкивался... Появилось ощущение, что зоны чуть лучше стали распознаваться. Возможно показалось.
Автор: Tulon
Дата сообщения: 28.10.2009 01:33
ndch

Цитата:
Т.е. для перемещения по зонам хотелось бы (вероятно) так:
удерживание левой мыши + перемещение манипулятора = перемещение по скану

Так оно и работает.


Цитата:
сейчас же если зумим скан и хочется переместится за предел видимого-случается какая-то невнятная заминка, при которой действует вышеописаное поведение

У меня заминки не воспроизводятся.


Цитата:
но при последующей установке контура мыш иногда "залипает" и
перемещение манипулятора = перемещение по скану

Это вообще-то фича. Левым кликом и драг начинается, и новая точка у зоны создается. Сейчас логика такая:
Если нажатие было короче 0.4 секунды, то точка будет создана, если больше - то это был драг. Нужно будет добавить еще одно условие - если нажатие было длинным, но почти без движения - точку надо создавать. Кстати драг делается в любом случае, а вот создание точки - в зависимости от вышеописаных факторов.

Добавлено:
Michaello36

Цитата:
1. Нельзя ли сделать панели инструментов убирающимися, как, например, в PureImage? Превьюшное окно на мониторе с низким разрешением мелковато...

Не знаю - пока не до этого.


Цитата:
2. IMHO, есть смысл сделать обработку выборочной, дав пользователю возможность выбрать самому нужные этапы "конвейера" в чекбоксах. Например, если нужно только порезать развороты на страницы и выровнять строки, а "полезные области" выделять не планируется.

Я опасаюсь, что сделай я возможность вывода на произвольном этапе, народ начнет делать такой вывод, грузить его обратно в ST, и потом жаловаться, что например рамка контента цепляется за границу исходного изображения с искусственными полями, добавленными после поворота или невертикального разреза.


Цитата:
3. Возможно ли сделать полноэкранный режим?

Это пожалуй можно - препядствий не вижу.


Цитата:
4. При определении "полезных областей" есть смысл сделать их границы не "впритык" к символу/линии, а с отступом в несколько пикселей (атуально для работы со сканами, содержащими таблицы).

Выложите пример что-ли.


Цитата:
5. Так и не понял, что делает кнопка над панелью эскизов.

Если не поняли, значит она вам не особо нужна. Я не так давно объяснял, что она делает, и повторяться мне не охота. Может из тех, кто понял, кто-нибудь отразит это в документации? Wiki там на что стоит?

Добавлено:
denver 22

Цитата:
Появилось ощущение, что зоны чуть лучше стали распознаваться. Возможно показалось.

Скорее всего показалось - не припомню, чтобы изменял какие-либо алгоритмы.

Добавлено:
ndch

Цитата:
Теперь ч.б. снова Group 4 Fax Encoding
Это бага или фича ?

У меня по прежнему LZW, по крайней мере под Linux. Разве что баг в новой версии LibTIFF, а скорее всего вы ошиблись.


Цитата:
не очень приятно ждать десяток секунд пока обработается изображение, что бы потом перейти в "зоны". Сильно раздражает если нужно на десятке страниц добавить зоны. Брррр.

Это слишком сложно. Как раз тот случай, когда чрезмерное стремление к удобству использования может загубить всю программу.


Цитата:
и сама навигация по зонам не очень приятна.

Давайте так: если пишем, что что-то не нравится, то уж по крайней мере так, чтобы автор смог понять, что же именно вам не понравилось.
Автор: StanFreeWare
Дата сообщения: 29.10.2009 07:17
Спасибо за отличную программу. До ее появления наплодилось столько ужасных по качеству дежавюшек... И многим из них уже ничем не помочь.

Предлагаю полезное дополнение - во время длительных автоматических операций писать проценты выполненной работы в начале заголовка окна (чтобы было видно и на панели задач), как у архиваторов, например.

И еще - работает ли удаление белого шума на черном фоне? Бывает, что буквы непропечатываются - остаются дырочки.

Я так понимаю, чтобы подключиться к редактированию вики-документации нужно стать членом проекта SТ на SourceForge?
Автор: Tulon
Дата сообщения: 29.10.2009 10:49

Цитата:
Предлагаю полезное дополнение - во время длительных автоматических операций писать проценты выполненной работы в начале заголовка окна (чтобы было видно и на панели задач), как у архиваторов, например.

Точный объем работы заранее не известен. Например необходимость повторной обработки страницы решает сама процедура обработки на данном конкретном этапе.
А вообще - чем лента предпросмотра не индикатор прогресса (с зажатой верхней кнопкой)?


Цитата:
И еще - работает ли удаление белого шума на черном фоне? Бывает, что буквы непропечатываются - остаются дырочки.

Ну так попробуйте, чтоли. В определенной степени должно помочь сглаживание, которое делается перед бинаризацией, но не попробовав - сложно сказать.


Цитата:
Я так понимаю, чтобы подключиться к редактированию вики-документации нужно стать членом проекта SТ на SourceForge?

Раньше вообще был открыт анонимный доступ, а сейчас SourceForge старую систему прикрыла, и в новой походу действительно нужно быть членом проекта. Дайте username - добавлю вас в проект.
Автор: domo22
Дата сообщения: 29.10.2009 14:18
А появилась ли в последней версии возможность изменять ТОЛЬКО поля страниц, не трогая никак саму полезную зону?
Автор: ndch
Дата сообщения: 29.10.2009 16:57
domo22
Может быть поможет на стадии "макет" убрать галку "выравнивать с другими страницами" ?
Автор: Tulon
Дата сообщения: 29.10.2009 21:46

Цитата:
Может быть поможет на стадии "макет" убрать галку "выравнивать с другими страницами" ?

Кстати это вариант, но все равно ресэмплинг сделан будет. Впрочем если качество оригинала хорошее - это не проблема.
Автор: ndch
Дата сообщения: 29.10.2009 21:58
Tulon

Цитата:
но все равно ресэмплинг сделан будет

Я чего путаю или без поворота и с одинаковым входным и выходным разрешением ресемплинг не делается ?
Автор: woodyfon
Дата сообщения: 29.10.2009 22:28
Tulon, а какой алгоритм вы используете для определения угла поворота при наклоне отсканированной страницы? Хотелось бы алго почитать не в кодовом виде, а в текстовом. какие параметры имеет точка изображения для ввода в алго поворота изображения на определенный угол? (Я так понимаю цвет, координаты точки относительно относительного начала координат, всего пять параметров * разрешение изображения (размер0 = комп просто-напросто зависнет. Получается матрица размером [высота]*[ширина] в пикселях. Подскажите пожалуйста, то ли я придерживаюсь классических способов обработки изображения, то ли разработали алгоритмы оптимизации)

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.