Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: Tulon
Дата сообщения: 20.07.2009 23:08
anagnost96

Цитата:
А может, можно сделать некий абстрактный параметр специально для GUI, а в зависимости от его значения уже подстраивать все три остальных?

Можно естественно, только кто мне скажет, как именно единый параметр будет влиять на эти три. Тут нужно экспериментировать, на что у меня пока нет времени.
Автор: monday2000
Дата сообщения: 22.07.2009 10:06
Tulon

Цитата:
будет уже два геометрических преобразования.

Не увидел я "2-х преобразований". Но даже если они и есть - ИМХО этим можно пренебречь. Не такой уж у нас тут прецезионный процесс.

Цитата:
После компенсации наклона либо появляются дополнительные поля (какого интересно цвета они должны по вашему быть?), либо наоборот бока картинки обрезаются.

Разумеется - ни в коем случае не обрезать - а только должны добавляться дополнительные поля. Какого цвета? Думаю, белого. Случаи, когда нужно добавлять небелый цвет, бывают - например, сканы цветных журналов. Но ИМХО для начала можно и не замахиваться даже на случаи, когда дополнительные поля должны быть небелые. Для обработки сканов подавляющего большинства книг доп. поля могут быть белыми - т.к. после бинаризации скан и сам тоже станет белым с чёрными буквами.

Какой должен быть небелый цвет в этом случае - я тоже в своё время ломал голову (пробовал "Технику-Молодёжи" сканить). Задача напоминает чистку обложек. Скорее всего - брать в примыкающем регионе скана кусочек "чистого" фона и размножать его в добавляемых треугольных полях (поскольку мало взять оттуда лишь цвет - нужна ещё и фактура). Но, повторюсь - ИМХО сейчас этим можно голову не забивать - для начала неплохо бы разобраться просто с обычными массовыми случаями - для которых белых полей предостаточно.

Цитата:
Я бы на месте monday2000 уже сам бы реализовал эту фичу.

Пока выглядит как очень маловероятное. Так что ничего пока не могу пообещать. СТ я решил покритиковать, т.к. мне крайне досадно - как бы процесс развития СТ не пошёл в неправильном направлении. Если уж жертвуете своим временем/силами - так хотя бы пусть всё это будет не напрасно.

Ключ к успеху ИМХО - разбиение (функциональности) СТ (или СК) на несколько простейших утилит. Но СК вряд ли уже исправишь
Автор: Tulon
Дата сообщения: 22.07.2009 23:42
dma200899
Проблему с сортировкой я исправил в SVN. В ближайшие дни исправлю проблемы на стадии Макет Страницы после удаления файлов из проекта. Случайные падения тоже вроде как исправлены (пришлось патчить Qt). Может на выходных выпущу новый релиз.

Добавлено:
monday2000
Я никакого разделения на мелкие утилиты делать не собираюсь. Ухудшение качества, умньшение удобства, ухудшение работы автоматических алгоритмов - да еще и куча усилий, которые нужно приложить, чтобы добится всего этого. Нет уж спасибо. Хочется отдельных утилит - возьмите и сделайте. Исходники открыты - тут вам и алгоритмы, и графический движок - бери нехочу.
Автор: dabudada
Дата сообщения: 23.07.2009 09:21
Tulon, гляньте два скриншота, я с таким случаем еще не сталкивался, может быть и Вам будет незнакомо поведение миниатюр: http://www.onlinedisk.ru/file/183672/
Автор: Rsbr
Дата сообщения: 23.07.2009 10:00

Цитата:
Ухудшение качества, умньшение удобства, ухудшение работы автоматических алгоритмов - да еще и куча усилий, которые нужно приложить, чтобы добится всего этого. Нет уж спасибо. Хочется отдельных утилит - возьмите и сделайте.


Абсолютно согласен.Вообще отдельные утилиты некоторые и так есть,раньше,до появления СТ пользовался bash/perl/lisp + imagemagik,Gimp,unpaper и т.д и т.п. Неудобно было отслеживать процесс и исправлять неверно обработанные страницы.
Плюс промежуточные результаты,нумерация и т.д. Нумеровал страницы при резке скриптом автоматически типа 4-л и 4-пр.
Отдельные утилиты это всё равно что конвеер по разным предприятиям расташить...Пользоваться этим станет гораздо труднее,тот кому это нужно (и кто знает зачем это нужно) будет пользоваться.А остальные будут ругаться и искать программу "всё в одном"
Если Вместо СТ сделать несколько утилит-одна крайность.Если прикрутить объединение на выходе,сканирование,распознование -другая.

Автор: Tulon
Дата сообщения: 23.07.2009 22:19
dabudada
Похоже на баг. Выкладывайте файл, миниатюра которого не отображается.
Не отображается она на всех этапах или только на некоторых?

Добавлено:
dma200899
Исправил падение после удаления последнего скана в проекте.
Сейчас займусь залипаним параметров на стадии Макет Страницы.
Автор: Tulon
Дата сообщения: 24.07.2009 00:54
Ну вот - залипание тоже исправил.
Автор: dma200899
Дата сообщения: 24.07.2009 06:46
А как насчет черных полос между текстом и полями при поворотах ?
(все остальное, простоЮ можно обойти, а это требует долгой и нудной чистки).

Кстати, а что с прокручиванием ленты при зажатом контроле ?

Может в новой сборке и отражение ID в ленте сделаете (идентичность имени файла - названия миниатюры в ленте) ?
Автор: Tulon
Дата сообщения: 24.07.2009 08:31
Черные полосы я пару дней назад исправил, но только для черно-белого и смешанного режимов.


Цитата:
Кстати, а что с прокручиванием ленты при зажатом контроле ?

Ускорение сколла при зажатом контроле идет от Qt - похоже стандартное поведение во многих системах. Посмотрю, что можно с этим сделать.


Цитата:
Может в новой сборке и отражение ID в ленте сделаете (идентичность имени файла - названия миниатюры в ленте) ?

В этой версии скорее всего все останется как есть, а в следующей нумерация файлов на выводе видимо вообще изчезнет.
Автор: monday2000
Дата сообщения: 24.07.2009 10:51
Rsbr

Цитата:
Абсолютно согласен.Вообще отдельные утилиты некоторые и так есть,раньше,до появления СТ пользовался bash/perl/lisp + imagemagik,Gimp,unpaper и т.д и т.п. Неудобно было отслеживать процесс и исправлять неверно обработанные страницы.

Все эти утилиты не предназначены напрямую для сканобработки - именно отсюда и неудобство.

Цитата:
Отдельные утилиты это всё равно что конвеер по разным предприятиям расташить...

Нет, это в корне неправильная аналогия. Конвейер - это когда на входе одно и то же. А здесь на входе - всегда разное. Подходящая аналогия - это горно-обогатительный комбинат, где, в зависимости от вида руды, используется разный набор независимых стадий обработки руды. Например, в одном аппарате руду обрабатывают кислотой, в следующем аппарате - прокаливают (а не в одном и том же аппарате обрабатывают кислотой и прокаливают - потому что при другой руде на входе после кислоты потребуется флотация, скажем).

Так и тут - в зависимости от вида сканов нужно применять разный набор независимых друг от друга простейших (визуальных и непременно специализированных для сканобработки) утилит (такие сейчас не существуют).

Есть такое понятие - "вредный универсализм". В СТ и СК он как раз имеет место.

Цитата:
Пользоваться этим станет гораздо труднее,тот кому это нужно (и кто знает зачем это нужно) будет пользоваться.

Действительно, общий объём телодвижений увеличится. Но всё же общая простота всей сканобработки значительно возрастёт - потому что на каждом этапе будет "отсекаться" некая часть общей сложности - которая сейчас "тащится" в СТ-СК через всю сканобработку. Яркий пример - сдвоенные развороты. Вместо того, чтобы изначально разрезать их и превратить в единообразные одиночные - нет, они "тащатся" через всю сканобработку - вынуждая усложнять интерфейс СТ-СК.

Другой пример - deskew. Лучше сразу сделать оптом deskew, внимательно проверить, что получилось - и тогда дальше (на следующих этапах) мы уже практически забудем о проблеме deskew (концентрируясь лишь на проблемах следующих этапов). (Но для страховки некоторые "последующие" утилиты тоже могут иметь deskew).

Цитата:
А остальные будут ругаться и искать программу "всё в одном"

Вся фишка-то в том, что для сканобработки программа "всё в одном" пока невозможна в принципе - в том виде, как это понимают СК и СТ. Главная причина - несовершенство алгоритмов, что делает последовательность сканобработки непредсказуемой. Это только на качественных сканах нужно 1-2-3-4-5, а на сложных потребуется, скажем, 1-2-3-2-3-2-5 и т.п. - т.е. гибкая схема (в СТ и СК - жёсткая схема).

Жёсткая схема была бы возможна только в том случае, если бы на любых сканах применяемые алгоритмы давали бы результат, гарантированно удовлетворяющий определённым критериям. Сейчас этого нет (и возможно ли?).

Другое дело - что можно сделать набор независимых-простейших утилит - а потом постараться сделать некую управляющую программу "визард" - которая будет последовательно вызывать нужную простейшую утилиту и управлять ею. Естественно, такой "визард" должен быть программируемым, а ещё можно будет на него делать профили (в зависимости от вида сканов). Но визард - это потом (если он вообще возможен), для начала простейшими утилитами можно будет полностью вручную управлять.
Автор: terminat0r
Дата сообщения: 24.07.2009 13:27
monday2000
Кажется мне, что Вы рассказываете о Book Restorer, где операции с книгой можно раскладывать в очередь. Это, в общем, там хорошо реализовано. Возможно Вы и правы, и автору следовало бы подумать о возможности отключения или смены очередности операций, которые сейчас жестко заданы в СТ.
Но это все можно реализовать не разбивая программу на отд. утилиты.



Автор: Rsbr
Дата сообщения: 24.07.2009 14:18

Цитата:
Подходящая аналогия - это горно-обогатительный комбинат, где, в зависимости от вида руды, используется разный набор независимых стадий обработки руды. Например, в одном аппарате руду обрабатывают кислотой, в следующем аппарате - прокаливают (а не в одном и том же аппарате обрабатывают кислотой и прокаливают - потому что при другой руде на входе после кислоты потребуется флотация, скажем).


Но при этом эти аппараты расположены максимально плотно и сделано всё для удобства транспортировки руды между ними,не так ли? Плюс уровень автоматизации этого процесса.А несколько утилит запускаемых отдельно да каждый раз загружать...
Важно следующее: Сейчас в 95% случаев я получаю на выходе СТ то что мне нужно,автоматически.И это меня устраивает.
А времени на управление 3-4 утилитами по отдельности у меня во многих случаях нет.

Вот разве исправление ориентации я не раз хотел отключить. И собрать одну сборку СТ специально без этой функции.
Иногда оно действительно мне не нужно.Насколько при этом теряется качество?
Автор: monday2000
Дата сообщения: 24.07.2009 17:07
terminat0r

Цитата:
Но это все можно реализовать не разбивая программу на отд. утилиты.

Можно. Но вряд ли это хорошо и нужно. Пример - СК. Там "не-разбивание программы на отд. утилиты" привело к следующим негативным последствиям:

1. Чудовищно перетяжелённый интерфейс.

2. Наличие "паразитных" дополнительных "связей" между отдельными "логическими компонентами" (типа флажки "не учитывать то-то" если "включено это").

3. Обилие глюков. (из-за высокой сложности)

4. Негарантированность получения желаемого результата (просто путаешься в многочисленных флажках-кнопках-"тонкостях").

5. Сложность освоения программы новичками (для них - это монстр, один вид которого пугает).

6. Сложность выбора оптимальной программной архитектуры (это для такого-то монстра).

Можно привести ещё и ещё таких доводов. Проще говоря - всё излишне-неоправданно сложное - есть плохое. В природе динозавры вымерли. СК ещё просто не успел.

Это всё равно, как если скрестить в единую программу MS Word, MS Excel, MS PowerPoint и MS Outlook - можно, но вряд ли нужно.

Добавлено:
Rsbr

Цитата:
Но при этом эти аппараты расположены максимально плотно и сделано всё для удобства транспортировки руды между ними,не так ли? Плюс уровень автоматизации этого процесса.А несколько утилит запускаемых отдельно да каждый раз загружать...

Да, таковы издержки. Точнее говоря - издержки лишь в том, чтобы лишние разы выгрузить-загрузить сканы. Но разве это так уж тяжко сделать?

Зато ведь каждая такая утилита будет внутренне исключительно проста, как валенок (несравнимо проще, нежели чем СТ или СК) - с ней любой чайник справится.

Плюс - можно будет выбирать, какой утилитой воспользоваться (или Irfan View, скажем).

Про автоматизацию - забудьте. В сканобработке почти всё нуждается в человеческом контроле. Разрезка разворотов - только под контролем человека, никакая полная автоматизация невозможна. Deskew - скорее всего тоже должен быть проверен человеком (буду рад ошибиться - но даже файнридер лажается с deskew в крайне редких случаях). Draft kromsate в СК и "Полезная область" в СТ - тоже требуют после себя контроля человека.

Впрочем, я не исключаю некий общий "визард" - упрощающий работу с этими простейшими утилитами. Быть может, удастся свести каждую загрузку-выгрузку к 1-2 щелчкам мыши. Тут можно что-то придумать. Главное, чтобы эти утилитки были полностью взаимно-независимы (чего сейчас нет ни в СТ, ни в СК). Это будет по смыслу напоминать Hi-Fi DjVu http://www.djvu-soft.narod.ru/soft/hi_fi_djvu.htm

Цитата:
Важно следующее: Сейчас в 95% случаев я получаю на выходе СТ то что мне нужно,автоматически.И это меня устраивает.

А чем обрабатывать оставшиеся 5% сложных сканов?
И потом - это Вас устраивает; я же ориентируюсь на широкий хлещущий поток некачественно сделанных DjVu-книг. Очевидно, что просто нет максимально простого инструмента для сканобработки.

Чайник жаждет, чтобы ему всё объяснили по простым шагам - как сделать DjVu-книгу. Типа "Делай раз - получаешь то-то", "делай два - это-то".

Я предлагаю каждое такое "делай..." сделать максимально простым - т.е. понятным чайнику. Правда, bolega утверждает, что чайнику не удастся объяснить, что должно получиться - дескать, чайник настолько дурак, что даже и не понимает, а чего он, собственно, делает. Да, это, конечно, проблема - но тут можно побороться - снабдить всё картинками, максимально разжевать. Что-то вроде такого: http://www.djvu-soft.narod.ru/scan/strange_lighted.htm .

Всё-таки разъяснить нечто заведомо простое (каждую из утилит) гораздо проще - чем объяснять нечто сложное (типа СК и СТ).
Автор: dma200899
Дата сообщения: 25.07.2009 07:01

Цитата:
Вот разве исправление ориентации я не раз хотел отключить. И собрать одну сборку СТ специально без этой функции.

зачем отключать ?
туда неплохо было бы добавить кнопку "применить к ...", и тогда можно 0.00 ко всем так сделать.

А в выводе хорошо бы иметь возможность принудительное сглаживание иметь возможность отключить, чтобы вывести "как есть".
Автор: Tulon
Дата сообщения: 25.07.2009 08:29
dma200899

Цитата:
зачем отключать ?
туда неплохо было бы добавить кнопку "применить к ...", и тогда можно 0.00 ко всем так сделать

Это уменьшило бы логичность интерфейса. Сразу возникал бы вопрос: зачем применять ко всем страницам параметр, который у них явно не одинаковый. То, что это может иметь смысл для уже выровненых страниц, пользователь может понять, а может и не понять. В любом случае это неочевидность, а неочевидностей в пользовательском интерфейсе я сильно не люблю.
В принципе можно свести на нет эту неочевидность примерно так:
[v] Компенсировать наклон
[ Применить к ... ]
-------------------------------------
Угол наклона: [0.14o]

Тут сразу видно, что применяется не угол, а состояние включить / выключить.
Против такого варианта у меня возражений в принципе нет, но приоритет все равно низкий - мало кому такое надо, особенно учитывая то, что почти всегда можно просто позволить автомату отработать на уже выровненных страницах.


Цитата:
А в выводе хорошо бы иметь возможность принудительное сглаживание иметь возможность отключить, чтобы вывести "как есть".

Такую необходимость нужно доказывать реальными примерами.
Между прочим, сейчас сглаживание применяется только как стадия подготовки к бинаризации. В режиме "Серый / Цветной" например - сглаживания нет совсем. Некоторое замыливание все равно будет конечно - это результат геометрических проебразований (одного преобразования), и от него никуда не деться.
Автор: terminat0r
Дата сообщения: 25.07.2009 12:59
Tulon

Цитата:
учитывая то, что почти всегда можно просто позволить автомату отработать на уже выровненных страницах.

вам не жалко времени пользователей? Ведь это ощутимые затраты.
Автор: Tulon
Дата сообщения: 25.07.2009 13:55

Цитата:
вам не жалко времени пользователей? Ведь это ощутимые затраты.

Компенсация наклона - самая быстрая стадия, не считая холостых.
Если ее делать отдельно - практически все время уйдет на загрузку картинок. Если ее делать в вместе с другими - разницы по скорости практически нет - что с ней, что без нее.
Автор: Tulon
Дата сообщения: 25.07.2009 17:36
Попробовал решить проблему с ускорением скроллинга при зажатом Ctrl или Shift. К сожалению, тут ничего сделать нельзя - это поведение идет и от Qt и от самой операционной системы.
В общем придется вам отпускать Ctrl / Shift при скроллинге, и потом опять зажимать при клике.

Добавлено:
Собрал билд, который вероятно станет релизом 0.9.6
Быстренько тестируем, и если серьезных проблем не обнаружится, завтра зарелизю его оффициально.
Ссылка: http://www.onlinedisk.ru/file/185236/
Автор: dabudada
Дата сообщения: 26.07.2009 08:27

Цитата:
Похоже на баг. Выкладывайте файл, миниатюра которого не отображается.
Не отображается она на всех этапах или только на некоторых?

Не отображается только на двух стадиях: компенсация наклона и выделение полезной области.
Эта страница вне пакета (серый tiff-zip на 80 страниц) ведет себя подобающе, поэтому выкладывать ее в отдельности от остальных нет смысла. Я еще помучаю этот проект и о результатах изысканий напишу. Если понадобится, то попробую выложить весь проект, но для моего интернета это ну ооочень сложная задача
Автор: dma200899
Дата сообщения: 26.07.2009 13:11
вылезла черная полоса в смешанном режиме
Автор: Tulon
Дата сообщения: 26.07.2009 13:22
Если эта черная полоса - часть исходного изображения, и при этом попала в область контента - тут уже ничего не поделаешь. Ну а если она за пределами исходного изображения - тогда пример в студию.
Автор: dma200899
Дата сообщения: 26.07.2009 13:37
http://www.onlinedisk.ru/file/185563/
исходная картинка и файл проекта.

если надо, могу результирующий тоже выложить
Автор: Tulon
Дата сообщения: 26.07.2009 14:58
Исправил черные полосы в Смешанном режиме.
Автор: dma200899
Дата сообщения: 26.07.2009 15:08
она там, кстати, и в ч/б режиме появляется, только в виде какого-то пунктира
Автор: Tulon
Дата сообщения: 26.07.2009 15:29

Цитата:
она там, кстати, и в ч/б режиме появляется, только в виде какого-то пунктира

Это ошибки округления. Уже исправил.
Автор: Tulon
Дата сообщения: 26.07.2009 21:06
Выпустил версию 0.9.6
Брать как обычно тут.

По сравнению с тем, что выкладывал вчера, было сделано еще несколько мелких и не очень фиксов. Не очень мелкий фикс - это тенденция выставлять линию разреза на самом краю картинки в случае одностраничных сканов. Теперь эта тенденция заметно поуменьшится.
Автор: drcode
Дата сообщения: 28.07.2009 01:21
I am sorry I am new to this scantailor. Can anyone list the names of softwares for book processing and give a comparison or a link where they are compared ?

For example, compare scantailor with scankromsator and book restorer and any other tools, and list their merits and demerits in a tabular fashion ?

Is there a software that can be used to convert djvu to pdf or to read djvu with the same convenience, annotation and other features as acrobat ?

Thanks a lot.
Автор: iit512
Дата сообщения: 28.07.2009 03:10
http://djvu-soft.narod.ru/soft (in Russian, but Google Translate could help)
Автор: Tulon
Дата сообщения: 28.07.2009 08:16
drcode
I haven't seen any point-to-point comparison of ScanTailor vs ScanKromsator vs BookRestorer. The latter two may have features that Scan Tailor lacks (zones in SK, correction of geometric distortions in BR), but none of them can beat ST in ease of use.

For a good DjVu reader, try WinDjVu.
Автор: monday2000
Дата сообщения: 28.07.2009 08:52
drcode

Цитата:
Is there a software that can be used to convert djvu to pdf

http://djvu.sourceforge.net/doc/man/ddjvu.html

Цитата:
to read djvu with the same convenience, annotation and other features as acrobat

http://windjview.sourceforge.net/
http://djvu.sourceforge.net/djview4.html

Цитата:
Can anyone list the names of softwares for book processing

http://www.djvu-soft.narod.ru/scan/scan_and_share_1_07_eng.rar

Добавлено:

Цитата:
For example, compare scantailor with scankromsator and book restorer and any other tools, and list their merits and demerits in a tabular fashion ?

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.