Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: denver 22
Дата сообщения: 21.01.2009 23:25
Arceny
Спроси что-нить по-легче. Я - строитель, а не программист . Как написано было компилировать, так и компилирую. Тупо , почти.
Автор: Tulon
Дата сообщения: 21.01.2009 23:58
are

Цитата:
все страницы остаются помечены большим знаком вопроса до тех пор, пока я не тыкну в каждую страницу мышкой.

Вопросительный знак означает, что для отображения страницы в виде, соответствующем данному этапу (например с рамкой контента) - недостаточно данных. Тыкать вручную необязательно. Во первых можно запустиь пакетную обработку. Она доступна на любых этапах, хотя на этапах "Исправление ориентации" и "Макет страницы" она бесполезна, поскольку эти этапы ручные, что впрочем также не означает, что на них надо кликать на каждой картинке. Это во первых. Во вторых, вы можете вообще не заходить на тот или иной этап, а сразу перейти на один из последующих, где либо запустить пакетную обработку, либо шагать по страницам вручную. Когда обрабатывается страница, все стадии до и включая текущую будут так или иначе пройдены, видите вы их или нет. Поэтому стадии можно спокойно пропускать, а при необходимости возвращаться назад и вносить изменения. Из этого правила есть одно исключение - нельзя перейти на стадию Вывод, не обработав перед этим все страницы на стадиях "Полезная область" или "Макет страницы". Это потому, что скажем изменения рамки контента одной страницы может потребовать изменений размеров других.


Цитата:
2) сохранил на всякий случай файл-задание, включил debug и запустил processing.

жду результатов. Указания на шаги "fix orientation - split pages - ..." исчезли, а все страницы помечены знаком вопроса. Ничего видимым образом не происходит, но процессор занят.

В режиме пакетной обработки убирается вся левая панель, это нормально. Остановить пакеьную обработку можно либо через меню, либо кликнув по какой-нибудь странице в ленте предпросмотра. Кстати режим отладки в пакетном режиме игнорируется. А вот по поводу "Ничего видимым образом не происходит" - должен перемещаться указатель текущей страницы в ленте предпросмотра. А при выходе из пакетного режима должна загрузиться большая картинка в центральную зону. Я бы на вашем месте все-же попробовал нативную версию под Linux собрать. Есть подозрение что это Wine виноват.


Цитата:
Нельзя ли иметь возможность запустить СТ в таком неинтерактивном режиме, чтобы он всё делал на автомате и просто давал бы тиффы в конце?

Идем сразу на "Макет страницы" (Page Layout). Там запускаем пакетную обработку. Когда завершиться, смотрите на размеры обобщенных полей. С помощью линка "Самая широкая (высокая) страница", находите страницы, где ошибся определитель рамки. Для таких страниц возвращаемся на шаг назад и правим рамку вручную. Теперь идем на Вывод и там запускаем пакетную обработку. По завершении получаем пачку TIFFов. При необходимости можно опять-же вернуться на любой этап, внести изменения, и потом опять на вывод - и он перегенерит данную страницу.

Добавлено:

Цитата:
какой компилятор и версия Qt используется?

Скорее всего Qt 4.4.3 и gcc 3.x.x, который шел вместе с Qt.
Автор: are
Дата сообщения: 22.01.2009 08:53
Tulon

всё равно получил совершенно белые тифф файлы (в которых прописано разрешение 232 пикселя на сантиметр , размер в пикселях вроде правильный для 600дпи)

наверно это глюк wine.

только после вашего объяснения стало понятно, что Batch processing можно (и/или нужно) применять на каждом шаге обработки. Я раньше предполагал, что эта операция делается в конце (т.к. она вынесена в отдельное меню) после того, как все шаги будут пройдены.

ещё одна деталь. Размеры страниц получаются одинаковые или разные? Такое впечатление, что я выставляю поля для страниц и щёлкаю "Apply to all", т.е. у всех страниц к полезной рамке будут добавлены одинаковые поля. А хотелось бы , чтобы все страницы имели одинаковые размеры, а полезная рамка была бы как-то выравнена внутри.

и всё же хотелось бы иметь возможность запускать СТ полностью автоматически, т.е. без GUI. Генерировать проект-файл можно руками, со всеми необходимыми настройками, и вперёд.

спасибо!
Автор: Arceny
Дата сообщения: 22.01.2009 09:45
Сегодня корректируя полезную область, чтобы номера страниц влезали в ёнеё, поймал себя на мысли, что гораздо проще было бы изменять размер одним кликом (можно двойным) мыши по точке, а не хватанием и перетягиванием.
То есть кликаем 2 раза в углу - рамка с этой стороны растягивается до точки клика. Ну и естественно это должно работать только на углах...
Автор: bolega
Дата сообщения: 22.01.2009 09:57
Вчера попробовал еще на одной книге, в режиме mixed. Иллюстрации почти на каждой странице. В половине случаев картинки были определены неверно - вместе с ними прихватывалась часть текста (до 4-20 слов). Это было из-за того, что на скане просвечивало содержимое обратной стороны, хотя и еле заметно. Но тем не менее, там где просвечивающаяся картинка попадала на текст, текст распознавался вместе с фоном как картинка.
Взял еще один скан, бледный. Там помимо текста была фотография туманности, но очень бледная. Как картинка она вообще не распозналась, получилось белое пятно с мусором. Как ее все-таки спасти, непонятно.
Думаю, подобные сканы Вы и сами без труда найдете. Я ничего доказывать не собираюсь, это больше в Ваших интересах. Я просто информирую в надежде на улучшение.

Еще один пример. Скан из книги про оригами. Иллюстрация-квадратная вазочка, стенки красные, дно - желтенькое.
При распознавании СТ определил маску картинки так, что в нее попали только стенки вазочки, а дно - нет. На выходе получился красный заборчик с белой дыркой вместо дна (Otsu желтый цвет перевел в белый).
Вообщем, Ваша категоричность и безмерная вера в автоматику не совсем правильна, Вы просто мало сканов повидали.
Автор: savage2000
Дата сообщения: 22.01.2009 10:38
monday2000


Цитата:
Представьте себе, что я вот не разобрался.

От того, что вы лично не разобрались, ваш пример не станет более удачным. СК и СТ с точки зрения интуитивности интерфейса - просто земля и небо.


Цитата:
Это я лишь объяснял, почему потребность в альтернативе ИМХО ещё не исчерпана.

Как-то вы странно и нелогично объясняете свое видение потребности в альтернативе - внушая разработчику, что он вроде раба на галерах: его желания, видите ли, теперь второстепенны - несмотря на то, что свою работу он делает бесплатно, на чистом энтузиазме и к тому же выкладывает ее с полными исходниками.


Цитата:
Во-первых, чтобы Tulon'у не было слишком тоскливо одному заниматься такими вещами.

Ну да, конечно, - если вы скажете разработчику что-нибудь вроде "ваше хочу/не хочу уже не имеет никакого значения" или "я уже просто не могу себя заставить хотя бы просто ещё раз запустить Вашу программу", то наполните его радостью и оптимизмом.


Цитата:
Во-вторых, на Руборде нет топика "работы над альтернативами СК". Свой такой топик я заводить не хочу - т.к. занимаюсь алгоритмами эпизодически.

А может всё-таки заведете? Про алгоритмы можете здесь рассказывать, а заявления, подобные указанным выше, будете постить туда. Так будет гораздо лучше для всех.
Автор: Tulon
Дата сообщения: 22.01.2009 11:08
are

Цитата:
всё равно получил совершенно белые тифф файлы (в которых прописано разрешение 232 пикселя на сантиметр , размер в пикселях вроде правильный для 600дпи)

А вот у меня никак не хотят воспроизводиться пустые страницы. Но с помощью denver 22, у которого они воспроизводятся, думаю разберусь в ближайшие дни. Да, кстати, рамка контента у вас нормально определилась? Без рамки и контента не будет.

Arceny

Цитата:
Сегодня корректируя полезную область, чтобы номера страниц влезали в ёнеё, поймал себя на мысли, что гораздо проще было бы изменять размер одним кликом (можно двойным) мыши по точке, а не хватанием и перетягиванием.
То есть кликаем 2 раза в углу - рамка с этой стороны растягивается до точки клика. Ну и естественно это должно работать только на углах...

Одним никак нельзя - драг не будет работать. Двойным в принципе можно, но как-то не очевидно. С новым алгоритмом вам гораздо реже придется что-то править вручную, так что врядли стоит здесь что-то менять.


Цитата:
только после вашего объяснения стало понятно, что Batch processing можно (и/или нужно) применять на каждом шаге обработки.

На каждом - явный перебор. Я советую два раза - один раз на Select Content (Полезная Область), а другой раз на Output (Вывод).


Цитата:
ещё одна деталь. Размеры страниц получаются одинаковые или разные? Такое впечатление, что я выставляю поля для страниц и щёлкаю "Apply to all", т.е. у всех страниц к полезной рамке будут добавлены одинаковые поля. А хотелось бы , чтобы все страницы имели одинаковые размеры, а полезная рамка была бы как-то выравнена внутри.

Да, здесь хелп тоже не помешал бы. Те поля, которые можно менять на стадии "Макет страницы" (те что между сплошными линиями) я называю жесткими. То есть как минимум такие поля у страницы точно будут. Далее, если выставлен флаг "Выравнивать с другими страницами", то будут добавлены дополнительные, "мякгие поля", чтобы довести размер этой страницы до размеров самой высокой (контент + жесткие поля) и самой широкой страницы. Параметры выравнивания (центрирование и прочее) определяют, с каких сторон будут добавлены мягкие поля. Мягкие поля на стадии "Макет страницы" отображаются между сплошной и пунктирной линией.


Цитата:
и всё же хотелось бы иметь возможность запускать СТ полностью автоматически, т.е. без GUI. Генерировать проект-файл можно руками, со всеми необходимыми настройками, и вперёд.

Совсем без GUI он будет бесполезен, поскольку, хоть где-то да ошибется.

bolega
Да, в конце концов придется делать и ручное выделение картинок тоже.
Автор: monday2000
Дата сообщения: 22.01.2009 11:52
savage2000

Цитата:
Про алгоритмы можете здесь рассказывать, а заявления, подобные указанным выше, будете постить туда.

Как у Вас всё просто...
Автор: denver 22
Дата сообщения: 22.01.2009 18:15
are
Посмотри одно из первых описаний последовательности действий - ЗДЕСЬ.
Я по нему начал работать и почти ничего с того времени не изменилось. Только малость скорректировал, исходя из нюансов в различных случаях.

Добавлено:

Цитата:
Да, в конце концов придется делать и ручное выделение картинок тоже.

Рад слышать. Действительно, твой подход к автоматизации был из-за малого количества обработанных книг. Большое число настроек это далеко не всегда сложность работы с программой. Вот с чем могу согласиться, так это со сложностью реализовать эти настройки так, чтобы они стали интуитивно понятны.
Хотя на примере are видно, что хоть какие-то основы понимание книгопроизводства надо иметь. Иначе даже при таком оптимизме можно и разочароваться даже в относительно простой программе, какой является Scan Tailor.
Автор: superpavlo
Дата сообщения: 23.01.2009 06:15
Обьясните мне плиз, что я не так делаю?
1. сканирую разворот журнала в цвете 300дпи
2. сохраняю в Tiff с сжатием LZW
3. скармливаю файл в ST.
4. прохожу все пункты с разрезанием, обрезанием и т.д
Но на выходе получаю только разрезанный лист, но не обрезанными краями.
Как добиться от программы чтоб она не только разрезала разворот но и делала обрезку, нахренаж тогда существует опция с полезной областью???
Автор: Tulon
Дата сообщения: 23.01.2009 10:15

Цитата:
Обьясните мне плиз, что я не так делаю?
1. сканирую разворот журнала в цвете 300дпи
2. сохраняю в Tiff с сжатием LZW
3. скармливаю файл в ST.
4. прохожу все пункты с разрезанием, обрезанием и т.д
Но на выходе получаю только разрезанный лист, но не обрезанными краями.
Как добиться от программы чтоб она не только разрезала разворот но и делала обрезку, нахренаж тогда существует опция с полезной областью???

Журналы - это тяжелый случай из-за фоновых картинок, которые могут доходить, а могут и не доходить до самых краев. При работе с журналами стадия Select Content (Полезная область) будет часто ошибаться, Эти ошибки надо править руками.
Автор: dma200899
Дата сообщения: 23.01.2009 21:51
Мне кажется, Вам пишут про другое. Я эту опцию уже просил, но вы, как уже стало нормой, реальные запросы сканировщиков послали.

Журнал цветной. Края рваные. СТ выделил зону контента, но все что в исходнике на полях было, точно в том же виде и отразил - все рваные края.
Так как заливку полей белым (при серых оригиналах) сделать почему-то невозможно.

А при черно-белых оригиналах - поля хоть и белые (вследствие бинаризации), но дописываемые СТ "мягкие поля", когда они выходят за край листа - черные.
(И требуется еще 2 раза через СК прогнать, чтобы черноту убрать).
Красота.

И просто безумно удобно.
Автор: denver 22
Дата сообщения: 23.01.2009 21:55
Внимание - СЮРПРИЗ!
Скоро выйдет в свет Справка по программе.

Добавлено:
Итак, Справка к программе Scan Tailor - http://narod.ru/disk/5191418000/ScanTailorHelp20090123.zip.html
Это первая версия. Содержит самое основное. Здесь же добавлено "Описание работы в программе Scan Tailor" в виде краткого руководства.
Автор: Arceny
Дата сообщения: 23.01.2009 23:36
А можно ли в чём-то отличном от 7z ? Я конечно понимаю что он сильно жмакает, но это НЕ стандартный формат архива...

И ещё замечание: в архиве нет подпапки и если я запустил бы 7za x архив то мне завалило бы картинками каталог

Update: предлагаю создать где-нибудь на wiki страницу с руководством и там всем миром править
Автор: Tulon
Дата сообщения: 24.01.2009 00:02
dma200899

Цитата:
Журнал цветной. Края рваные. СТ выделил зону контента, но все что в исходнике на полях было, точно в том же виде и отразил - все рваные края.
Так как заливку полей белым (при серых оригиналах) сделать почему-то невозможно.

Попробуйте режим Смешанный. Если он вас не устроит, можно рассмотреть другие варианты.


Цитата:
А при черно-белых оригиналах - поля хоть и белые (вследствие бинаризации), но дописываемые СТ "мягкие поля", когда они выходят за край листа - черные.

А вот такого не должно происходить. Пример в студию!

Arceny

Цитата:
предлагаю создать где-нибудь на wiki страницу с руководством и там всем миром править.

Хорошая мысль. По моему sourceforge предоставляет какой-то wiki движок. Надо будет посмотреть. Если забуду - напомните мне.

Добавлено:
Баг с пустыми страницами на выводе я надеюсь что пофиксил. Фиксил вслепую, потому как на PowerPC он никак не хочет воспроизводится - видимо промежуточные вычисления с плавающей точкой имеют тут большую точность. Баг как раз с этим связан. В общем надо собрать новую версию и проверить.
Автор: Arceny
Дата сообщения: 24.01.2009 00:10
Начал оформлять на своей Wiki, потом при желаними можно будет перенести куда нибудь ещё
Автор: denver 22
Дата сообщения: 24.01.2009 00:13

Цитата:
это НЕ стандартный формат архива...

Весьма спорно. Он даже под Linux есть. Открытые стандарты сейчас всё больше продвигаются. Вот уж не только из-за сжатия его использую.
Тем не менее, замечания принял и исправил. Новая ссылка на Справку в том же топике.
Автор: Arceny
Дата сообщения: 24.01.2009 00:19
denver 22
Я не спорю, что он есть Но он есть не из коробки. Кстати, zip кажется тоже нету Есть gzip|bzip2, но zip по крайней мере я видел во всяких Ubuntu стандартной комплектайии


Добавлено:
Забыл что на моей wiki анонимные правки закрыты. Регистрация там общая с форумом. Или же куда-то в другое место надо перебираться, не такое подвальное как моё
Автор: Tulon
Дата сообщения: 24.01.2009 00:32

Цитата:
Я не спорю, что он есть Но он есть не из коробки. Кстати, zip кажется тоже нету Есть gzip|bzip2, но zip по крайней мере я видел во всяких Ubuntu стандартной комплектайии

Мне кажется, что 7z в последней Ubuntu все-же из коробки. Хотя может я его и руками ставил, но уже забыл когда. Так или иначе, 7z все же лучше чем rar для линуксоидов. А zip безнадежно устарел, к тому же там возможны проблемы с русскими именами файлов.

Добавлено:
Посмотрел, что SourceForge предлагает в плане wiki. Предлагают MediaWiki и Trac (это баг трекер + Wiki + плюс еще всякая всячина). Про Trac тут уже упомянали. У кого ни будь есть мнение, что лучше ставить?
Автор: Arceny
Дата сообщения: 24.01.2009 00:45
Trac имеет встроеные средства для работы с svn , систему реквестов типа багзилы, написан на питоне.

Медиавики - просто вики разметка, очень продвинутый движок. Написано на пыхыпы. По ссылке выше - медиавики.
Автор: Tulon
Дата сообщения: 24.01.2009 01:00
На чем оно написано меня мало волнует. В админском интерфейсе SourceForge парой кликов активируется хоть тот хоть другой. Но если MediaWiki проще в использовании и мощнее (естественно в плане Wiki) - тогда наверное ее и надо ставить.
Автор: superpavlo
Дата сообщения: 24.01.2009 01:12
Почитал справку, понял, что делал все правильно.
Попробую обьяснить по новой- перехожу на этап "полезная область" корректирую в ручную границы области, запускаю пакетную обработку, но на выходе опять имею картинку с необрезанными краями. как будто этап с "полезной областью" не проходил...
Пробовал в различных вариациях, ничего не получается, прога прога разрезает разворот скана пополам и все....
Автор: Tulon
Дата сообщения: 24.01.2009 01:20

Цитата:
Попробую обьяснить по новой- перехожу на этап "полезная область" корректирую в ручную границы области, запускаю пакетную обработку, но на выходе опять имею картинку с необрезанными краями. как будто этап с "полезной областью" не проходил...
Пробовал в различных вариациях, ничего не получается, прога прога разрезает разворот скана пополам и все....

Хорошо бы скриншоты выложить. Хватит двух: сдадии "Макет страницы" и "Вывод".
Автор: superpavlo
Дата сообщения: 24.01.2009 01:44
Разрезка
Полезная область автоматически
Полезная область в ручную
Макет страницы
Вывод

Вот сам файл, может он заколдованный http://stream.ifolder.ru/10190671
Автор: Tulon
Дата сообщения: 24.01.2009 02:01
Что-то ipicture.ru не хочет показывть мне скриншоты. Попробуйте другого хостера картинок (imageshack.us например) или выложите архивом.
Автор: Arceny
Дата сообщения: 24.01.2009 03:14
Tulon

Я лично к trac склоняюсь, это всё-тки специально заточеная система для ведения проектов, а mediawiki - для энциклопедий/информационных ресурсов.

Очень мне нравится как на базе trac организован сайт http://asteriskpbx.ru/
Автор: superpavlo
Дата сообщения: 24.01.2009 03:19
Вот сканы архивом- http://stream.ifolder.ru/10191291
Автор: denver 22
Дата сообщения: 24.01.2009 10:08
Tulon, так значит ST оптимизирован для обработки журнальных сканов?
Можешь написать особенности обработки для них, исходя из базовой краткой инструкции в Справке?
Автор: Tulon
Дата сообщения: 24.01.2009 11:07
superpavlo
Режим вывода Цветной / Серый края действительно не обрезает. Можно попробовать режим Смешанный, только вряд-ли он даст хорошие результаты на цветном фоне. Вас бы устроило, если бы все что запределами рамки контента заливалосб бы белым? Если да, то я пожалуй добавлю такую опцию для режима Цветной / Серый.

denver 22

Цитата:
Tulon, так значит ST оптимизирован для обработки журнальных сканов?
Можешь написать особенности обработки для них, исходя из базовой краткой инструкции в Справке?

К сожалению нет. Журналы - сложный случай для СТ. Во первых определитель рамки будет постоянно ошибаться из-за фоновых картинок, а во вторых - непонятно как обрезать цветной фон.
Автор: superpavlo
Дата сообщения: 24.01.2009 11:34
2Tulon я, бы предложил два варианта зарамочного оформления :

1. заливка белым
2. просто обрезка
А, при ручной регулировке рамки, отрубать определитель и тупо обрезать все, что за рамкой...
Возможно?
Очень, бы хотелось, чтоб ST смог работать с цветными сканами, хотя бы частично в ручном режиме.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.