Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: StanFreeWare
Дата сообщения: 09.02.2011 05:43
RiffSkill

Вы, видимо, недопоняли концепцию полей.

Результирующий размер полей задается по странице с максимальным размером. Ее можно найти с помощью раскрывающегося списка сортировки под панелью предпросмотра на стадии Полезная область.

У вас после задания полей размер страницы и расположение информации на ней получились таким же, как и у оригинальной бумажной страницы.
И это правильно.

Более того, для лучшего соответствия форматированию оригинальной книги поля сверху и снизу на максимальной странице, скорее всего, стоит еще увеличить, до касания границ бумажного оригинала.

Удалять обложки из проекта не нужно. Флажок "Выровнять размеры с другими страницами" и цветной/серый режим вывода именно для них.

Советую еще разок внимательно перечитать Быстрый старт

P.S. Как бы убедить Tulon'а сделать верхнее и нижнее поля по-умолчанию тоже в 10 мм?...
Автор: alpopo
Дата сообщения: 09.02.2011 07:51
StanFreeWare
Цитата:
Результирующий размер полей задается по странице с максимальным размером
Не думаю, что поля и размер страницы связаны. Поля это поля, а размер страницы это размер. Когда обложка очень большая и хочется всю ее поместить на страницу, приходится уменьшать размер исходного скана в другом ПО, чтобы после обработки в СТ обложка не вылазила за размеры самой большой информативной страницы. Попадаются сканы с разным размером изображений. Тут приходится вручную подгонять "выпавшие" размеры под размер основной массы сканов, чтобы на выходе СТ получить страницы с одинаковым наполнением.
Цитата:
Более того, для лучшего соответствия форматированию оригинальной книги поля сверху и снизу на максимальной странице, скорее всего, стоит еще увеличить, до касания границ бумажного оригинала.
Проблема в том, что оригинал - это исходный скан. Все остальное форматирование грубо говоря не есть оригинал. Поля при форматировании оригинала стараюсь выбирать минимальными (2), поскольку они не несут информативной нагрузки, а только занимают место. Например при форматировании стихов можно выбрать размер страницы по самому большому стихотворению и поля сделать минимальными. Размер обложки подогнать под этот размер.Убрать желтый фон при обработке в ч/б варианте. Это уже не оригинал. Повсей видимости задача форматирования не сохранить оригинал, а максимально его приспособить к компьютерному чтению (с монитора). Тут лишние поля по пол страницы наверное не нужны
Автор: C0USIN
Дата сообщения: 09.02.2011 08:02
alpopo

Цитата:
Когда обложка очень большая и хочется всю ее поместить на страницу, приходится уменьшать размер исходного скана в другом ПО, чтобы после обработки в СТ обложка не вылазила за размеры самой большой информативной страницы.

Зачем уменьшать обложку? Ее размер совпадает с размером остальных страниц только если книга в мягком переплете. В большинстве остальных книг обложка чуть больше внутренних страниц и это нормально.

Цитата:
Попадаются сканы с разным размером изображений.
Нам же по барабану размер изображений? Все равно они обрезаются по полезной области и потом уже реконструируются реальные поля и от них уже будет зависеть размер страницы. Связь полей и размера страницы очевидна.
Автор: alpopo
Дата сообщения: 09.02.2011 08:13
C0USIN
Цитата:
Зачем уменьшать обложку? Ее размер совпадает с размером остальных страниц
Размер обложки на величину полей больше информативной части остальных страниц. В "чужих" сканах, где цветную обложку сканируют отдельно от остальных страниц и выбирают иное разрешение, ее размер может быть очень большим
Цитата:
Нам же по барабану размер изображений?
В этом случае у Вас могут быть страницы на которых полезная область "малого скана" будет занимать только половину размера остальных "нормальных" страниц
Цитата:
обрезаются по полезной области
и вкладываются в максимальный размер страницы, если размер страниц выравнивается

Автор: DikBSD
Дата сообщения: 09.02.2011 13:43

Цитата:
StanFreeWare


Цитата:
P.S. Как бы убедить Tulon'а сделать верхнее и нижнее поля по-умолчанию тоже в 10 мм?...

Я писал Tulon`у о возможности расширения опций и т.д. в программе. Он сторонник минимизации интерфейса - так проще для большинства пользователей. Это так, он прав. Но мы договорились (жду окончательного письма от него), что он сделает ветку в проекте, где будет разрабатываться ST для "продвинутых" пользователей., и в эту ветку будут вливаться все изменения, дополнения и тд. из основной, официальной ветки программы, ST для простых пользователей. Т.е. новая ветка будет содержать тот же код, что и нынешняя, только в ней будут разрабатываться различные фичи...
Когда он создаст эту ветку, первым делом я планирую создать управление настройками по умолчанию...
Автор: C0USIN
Дата сообщения: 09.02.2011 14:37
alpopo
Цитата:
Размер обложки на величину полей больше информативной части остальных страниц.
Совершенно верно. Либо обложка чуть больше.


Цитата:
обложку сканируют отдельно от остальных страниц и выбирают иное разрешение

А какие проблемы? Нас не должно беспокоить разрешение. Главное, чтобы оно было прописано в свойствах сканов. Поля же проставляются согласно физическим размерам страниц а не пиксельным.

Или вы в jpg/bmp сканируете? Тогда да

Цитата:
могут быть страницы на которых полезная область "малого скана" будет занимать только половину размера остальных "нормальных" страниц
Автор: alpopo
Дата сообщения: 09.02.2011 14:59
C0USINДа в основном приходится работать с jpg. Если в СТ работа с jpg и tiff существенно различаются, то эти различия надо где-то перечислить (имею ввиду не качество букв, а размеры полей, страниц, различия в загрузке исходных сканов и т.д.). В СТ я загружаю изображение измеряемое в пиксельном измерении и могу ему задать на этапе загрузки, если СТ его просто так не взял любое (150-600) разрешение. Вот именно этим разрешением и будет определяться физический размер загруженных страниц и видимый размер полей. А если пиксельные размеры входных изображений отличаются в 1,5-2 раза (и не вы их сканировали), то в 1,5-2 раза будут отличаться и размеры страниц вСТ. В этом случае приходится выравнивать (подбирать) пиксельные размеры исходных изображений, будь то обложки или какая-то группа страниц сосканированная почему-то с иным разрешением и в силу этого имеющая разные пиксельные размеры. Ведь исходные страницы на сканере предполагаем имели один и тот же физический размер
Автор: C0USIN
Дата сообщения: 09.02.2011 15:39
alpopo
Различия несущественны и описаны в документации кажется.
Просто если разрешение исходных сканов утеряно, то его нужно указать вручную. Для этого при создании проекта там есть галка "править DPI". И для разных страниц можно проставить там реальные DPI.

Если не указывать DPI, то не только размер полезной области будет в два раза отличаться, но и буквы будут соответственно в два раза меньше

Добавлено:

Цитата:
В этом случае приходится выравнивать (подбирать) пиксельные размеры исходных изображений

Не пиксельные размеры подбирать нужно а DPI.
Автор: alpopo
Дата сообщения: 09.02.2011 16:07
C0USIN
Цитата:
Не пиксельные размеры подбирать нужно а DPI
Это занимает намного больше времени. Подбирать DPI при загрузке это как минимум все время открывать новый проект, а половину работы вы уже сделала в старом проекте. Попробуйте описать и выполнить вашу методику. Похоже с этим вы еще не сталкивались
Автор: C0USIN
Дата сообщения: 09.02.2011 16:12
Странно. Я сейчас специально скормил ST пачку jpg с разными разрешениями. Он автоматом проставил где 150 а где 300 dpi. Ни разу не ошибся. О каком времени идет речь?

Хотя нет. Я ошибся. Там разрешение было зашито в свойствах файла. Видимо jpg тоже умеет хранить dpi.
Автор: alpopo
Дата сообщения: 09.02.2011 16:19
C0USINРечь о том, когда СТ предлагает установить DPI вручную. А про автомат это интересно и не задокументировано? Как этим автоматом пользоваться? В каких случаях он работает?
Автор: C0USIN
Дата сообщения: 09.02.2011 16:47

Цитата:
Подбирать  DPI при загрузке это как минимум все время открывать новый проект

При добавлении страниц в существующий проект тоже можно вручную указать DPI если оно не указано в метаданных файла. Неудобно только что нельзя добавить пачку страниц. Только по одной позволяет.
Автор: StanFreeWare
Дата сообщения: 09.02.2011 20:30
alpopo
Нет никакого автомата. Есть механизм, оценивающий прописанное в свойствах изображения DPI. И если оно явно некорректное, предлагается изменить его пользователю (опять же в разумных для данного пиксельного разрешения пределах).
Автор: iit512
Дата сообщения: 10.02.2011 22:05
Умоляю, сделайте автосохранение!
Ужасно неприятно перезапускать весь вывод сначала, когда большая часть уже выведена, а СТ почему-либо упал. (Не воспроизводится, проверял). Особенно когда множество страниц в смешанном режиме, и все равно надо перепроверять зоны картинок.
Автор: OleM2k
Дата сообщения: 13.02.2011 14:03
Вопрос знатокам: сколько на вскид может стоит обработка отсканированной книги?
Заранее спасибо за ответ.
Автор: slava_kry
Дата сообщения: 13.02.2011 14:43
OleM2k
Сделайте одну и поймёте.
Автор: ycheff
Дата сообщения: 13.02.2011 15:24

Цитата:
сколько на вскид может стоит обработка отсканированной книги?


Зависит
от потраченного времени, которое зависит
от количества сканов,
от качества сканов (от dpi, от того, одинаковы ли dpi у сканов, от грязи на сканах...)
от быстродействия компа,
от требуемого качества обработки...
от типа книги (djvu, pdf...)
от необходимости ocr

Средняя по размерам, простая книга может потребовать 1-2 часа работы.
Со сложностью время может заметно вырасти.
Автор: OleM2k
Дата сообщения: 14.02.2011 08:23
slava_kry
нема питань! оттого и задаю вопрос
ycheff
Спасибо за ответ!
Как мне видется, некоего списка цен (ок-ок - прайса) не существует.
Т.е. нет возможности отправить кому либо файл и согласовать стоимость работ.
Если так дело и обстоит, то ycheff, не утруждайте себя ответом.
Вы и так описали все, что необходимо при разговоре с предполагаемым заказчиком.

Спасибо Вам за внимание и ответ!
Автор: monday2000
Дата сообщения: 16.02.2011 17:54
Я снова завёл в Википедии статью о Scan Tailor:

http://ru.wikipedia.org/wiki/Scan_Tailor

Она там уже ранее создавалась, но потом её убрали - по 2 мотивировкам:

1. Малозначимость (теперь ИМХО этот недостаток давно преодолён).
2. Нарушение авторских прав текста (кто-то бездумно взял с моего сайта описание СТ и воткнул его, видимо, в статью) - это вообще по-глупости получилось.

Приглашаю всех желающих подправить эту заметку. Тем более, что мне не удалось там исправить пару мелких косячков в оформлении статьи - если кто хорошо знает Вики-синтакс, подправьте, пожалуйста.

PS Я просто подумал, что СТ давно уже должен быть в Википедии - в Википедии есть статьи и о гораздо менее значимых программах.
Автор: monday2000
Дата сообщения: 17.02.2011 10:10
Я сумел подправить все косяки в http://ru.wikipedia.org/wiki/Scan_Tailor и добавил туда ещё немного информации.
Автор: ndch
Дата сообщения: 17.02.2011 20:16
monday2000
Спасибо. Что бы мы без Вас делали. Даже и не знаю.
Автор: monday2000
Дата сообщения: 18.02.2011 08:04
Написал Tulon про Википедию, он посмотрел и одобрил.
ndch

Цитата:
Спасибо. Что бы мы без Вас делали. Даже и не знаю.

Не имели бы статью о Scan Tailor в Википедии ещё очень долго.
Автор: Nick222
Дата сообщения: 21.02.2011 23:34
У меня почему-то падает каждый раз при попытке отсортировать страницы по возрастающей ширине (высоте).

Ubuntu 10.10-64, Gnome.
Версия ST из дистрибутива ОС.

Куда писать о падениях, подскажите, плз...?

Кстати, значимо ли то, что он вроде как на Qt, а у меня Gnome?
Автор: OleM2k
Дата сообщения: 22.02.2011 09:23
не только для Nick222 и практически не в тему: пока с 8-й на 10-ю не переехал и в лом компилить - юзаю из под вайны виндовую
но иные Qt-шки на Gnom-е спокойненько так себе себя чувствуют...
Автор: alpopo
Дата сообщения: 22.02.2011 14:38
DikBSDЗамечание по использованию СТ. Иногда приходится делать книжки у которых например тексты программ напечатаны на сером фоне. Заметил, что если на странице серый фон покрыт полезной зоной, то проходит ч/б вывод. Если в полезной зоне пол текста на белом фоне пол на сером, то серое выводится как черный прямоугольник(не распознается как ч/б текст).
Нельзя ли в смешанном выводе в свойствах зоны (покрывающей серое место) указать ч/б вывод и подрихтовать существующий алгоритм выделения текста с серого фона именно к этому случаю?
Автор: ycheff
Дата сообщения: 22.02.2011 16:24
alpopo
В режиме Смешанный переходите к зонам картинок, выделяете зону и делайте с ней, что хотите - хоть добавьте, хоть вычитайте из зоны картинки.
Автор: StanFreeWare
Дата сообщения: 22.02.2011 20:45
ST Set Content обновился до 0.2 - добавилось инкрементное задание изменения размера, поиск по имени картинки, копирование граничных значений непосредственно из таблицы.
Автор: VidelSamogO
Дата сообщения: 24.02.2011 04:39
StanFreeWare
Если не сложно, выложите скрин-видео типовой работы со своими утилитами. С демонстрацией конфигурации системы. А то тут я наблюдаю некоторые...
Автор: Yevgenijz
Дата сообщения: 24.02.2011 06:50

Цитата:
По сравнению со СканКромсатором программа обеспечивает большее удобство для использования, большую интерактивность и при этом не меньшую автоматизацию процесса.

Ржунимагу!
Попробуйте СканТэйлором открыть и отредактировать один файл-картинку!
Ни хрена не получится! Придётся открывать ВСЮ папку и потом вычеркивать из неё все ненужные файлы.
А в СканКромсаторе это как 2 пальца об асфальт (вариант 2 байта переслать)

А может СканТэйлор нарезать в лапшу PDF-ку или DjVu-шку на отдельные сканы? А может уменьшить в картинке количество цветов?(напр. реально в картинке используются 3 цвета: синий, черный и белый, а картинка сохранена в виде как всегда 24-битных цветов и если уменьшить количество цветов, можно выиграть в объеме картинки с одновременным улучшением качества картинки)
А может? А может? Можно ещё долго продолжать список того, что может СканКромсатор и не может СканТэйлор, только вот нужно ли?
В СканТэйлоре тоже есть кое-что, что в нем реализовано лучше, чем в СканКромсаторе, напр. перекос страниц можно устранять не только автоматически(это делает и СканКромсатор), но и вручную! Это бывает полезно, если рисунок на странице например изображает лист газеты, наклоненный специально, а не как результат кривых рук сканировщика.
В общем, в каждой из упомянутых программ найдется то, что она умеет делать лучше, либо делает только она, так что нельзя утверждать, что СканТэйлор лучше СканКромсатора!

Автор: StanFreeWare
Дата сообщения: 24.02.2011 07:10
Yevgenijz
Перечитайте еще раз приведенную вами цитату. Там ни слова про "обладает превышающим СК функционалом" или "во всем лучше, чем СК".
Так что продолжайте ржать,

Цитата:
только вот нужно ли?


Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.