Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: Tulon
Дата сообщения: 12.12.2008 16:39
Я залил последние изменения в SVN. Думаю изменения тянут на новый релиз. Как только кто-нибудь соберет версию для винды, выложу релиз на сайт.

Изменения такие:
* Перед бинаризацией делаем выравнивание освещения. Теперь затененные участки бинаризуются как надо.
* Режим вывода Mixed, в котором происходит автовыделение картинок (по методу U235). Кртинки выводятся в сером / цветном режиме, остальное бинаризуется. В этом режиме также используется выравнивание освещения, причем оно делается даже для цветных картинкок.
* Despeckling (удаление мелких пятен) отключено от греха подальше. Частично его функции взяло на себя сглаживание перед выводом.

Стадия Select Content по прежнему не переносит затененного контента. Теперь доведение до ума этой стадии будет первоочередной задачей.
Автор: denver 22
Дата сообщения: 12.12.2008 23:37
Tulon
При компиляции на п.9 ошибка. Вот лог:
C:\build\scantailor-0.9.1\filters\page_split\VertLineFinder.cpp: In static member function `static std::vector<QLineF, std::allocator<QLineF> > page_split::VertLineFinder::findLines(const QImage&, const ImageTransformation&, int, DebugImages*, QImage*)':
C:\build\scantailor-0.9.1\filters\page_split\VertLineFinder.cpp:73: error: `morphGradientDetect' undeclared (first use this function)
C:\build\scantailor-0.9.1\filters\page_split\VertLineFinder.cpp:73: error: (Each undeclared identifier is reported only once for each function it appears in.)
mingw32-make[2]: *** [filters/page_split/CMakeFiles/page_split.dir/VertLineFinder.cpp.obj] Error 1
mingw32-make[1]: *** [filters/page_split/CMakeFiles/page_split.dir/all] Error 2
mingw32-make: *** [all] Error 2

Добавлено:
Что делать дальше?
Надо ли что-то удалить из каких-то папок для возобновления процесса?
Если будут ошибки и далее, буду писать на почту. Наверное так правильней будет.
Автор: Tulon
Дата сообщения: 13.12.2008 00:29
Забыл обновить один файл в SVN. Обновил.

Теперь обновитесь из SVN и продолжайте с того шага, где произошла ошибка, то есть с девятого (он же и последний).

Libtiff вы кстати патчили? Если нет, пропатчите согласно инструкциям, и прогоните шаг 7. Перекомпиляцию Qt я думаю можно пропустить, так что когда попросит принять лицензию - жмите N. Потом переходите к девятому шагу.
Автор: denver 22
Дата сообщения: 13.12.2008 10:33
Tulon
Программа скомпилирована. Смотри почту.

Вопросы:
1. "Режим вывода Mixed". Пока не понял где это. Как он работает? В конечном файле будет основа - с бинаризацией, а картинка "в сером / цветном режиме"? Если так, то это просто фантастика. Я после обработки в СК это совмещение делал вручную в PhotoShop (картинку тянул из скана-оригинала).
2. "Despeckling (удаление мелких пятен) отключено от греха подальше". Не понял, ты вообще отключил функция очистки сканов? Или только какую-то часть этой функции? Очистка-то является одним из важных этапов автообработки сканов. Благодаря ей в СК, я в несколько раз сократил время посточистки в PhotoShop. И уже возвращаться к этому не буду.
3. Почему-то только сейчас заметил: а можно сделать возможность регулировать ширину правой колонки (предпросмотр). А то там иногда широкие пустые поля остаются, неэкономно. Да и вообще чтобы гибко было.
4. Сейчас сравнил mingwm10.dll последней сборки и у себя. У тебя новее на 2,5 года. Как у меня так получилось? Нужно ли заменить на твой файл?

(повтор просьбы, которую в почту писал)
В интерфейсе программы прошу добавить информацию о версии рядом со "Scan Tailor", как у всех программ.
Автор: bolega
Дата сообщения: 13.12.2008 11:57
denver 22

Цитата:
Я после обработки в СК это совмещение делал вручную в PhotoShop (картинку тянул из скана-оригинала).

Интересно, а чем Вас не устраивала в SK команда merge picture-zones, которая делала автоматическое совмещение??
Автор: Tulon
Дата сообщения: 13.12.2008 12:49
denver 22

Цитата:
Программа скомпилирована. Смотри почту.

Получил. Пришлось правда идти на gmail и доставать его из папки Spam
Сегодня сделаю релиз.


Цитата:
1. "Режим вывода Mixed". Пока не понял где это. Как он работает? В конечном файле будет основа - с бинаризацией, а картинка "в сером / цветном режиме"? Если так, то это просто фантастика. Я после обработки в СК это совмещение делал вручную в PhotoShop (картинку тянул из скана-оригинала).

Это там где выбор между черно-белым и серым / цветным режимом.


Цитата:
2. "Despeckling (удаление мелких пятен) отключено от греха подальше". Не понял, ты вообще отключил функция очистки сканов? Или только какую-то часть этой функции? Очистка-то является одним из важных этапов автообработки сканов. Благодаря ей в СК, я в несколько раз сократил время посточистки в PhotoShop. И уже возвращаться к этому не буду.

Не было у меня времени доводить Deskecling до ума, а в нынешнем виде он только мешал. Вот я его и отключил пока-что. На серых сканах он в принципе не особенно нужен. С совсем мелкими пятнами сглаживание достаточно хорошо справляется.


Цитата:
3. Почему-то только сейчас заметил: а можно сделать возможность регулировать ширину правой колонки (предпросмотр). А то там иногда широкие пустые поля остаются, неэкономно. Да и вообще чтобы гибко было.

Может в одной из следующих версий, но это низкоприоритетная задача.


Цитата:
4. Сейчас сравнил mingwm10.dll последней сборки и у себя. У тебя новее на 2,5 года. Как у меня так получилось? Нужно ли заменить на твой файл?

Заменять не нужно. У меня просто версия MinGW другая. Брать нужно от той версии, которой собиралась программа.


Цитата:
В интерфейсе программы прошу добавить информацию о версии рядом со "Scan Tailor", как у всех программ.

Да, надо сделать окно About. Может кто логотип придумает и нарисует? А я вас в этом самом About упомяну. Желательно в векторном формате конечно.

Добавлено:
Выпустил версию 0.9.1 - качайте и пробуйте.
Автор: denver 22
Дата сообщения: 13.12.2008 16:55
bolega
Если "merge picture-zones" была ещё в ScanKromsator 5.6А Full, которую я ну хоть сколько-то времени изучал, то значит попросту не знал про такую возможность. Новые версии я уже пользовал на том уровне, что знал. Теперь посмотрю, спасибо.

Tulon
1. Тогда ответь мне просто, ты полностью выключил очистку?
Я ведь большей частью не с серыми сканами работаю (например, когда чищу чужие книги), поэтому заранее уточняю, чтобы для меня сюрпризом не стало.
2. Не только в About, на в верхней строке, где указывается название проекта и Scan Tailor. Т.е. чтобы отображалось например Scan Tailor 0.9.2.

Добавлено:
На сайте программа выложена в том виде, что я скинул или нет? Мне её заново качать у тебя?
Автор: Tulon
Дата сообщения: 13.12.2008 16:59

Цитата:
1. Тогда ответь мне просто, ты полностью выключил очистку?
Я ведь большей частью не с серыми сканами работаю (например, когда чищу чужие книги), поэтому заранее уточняю, чтобы для меня сюрпризом не стало.

Полностью, за исключением полей, которые просто заливаются белым во всех режимах кроме Color / Grayscale.


Цитата:
2. Не только в About, на в верхней строке, где указывается название проекта и Scan Tailor. Т.е. чтобы отображалось например Scan Tailor 0.9.2.

ОК, сделаю.

Добавлено:

Цитата:
На сайте программа выложена в том виде, что я скинул или нет? Мне её заново качать у тебя?

В том же виде, просто архив переименовал.
Автор: dma200899
Дата сообщения: 13.12.2008 21:38
Ну вот, опять. В обеих версиях.

На этапе "output" ничего не выполняется, кнопка "батч" недоступна.
Всё время горит надпись:
"ю кант оутпут
фёст ю нид ту процесс олл оф зем виз зе пэйж лейоут филтер"

А все файлы отпроцессены на предыдущей стадии.
И ничего не помогает (перещёлкивание между этапами).

Причем на 3 страничках - все нормально. На 600 - такая байда.

Порядок действий. 1) Гружу файлы. 2) Иду в Пэж Лейоут 3) Батч. 4) Иду в оутпут - и пустота.


И еще. Делал как-то ч/б файлы. Так там прога в тех местах, где исходной страницы не хватало, залила все поля черным. И что ? Как эту черную рамку удалять ?
Также почему-то и в новой версии, с "улучшенным алгоритмом бинаризации" изначально черно-белые сканы чистятся. А если я хочу файл таким как есть. Где кнопка "не применять фильтры" ?

Для 300 стр. тоже все нормально.
Там где-то переполнение памяти, видно, происходит.
Автор: Tulon
Дата сообщения: 13.12.2008 22:19

Цитата:
Порядок действий. 1) Гружу файлы. 2) Иду в Пэж Лейоут 3) Батч. 4) Иду в оутпут - и пустота.

Возможно баг проявляется только на определенном файле.
Попробуйте вот что:
После Batch Processing на Page Layout переключитесь на любой другой этап и потом обратно на Page Layout. Теперь медленно прокрутите ленту предпросмотра от начала до конца в поисках страницы с вопросительным знаком. Если найдете такую - заливайте этот файл на обменник а ссылку сюда или мне в личку.


Цитата:
И еще. Делал как-то ч/б файлы. Так там прога в тех местах, где исходной страницы не хватало, залила все поля черным. И что ? Как эту черную рамку удалять ?

Должна белым по идее. Если опять наткнетесь на такое - шлите пример. Код вывода в черно-белом режиме был переписан (теперь это частный случай режима Mixed), так что если там баг и был, то вполне возможно что его уже нет.


Цитата:
Также почему-то и в новой версии, с "улучшенным алгоритмом бинаризации" изначально черно-белые сканы чистятся. А если я хочу файл таким как есть.

Дайте пример что ли - типа вот файл, и вот эту деталь я хочу сохранить, а она удаляется.


Цитата:
Где кнопка "не применять фильтры" ?

Пришлось поискать в этом треде, зачем вам такое понадобилось. Оказалось, что таким образом вы хотите справиться с пропаданием настроек на этапе Page Layout. Но ведь они не должны пропадать - и соответственно нужно искать причину проблемы, а не бороться с ее следствием. Кстати это вполне может быть та же проблема, из-за которой вам не дают делать Output. В общем постарайтесь найти именно те файлы, из-за которых возникает проблема. Можете конечно весь проект куда-нибудь залить, если траффика не жалко.
Автор: monday2000
Дата сообщения: 13.12.2008 23:17
Я сделал новую заметку:

30. Бинаризация Gatos Thresholding

http://www.djvu-soft.narod.ru/bookscanlib/030.htm

Добавлено:
Подправил небольшой глючок в:

25. Бинаризация Sauvola Thresholding http://www.djvu-soft.narod.ru/bookscanlib/025.htm

28. Бинаризация Niblack Thresholding http://www.djvu-soft.narod.ru/bookscanlib/028.htm

Убрал одну лишнюю функцию из:

29. Фильтр Adaptive Wiener http://www.djvu-soft.narod.ru/bookscanlib/029.htm
Автор: Tulon
Дата сообщения: 14.12.2008 16:20
Тут кто-то говорил что хорошо бы завести отдельный форум для СТ. А тут как раз SourceForge начал предоставлять новую услугу - Hosted Apps. Они поставили и сконфигурировали несколько вэб приложений таким образом, что каждый проект получает как бы отдельную копию, с админским доступом и все такое. И среди этих приложений есть phpBB. В общем я сделал на нем форум и поместил ссылку на сайт. Не знаю, будут ли им пользоваться - не будут, так прикрою его. Регистрироваться надо не на самом форуме, а на главной странице sourceforge.net
Автор: monday2000
Дата сообщения: 14.12.2008 16:41
Я сделал новую заметку:

31. Бинаризация White Rohrer Thresholding

http://www.djvu-soft.narod.ru/bookscanlib/031.htm
Автор: denver 22
Дата сообщения: 15.12.2008 10:15
Может не совсем в тему. Только сказал, что в основном ч/б книги обрабатываю, как сразу попались 2 книги в сером, которые надо оптимизировать. Но они в 300 dpi.
Вопросы такие:
1. Scan Tailor сейчас готов к работе с такими сканами (я декодирую их до серых tiff)? Имеется ввиду разрешение.
2. Есть ли смысл при декодировании переводить их в 600 dpi?
Прошу сами вопросы не критиковать (я не претендую на профи уровень скан-обработки), а просто ответить на них.
Автор: Tulon
Дата сообщения: 15.12.2008 12:04

Цитата:
1. Scan Tailor сейчас готов к работе с такими сканами (я декодирую их до серых tiff)? Имеется ввиду разрешение.

Готов.


Цитата:
2. Есть ли смысл при декодировании переводить их в 600 dpi?

Подавайте СТ на вход файлы в том разрешении, в котором сканировали. Практически любое преобразование изображения ведет к потере четкости. В СТ делается всего одно комбинированное преобразование (масштабирование + вращение + сдвиг) - так что потери четкости минимальны. А если вы предварительно отмасштабируете свои сканы в 600 dpi - это уже будет два преобразования.
Автор: denver 22
Дата сообщения: 15.12.2008 15:08
Преамбула:
Как узнал об удалении Despeckling, решил эту программу не тестировать до её восстановления, т.к. с ч/б сканами мне она нужна. Но раз появились парочка книг в сером, возвращаюсь к ней.

Что замечено:
1. Не замечает номеров страниц, даже текст в некоторых случаях. При этом включает черные полосы по крайям (и даже просто светлые) в рабочую область. ИМХО, спотыкается иногда почти на пустом месте.
2. Режет текст вертикальными резаками (этого никак не ожидал). Довольно часто. Опять же ИМХО без особых на то оснований, т.к. по яркости текст не меняется.
3. Много случаев, когда текст (особенно у номеров страниц) "подрезается". Т.е. низ текста (несколько пикселей) обрезаются. Посмотрел результирующий эффект - это ошибка сразу бросается в глаза. Сверху тоже часто наблюдается подрезка.
4. Даже умудрился спутать сторону скана: вместо левого, хватанул правый. В результате вместо текста я получил полосу изгиба книги.

По пп. 1-4 могу скинуть сканы. Надо? По п.3 кину только 1 скан, на самом деле их очень много.

Догадываюсь, что возможно сказалось заниженное разрешение (300 dpi). Возможно часть из этих проблем тебе известна. Я лишь отчитываюсь о результатах.
Для интереса прогнал обработку в 0.9.0. Результат тот же.

Вопрос по программе:
Сделана обработка на Select content полностью. Хочу заменить 2 скана на другие. Точнее уже сделал. Прошу описать как это делать оптимально.

Попутно просьба, включить в горячие клавиши переход по сканам где-нибудь на левой стороне клавиатуры, например Q (предыдущий) и A (следующий). Так удобней работать.

Добавлено:
Вот и проблемные сканы: http://narod.ru/disk/4401898000/Test.zip.html (3,54 Мб). По папкам разложены в соответствии с вышеуказанными проблемами.

Посмотри, пожалуйста качество полученных ч/б сканов. Такое ощущение, что они стали совсем не читаемы. Что посоветуешь? Может не бинаризировать?

Добавлено:
Я в шоке. Несколько сканов стали чисто черными.
Вот несколько из них и пример полученного результата - http://narod.ru/disk/4402566000/Test2.zip.html (912 Кб)
Для информации: декодирование делал в DjVu Small 0.3.2.

Добавлено:
Попробывал оставить серый. И честно говоря не понял что изменилось. Всё, что вошло в конечный размер скана: грязь, прогибы книги и прочее - осталось.
Автор: Tulon
Дата сообщения: 15.12.2008 18:49

Цитата:
1. Не замечает номеров страниц, даже текст в некоторых случаях. При этом включает черные полосы по крайям (и даже просто светлые) в рабочую область. ИМХО, спотыкается иногда почти на пустом месте.

Select Content - слабое место на данный момент. Но я бы не сказал, что проблемы там на пустом месте.
Вот, посмотрите:

Черное обрамление - это не проблема, но только в том случае, если оно касается краев, а у вас оно не не касается. Чем вы этот скан обрабатывали? Или это такой хитрый режим у сканера?


Цитата:
3. Много случаев, когда текст (особенно у номеров страниц) "подрезается". Т.е. низ текста (несколько пикселей) обрезаются. Посмотрел результирующий эффект - это ошибка сразу бросается в глаза. Сверху тоже часто наблюдается подрезка.

Ну это думаю будет несложно поправить.


Цитата:
4. Даже умудрился спутать сторону скана: вместо левого, хватанул правый. В результате вместо текста я получил полосу изгиба книги.

Это скорее всего из-за черных полей, которые как бы есть и в то же время их как бы и нет - огрызки одни. СТ такое не любит.


Цитата:
Сделана обработка на Select content полностью. Хочу заменить 2 скана на другие. Точнее уже сделал. Прошу описать как это делать оптимально.

Подменить эти два файла на другие.


Цитата:
Посмотри, пожалуйста качество полученных ч/б сканов. Такое ощущение, что они стали совсем не читаемы. Что посоветуешь? Может не бинаризировать?

Сканировать в сером режиме, потому что этот я не назвал бы серым. Ваши сканы фактически черно-белые, только каждая буквы покрашена в свой оттенок серого. От такого скана хорошего качества не получите.


Цитата:
Попутно просьба, включить в горячие клавиши переход по сканам где-нибудь на левой стороне клавиатуры, например Q (предыдущий) и A (следующий). Так удобней работать.

Если руки дойдут - сделаю.


Цитата:
Для информации: декодирование делал в DjVu Small 0.3.2.

А, ну теперь понятно кто так испоганил эти сканы. С таким исходным материалом ничего хорошего у вас не получится.


Цитата:
Я в шоке. Несколько сканов стали чисто черными.

Не смог воспроизвести. Шлите файл проекта.


Цитата:
Попробывал оставить серый. И честно говоря не понял что изменилось. Всё, что вошло в конечный размер скана: грязь, прогибы книги и прочее - осталось.

Серый режим вывода чтоли? А он ничего и не чистит. Чистит Mixed и черно-белые режимы.
Автор: U235
Дата сообщения: 15.12.2008 19:28
Tulon

Цитата:
А, ну теперь понятно кто так испоганил эти сканы. С таким исходным материалом ничего хорошего у вас не получится.

Сканы испоганил похоже FR, это он любил делать белую рамку своим автовыравниванием.
Одно непонятно, если исходный файл djvu, то зачем делать двойную работу: сначала сливать слои DjVu Small, а затем упорно пытаться их разделить Scan Tailor'ом. Не проще ли сразу в djvudecode использовать опцию --layer=mask?
Автор: monday2000
Дата сообщения: 15.12.2008 22:27
Я сделал новую заметку:

32. Бинаризация Abutaleb Thresholding

http://www.djvu-soft.narod.ru/bookscanlib/032.htm
Автор: denver 22
Дата сообщения: 15.12.2008 23:11

Цитата:
Но я бы не сказал, что проблемы там на пустом месте

были сканы, где просто светлые места включались в область. возможно из высланных таких не оказалось. Я выборку делал хаотично.

Цитата:
Ну это думаю будет несложно поправить.

Очень надеюсь. А то как-то не в кайф такой результат получать.

Цитата:
Сканировать в сером режиме, потому что этот я не назвал бы серым. Ваши сканы фактически черно-белые, только каждая буквы покрашена в свой оттенок серого. От такого скана хорошего качества не получите.

Я же писал, что в последнее время занимаюсь облагораживанием чужих книг. А то они ценные, а пользоваться просто невозможно.
Честно говоря моих знаний не хватает понять, что значит ч/б, но подкрашенные. Было бы полезней услышать совет как мне действовать. Если конечно это входит в пределы темы этого топика и программы СТ.

Цитата:
А, ну теперь понятно кто так испоганил эти сканы. С таким исходным материалом ничего хорошего у вас не получится.

Опять не понял. Что именно плохого в DjVu Small? Он вроде декодирует на основе Document Express Enterprise.
Ну могу декодировать программой DjvuOCR. Ею пойдет? Или что-то посоветуете с программой или настройками декодирования? Может вам пару страниц самой книги выслать, чтобы понятно было каков оригинал?

Проект вышлю. Он на работе.

U235
А есть возможность использовать эту опцию в ГУИшных программах? Я не программист, а обычный пользователь. В консоли обрабатывать книги не хочу.
И опиши, пожалуйста, как тогда мне эту книгу обработать? Начиная с самого начала, имея книгу djvu. Меня сам алгоритм интересует, и особые настройки. Похоже я с трудным случаем столкнулся.
Автор: Tulon
Дата сообщения: 16.12.2008 00:57
denver 22
Обнаружилась еще одна проблема с вашими сканами - там неправильно проставлен DPI. Выставлено 300, а реально там скорее всего 150. Смотрите сами: пиксельные размеры у вас в районе 1150 x 1750. При 300 DPI физические размеры были бы 1150/300 x 1750/300 = 3.83 x 5.83 дюймов = 9.74 x 14.82 сантиметров. А в 10 сантиметров столько букв никак не уложится.
В общем диагноз - в морг.


Цитата:
Честно говоря моих знаний не хватает понять, что значит ч/б, но подкрашенные. Было бы полезней услышать совет как мне действовать. Если конечно это входит в пределы темы этого топика и программы СТ.

Сравните:
Серый скан, 300 DPI. Обратите внимание, что буквы состоят из точек разного цвета.


А вот ваш:

Комментарии излишни.


Цитата:
Что именно плохого в DjVu Small?

Не в самом DjVu Small, а в идее улучшать DjVu файлы. Они слишком много информации потеряли, чтобы их можно было бы улучшить.
Автор: U235
Дата сообщения: 16.12.2008 06:04
denver 22

Цитата:
А есть возможность использовать эту опцию в ГУИшных программах?

Да, например в DjvuOCR можно выбирать нужный слой при декодировании.

Автор: denver 22
Дата сообщения: 16.12.2008 08:03
Интересно получилось с разрешением. Тут наверное уже ничего не исправить? Просто как факт, что сканы оказались ещё более худшего качества.
Улучшением DjVu-файлов я много занимался. Если они очень кривые и грязные, то уж лучше немного (кстати, почти незаметно) потерять в качестве, но иметь чистую, ровную, с OCR и гиперссылками книгу.
U235
А галочку на To bitonal оставлять при этом?

Добавлено:
Tulon
Вот проект, где результаты получились черными - http://narod.ru/disk/4416855000/%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_0.9.1_2.2%20(%D1%87-%D0%B1).zip.html

Добавлено:
Похоже, что To bitonal роли не сыграл. Теперь понимаю почему . Вспомнил, что читал про djvu. Результат как будто даже получше, чем после бинаризации в Scan Tailor.
Автор: Tulon
Дата сообщения: 16.12.2008 13:18
denver 22


Цитата:
Интересно получилось с разрешением. Тут наверное уже ничего не исправить? Просто как факт, что сканы оказались ещё более худшего качества.

Выставление правильного разрешения благотворно бы сказалось и на Select Content и на качестве вывода.
Вот только сделать это будет не так просто. Самый реальный способ - открыть файл проекта в текстовом редакторе, и сделать массовую замену:
<dpi vertical="300" horizontal="300"
на
<dpi vertical="150" horizontal="150"
От этого изменятся размеры полей в Page Layout, но их можно потом легко поправить.
Редактор нужен посерьезнее Notepad, но никакие не Word или даже Wordpad - они любят обычные кавычки менять на декоративные, и т.п. Попробуйте Notepad++ или UniRed. Файл проекта в кодировке UTF-8 - смотрите чтобы русские буквы не побились (а они у вас есть в именах директорий).

Кстати я обратил внимание на то, что вы не повышаете разрешение на выходе. Впрочем после выставления исходного разрешения в 150 DPI, дефолтное выходное разрешение в 300 DPI как раз и будет повышающим.

Еще один момент: я сказал, что можно просто подменить пару файлов в проекте. Оказалось что это можно делать только если у них совпадают пиксельные размеры и DPI. Если нет - на стадию Output вас не пустят, и настройки для этих файлов на предыдущих стадиях будут постоянно слетать. Похоже на эту проблему и наткнулся dma200899. К следующему релизу исправлю эту недоработку.

А черные страницы на выводе у меня так и не воспроизвелись.

Добавлено:
Проблему с заменой файлов я исправил. Кому сильно надо, могут собрать версию из SVN.
Автор: denver 22
Дата сообщения: 16.12.2008 15:26

Цитата:
вы не повышаете разрешение на выходе

Правильно, проект-то сделан до того, как ты выявил неправильное разрешение. Больше я с ним не ковырялся.
А нужно ди вообще повышать разрешение? Для чего? Могу только предположить, что для более качественного распознавания.
По поводу замены файлов, пока я писал тот вопрос, сам уже разобрался как это делать. В целом мне ворчать не на что. Главное, что программа вообще позволила сделать замену. Алгоритм у меня получился может и неказистый, но сработал:
"заменить при закрытой программе; выделить скан на Select content; прогнать Процесс на Page Layout для определения новых размеров страниц; Процесс на Output"
Мне новая сборка не горит. Но когда её сделаешь, прошу описать как именно теперь можно заменять файлы.
И вообще, будь любезен создать на сайте History. А то в этом топике написал какие изменения в 0.9.1, так об этом мало кто узнает. А информация об обновлениях - крайне важна.

Цитата:
А черные страницы на выводе у меня так и не воспроизвелись

Хм... А у меня уж 3 раза, пока я с разными параметрами играл.

Добавлено:
Вообще, я уже смирился, что с этими 2-мя книгами (у 2-й похоже та же история) ничего хорошего сделать не удастся. Сделал для них OCR (получился почти отлично) и гиперссылки. Так и себе оставил, и на сайт залил.
Буду переходит к следуюшим.
Автор: Tulon
Дата сообщения: 16.12.2008 19:16
Обнаружился еще один мелкий баг. Не сохраняется разрешение вывода.
А повышать его нужно для того, чтобы хотябы частично компенсировать потерю деталей, которая происходит при компенсации наклона. Впрочем на сканах хорошего качества можно и не повышать.


Цитата:
Мне новая сборка не горит. Но когда её сделаешь, прошу описать как именно теперь можно заменять файлы.

Просто подменить файлы и все. То, что изменились пиксельные размеры, СТ сам заметит и примет во внимание. А сборку сам я никак не сделаю - нет компа с виндой, а на мой древний Apple'овский ноут винда не встанет.


Цитата:
И вообще, будь любезен создать на сайте History.

Была у меня такая мысль, но в лом мне
Пока немного народа пользуются СТ, вроде как и не сильно оно надо. А как станет много пользоваться, так и историю изменений напишут, и мануал, и логотип нарисуют. Это намек между прочим. Не все же мне самому делать.


Цитата:

Цитата:
А черные страницы на выводе у меня так и не воспроизвелись

Хм... А у меня уж 3 раза, пока я с разными параметрами играл.

А с одной страницей в проекте воспроизведется?
Автор: monday2000
Дата сообщения: 16.12.2008 21:46
Tulon

Цитата:
и мануал

Смотря что понимать под мануалом. По крайней мере элементарный хелп к программе - нужен, и написать его можете только Вы - как автор программы. Scan Tailor уже сейчас не настолько интуитивно-ясен, чтобы понять, как он работает. Смешно, если Вы станете точно так же, как и bolega, упорно годами не писать хелп к программе. Я лично буду смеяться громче всех.

Вполне достаточно, если Вы просто сделаете txt-файл, в котором в произвольной форме опишете набор функций, опций и возможностей программы - а также несколько примеров с вариантами обработки определённых категорий сканов. Это займёт от силы час времени.

Вот bolega почему-то не нашёл за много лет одного часа времени, чтобы сделать это. Надеюсь, Вы не повторите его ошибку.
Автор: Tulon
Дата сообщения: 16.12.2008 22:55

Цитата:
Смотря что понимать под мануалом. По крайней мере элементарный хелп к программе - нужен, и написать его можете только Вы - как автор программы. Scan Tailor уже сейчас не настолько интуитивно-ясен, чтобы понять, как он работает.

Я все-таки считаю, что без проблем можно разобраться без мануала. А раз можно разобраться, значит можно после этого и мануал написать. Конечно тонкостей вы не поймете, но для объяснения тонкостей есть я. Самому писать мануал от начала до конца мне в лом - я еще в школе терпеть не мог писать сочинения. Другое дело подредактировать / добавить что-то в готовый мануал. Между прочим инструкция по сборке была написана именно таким образом. Человек спросил, как собрать СТ, я дал краткие инструкции и попросил по ходу дела описать все шаги подробно. Потом конечно много редактировал / дописывал, но если бы не было начального варианта, еще неизвестно когда бы у меня руки дошли до этого.
Автор: denver 22
Дата сообщения: 16.12.2008 23:12

Цитата:
А сборку сам я никак не сделаю - нет компа с виндой, а на мой древний Apple'овский ноут винда не встанет.

Ну как минимум пока жива текущая Винда, можешь за новыми сборками обращаться ко мне. Я соберу. Всё судя по всему для этого уже готово. Зря что ли я столько всего устанавливал?
От себя: программу я буду ТОЛЬКО тестировать. Т.е. использовать её для получения конечного результата увы пока не могу. Все причины указаны в предыдущих постах. Рано я начал петь дифирамбы СТ. Вернулся к использованию СканКромсатора.
Но при тестировании если будут отмечаться различные глюки, тебе ведь интересно будет получить их? У меня уже есть новые примеры на очередной книге. На этот раз - очень плохое определение зоны текста.

Цитата:
Другое дело подредактировать / добавить что-то в готовый мануал.

Опередил мой вопрос... Т.е. если будет в наличии какой-то черновой вариант, ты возьмешься за его обточку? Пусть даже в соавторстве. Ну т.е. при совместном развитии мануала и его редактировании. Не то чтобы я это обещаю. Просто заранее интересуюсь.
Автор: Lonely_Soul
Дата сообщения: 17.12.2008 00:06
собрал бинарник scantailor 0.9.1 под Linux, может кому-нибудь пригодится

использовались: Qt 4.4.3, libjpeg62 (6b-14), libpng12 (1.2.27-2), libtiff4 (3.8.2-11)

http://www.mediafire.com/?swodmilydz9

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.