Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: denver 22
Дата сообщения: 24.12.2009 08:41
Вчера обновился с 0.9.7.1 на 0.9.7.2. И нарвался на оригинальную багу:
В Основном окне программы все листы белые. На ленте предпросмотра всё есть. Более того, программа контент распознает, полезные области находит. Вижу эти полезные области на чистых листах... содержимого не вижу. Пробовал на 2-х разных исходниках - одинаково.
Вернулся на 0.9.7.1 - всё отлично.
После обновления не перезагружался (раньше не требовалось). Какие будут мнения?
Автор: Tulon
Дата сообщения: 24.12.2009 09:47
denver 22
Проблемы с 3D ускорением скорее всего - советую отключить. В версии 0.9.7.2 используется непрямой рендеринг, что в моем случае помогло избавиться от артефактов (встроенная видюха Intel). Возможно в вашем случае от этого только хуже стало. Какая у вас видюха и операционная система?
Автор: denver 22
Дата сообщения: 24.12.2009 10:42
Tulon
Отключил 3D ускорение - всё заработало. Спасибо.
WinXP SP3, Nvidia 6600.
Я не заглянул в эту настройку ранее, т.к. где-то тут Вы говорили, что по-умолчанию отключили 3D ускорение по причине глюков на некоторых видюхах.
Автор: monday2000
Дата сообщения: 24.12.2009 11:59
Tulon
Что-то у меня в маленьком окошке "Недавние проекты" при старте программы отображаются 2 одинаковые записи "sample", а пути у них такие:

D:/Мои документы/sample.ScanTailor

D:\Мои документы\sample.ScanTailor

Добавлено:
Tulon
А где хранятся координаты пользовательских зон? В файле задания я их что-то не увидел.
Автор: Tulon
Дата сообщения: 24.12.2009 12:09
monday2000
Где-то нехватает нормализации пути. Такими мелочами я обычно занимаюсь непосредственно перед релизом. Вспомню - сделаю, не вспомню - не сделаю. Список задач я теперь намеренно не веду - иначе он будет давить психологически.

Добавлено:

Цитата:
А где хранятся координаты пользовательских зон? В файле задания я их что-то не увидел.

В файле проекта поищите по тегу <splines>. Вот только они в координатах исходного, а не выходного изображения, и перевести их туда довольно сложно. В принципе я готов продублировать их в нужных координатах, но только после того, как у вас будет готова программа для работы с ними. А иначе может получиться что я добавлю костыль, который так никому и не понадобится.
Автор: StanFreeWare
Дата сообщения: 24.12.2009 12:51
Tulon
1. Нет ли у вас мыслей по поводу возможности использования многоядерных процессоров наподобие того, как это сделано в FR9+?
Для этой цели сначала хотел было запустить две копии ST для одного проекта и в первой сделать вывод с начала списка, а во второй - с середины. Но вовремя понял, что в этом случае будет невозможно без дополнительных программных ухищрений сохранить в проект информацию о зонах полученную копиями программ с обеих половин списка...

2. Есть ли возможность сделать применение значения полей на стадии макет страницы не во время их редактирования, а по Enter или по потере этим полем фокуса? Допустим, мне нужно поменять значение 10 на 7 - я удаляю 0, жду пока завершится пересчет, удаляю 1, опять жду, и только потом могу ввести 7... (касается самых высоких и широких страниц).


Добавлено:
Хотя, по идее, для склейки двух подпроектов достаточно будет в банальном текстовом редакторе объединить соответствующие куски filters-output, так ведь?
Автор: Tulon
Дата сообщения: 24.12.2009 13:18

Цитата:
1. Нет ли у вас мыслей по поводу возможности использования многоядерных процессоров наподобие того, как это сделано в FR9+?
Для этой цели сначала хотел было запустить две копии ST для одного проекта и в первой сделать вывод с начала списка, а во второй - с середины. Но вовремя понял, что в этом случае будет невозможно без дополнительных программных ухищрений сохранить в проект информацию о зонах полученную копиями программ с обеих половин списка...

Я считаю распараллеливание по ядрам процессора неперспективным подходом. Гораздо более перспективно - использовать видеокарту для вычислений. На видеокарте вычислительных блоков гораздо больше, чем ядер на процессоре, и вполне реально ускорить тот или иной алгоритм раз в 20-30. Я эту цифру не из головы взял - мы на работе используем видеокарты для вычислений. Плюс если использовать OpenCL - то он может использовать и ядра процессора, если нет поддержки от видюхи. Конечно алгоритмы должны быть параллелизуемы, но самые тяжелые алгоритмы в ST как раз такие. Так или иначе, до этого дело дойдет еще не скоро, что даже хорошо - к тому времени даже встраиваемые видюхи будут поддерживать вычисления общего назначения.


Цитата:
2. Есть ли возможность сделать применение значения полей на стадии макет страницы не во время их редактирования, а по Enter или по потере этим полем фокуса? Допустим, мне нужно поменять значение 10 на 7 - я удаляю 0, жду пока завершится пересчет, удаляю 1, опять жду, и только потом могу ввести 7... (касается самых высоких и широких страниц).

Теоретически возможно, но довольно сложно. Думаю оно того не стоит, особенно учитывая, что эту операцию обычно делают только на одной странице книги, после чего применяют настройки ко всем остальным страницам. Можно еще делать даблклик перед редактированием, чтобы засветить все цифры.


Добавлено:

Цитата:
Хотя, по идее, для склейки двух подпроектов достаточно будет в банальном текстовом редакторе объединить соответствующие куски filters-output, так ведь?

Попробуйте, хотя я не уверен что такое прокатит.
Автор: monday2000
Дата сообщения: 24.12.2009 13:51
Tulon

Цитата:
В файле проекта поищите по тегу <splines>.

Ну это я видел, конечно. Только вот почему координаты зон не убираются из файла, если зону убрать в СТ, и сохранить проект?

Добавлено:

Цитата:
костыль, который так никому и не понадобится.

Нужен разделённый вывод - т.к. вручную расставлять Picture-зоны в СК - легче повеситься. А вот как его сделать - тут возможны варианты. Идеально - Вам его сделать. А пока что мне нужно самому делать алгоритм заливки - да ещё чтобы он работал точно также, как Ваш...
Автор: Alfizik
Дата сообщения: 24.12.2009 14:14
monday2000, скажите пожалуйста умеет ли Scan Tailor работать с серыми сканами (преобразовывать их в черно белые, чтоб черные пятна не поглощали буквы текста)?
Автор: Tulon
Дата сообщения: 24.12.2009 14:23
Alfizik
Умеет.
Автор: StanFreeWare
Дата сообщения: 24.12.2009 16:20

Цитата:
Попробуйте, хотя я не уверен что такое прокатит.

Попробовал, прокатило, распараллелил на два ядра. Вывод 2 часа вместо 4х часов. Правда рекомендовать всем такой метод сложно - не каждый найдет в xml-файле проекта цепочку преобразований от имени файла изображения до идентификатора данной страницы на выводе. С другой стороны, если не нужно в конце вывода сохранять проект - например, в случае вывода одной из составляющих при уже заданных ранее зонах - то вполне себе можно просто запускать N скантэйлоров (по количеству ядер) на свой диапазон страниц. Возможно, тут пригодилась бы возможность делать вывод только для выбранных на ленте страниц.
Автор: Dashout
Дата сообщения: 24.12.2009 17:02
StanFreeWare
сложно..., а не проще оптимизировать работу ядер программой (например) Ashampoo Core
Tuner
4 часа..., - это сколько страниц? Что то слишком много время уходит
Автор: Tulon
Дата сообщения: 24.12.2009 17:44
Такая просьба: для тестирования нужны сканы, на которых ST'шный despeckle удаляет лишнего, но при этом сканы не должны быть совсем чистыми, на которых удалять нечего. Чем грязнее, тем лучше, но не настолько, чтобы пятна грязи сливались и доходили до размеров букв - такие у меня как раз есть.
Автор: Olive77
Дата сообщения: 24.12.2009 18:16

Цитата:
для тестирования нужны сканы, на которых ST'шный despeckle удаляет лишнего,

http://www.onlinedisk.ru/file/302860/
Автор: Tulon
Дата сообщения: 24.12.2009 18:47
Olive77
Слишком стерильные сканы - там нечего чистить.
Автор: StanFreeWare
Дата сообщения: 24.12.2009 18:50
Dashout

Цитата:
Ashampoo Core Tuner

А вы сами пробовали ею пользоваться в контексте СТ? Было бы интересно получить реальные результаты сравнения с утилитой и без нее..
Процессор AMD слабенький двухядерник ноутбучный Turion TL-56. Книжка грязненькая такая 200 dpi, 900 страниц... В общем был повод задуматься об увеличении производительности.
Автор: Dashout
Дата сообщения: 24.12.2009 22:53
StanFreeWare
а какой смысл засекать время? надо оптимизировать загрузку процессоров, загрузка - это и есть работа (в данном случае СТ). Что касается утилиты, то безусловно она нужна




Добавлено:
P.S. это снимок с экрана при работе СТ на стадии обработки полезной области.
Автор: denver 22
Дата сообщения: 25.12.2009 08:25
Tulon

Цитата:
для тестирования нужны сканы, на которых ST'шный despeckle удаляет лишнего

Сливаю и оригинал, и результат работы деспекла. Надеюсь чем-то помогут.
http://www.onlinedisk.ru/file/303288/

Добавлено:
И всё таки снова прошу реализовать зоны для ч/б режима. Деспекл идеальным быть не может для ЛЮБОГО качества сканов. Всегда бывают случаи неправильной очистки. А ориентироваться на идеальные сканы - слишком узкая направленность программы получится (в плане очистки).
Пользователю нужно дать возможность вручную править результаты автоматической обработки. Для всех операций она есть, а для деспекла - только на одном режиме. Очень надеюсь, что вы прислушаетесь к просьбе.
Автор: Tulon
Дата сообщения: 25.12.2009 11:53

Цитата:
Сливаю и оригинал, и результат работы деспекла. Надеюсь чем-то помогут.

Та же проблема - на этих сканах нечего чистить. Мне нужные такие где есть, что чистить, и при этом удаляется лишнего.
Автор: pjuv
Дата сообщения: 25.12.2009 15:35

Цитата:
для тестирования нужны сканы, на которых ST'шный despeckle удаляет лишнего

Такие подойдут? http://narod.ru/disk/16321394000/1.ZIP.html
Автор: alpopo
Дата сообщения: 25.12.2009 17:11

Цитата:
на этих сканах нечего чистить
может на этих есть чего http://www.onlinedisk.ru/file/303748/
Автор: Tulon
Дата сообщения: 25.12.2009 21:22
pjuv

Цитата:
Такие подойдут? http://narod.ru/disk/16321394000/1.ZIP.html

Тут на четырех страницах было всего одно "легитимное пятно". Хотелось бы побольше. Я так понимаю, главный источник пятен - это буквы, просвечивающие с другой стороны.

alpopo

Цитата:
может на этих есть чего http://www.onlinedisk.ru/file/303748/

Ну а тут клинический случай - даже человеку не всегда ясно, где там мусор, а где элементы картинок.
Автор: StanFreeWare
Дата сообщения: 25.12.2009 22:41
http://www.onlinedisk.ru/file/304044/
Автор: Tulon
Дата сообщения: 25.12.2009 23:26
StanFreeWare

Цитата:
http://www.onlinedisk.ru/file/304044/

Чуть лучше - на одной из страниц было аж два пятна.
Мне тут подумалось, а нужен ли вообще этот despeckle? Мне пока не приходилось видеть страниц с более чем парой едва заметных пятен. Это конечно не считая патологических случаев, когда сканировали в черно-белом режиме. Однако в патологических случаях вряд-ли despeckle сможет помочь.
Автор: StanFreeWare
Дата сообщения: 26.12.2009 06:17
Tulon

Цитата:
Мне тут подумалось, а нужен ли вообще этот despeckle

Свой пылесос я делал для обработки таких страниц (изначально она была серой 200 dpi, извлеченной из pdf).
http://www.onlinedisk.ru/file/304227/
И, кстати, как я не старался, точки над i в коде он таки сгрыз... Есть, конечно, идеи, как этого избежать, но, боюсь, алгоритм еще раза в три затормозится.

С другой стороны, не уверен, что можно на этих страницах
http://www.onlinedisk.ru/file/304226/
как-то отличить мусор, похожий на точку в строке от полезной информации.

Иными словами, с одной стороны существуют случаи, когда без деспекла книжка выглядит ну очень неаккуратно, с другой стороны всегда есть вероятность съесть какую-нибудь одинокую точку (скобку, запятую, дефис), очень важную в смысловом отношении.

Наверное, нужно еще посмотреть, какой результат на подобных сканах дает SK...
Автор: U235
Дата сообщения: 26.12.2009 08:21
StanFreeWare
Вот пример алгоритма деспекла с промежуточными результатами. Конечно, не совсем идеально,
http://www.onlinedisk.ru/file/304251/
Автор: Tulon
Дата сообщения: 26.12.2009 08:49
U235
Насколько я понял, принцип у вас такой: "убрать все не слишком большие соединенные компоненты, кроме тех, у которых справа/слева есть достаточное количество черных пикселей.
Боюсь оно будет удалять такие вещи, как сабскрипты (v1) и суперскрипты (x2).
Так или иначе, одну умную идею из вашего кода я подчерпнул - горизонтальной и вертикальной компонентам расстояния нужно давать разные веса.
Автор: U235
Дата сообщения: 26.12.2009 09:29
Tulon
Да, верно. Скрипт так и работает.
Верхние и нижние индексы могут удалятся, только если они сильно смещены вверх или вниз. Что, ИМХО, не так часто бывает.
Также их можно защитить от удаления меняя параметр "не слишком большие".

Вот еще пример:
http://alexrey036.narod.ru/lin.gif
тут использовалось последовательно 2 структурных элемента: горизонтальный 23px (для точек, запятых) и вертикальный 11px (для точек над i).
[more=скрипт]
Код: a=imread('p0527.tif');
a=~a;
b=bwareaopen(a, 50);
se=strel('line', 23, 0);
d=imdilate(a, se);
se2=strel('line',11, 90);
d2=imdilate(a, se2);
d=d|d2;
imwrite(~d, 'lin_dilate.tif');
e=bwareaopen(d, 400);
imwrite(~e, 'lin_dilate_e.tif');
g=a&e;
imwrite(~g, 'lin_dilate_g.tif');
im(:,:,1)=255*uint8(~g);
im(:,:,2)=255*uint8(~a);
im(:,:,3)=255*uint8(~a);
imwrite(im, 'lin.tif');
Автор: StanFreeWare
Дата сообщения: 26.12.2009 13:03
U235
Еще не знаю, на что это может повлиять, но Ваш алгоритм по-разному относится к соринкам разной формы. Например, площадь (а значит и шанс остаться неудаленной) горизонтальной соринки 10х5 пикселов будет в 1.6 раза меньше, чем вертикальной такого же размера.
Автор: U235
Дата сообщения: 26.12.2009 13:32
StanFreeWare

Цитата:
Например, площадь (а значит и шанс остаться неудаленной) горизонтальной соринки 10х5 пикселов будет в 1.6 раза меньше, чем вертикальной такого же размера.

Не понял... почему площадь будет меньше, если размеры одинаковы..?

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.