Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: allo04
Дата сообщения: 19.01.2016 20:05
Как раз OpenCL не включал, но все операции, особенно вывод на experimental происходят в несколько раз быстрее, чем на Featured или Еnhanced.
Автор: nukez
Дата сообщения: 20.01.2016 08:13
В версии experimental сделал целиком книгу - энциклопедию (900 страниц), от начала до конца. Ни одного вылета.


Цитата:
Но вот до сих пор мучает одна проблема, как в режиме "Резка страниц" скопировать положение рукояток на все последующие страницы? Никак не могу найти эту функцию и не верю что она не реализована.


Подскажите в какой версии эта функция реализована? Очень нужна, т.к. у меня все сканы с Kirtas и там положение резаков практически не меняется, но всё равно приходится каждый скан вручную править.
Автор: slava_kry
Дата сообщения: 20.01.2016 09:21
nukez

Цитата:
Подскажите в какой версии эта функция реализована? Очень нужна, т.к. у меня все сканы с Kirtas и там положение резаков практически не меняется, но всё равно приходится каждый скан вручную править.

Не была она реализована, т.к. Тулон сказал, что для этого придётся многое менять и потому просил извинить. Так шта...
Автор: LazyKent
Дата сообщения: 21.01.2016 21:55
Alex1234444a
Возможно, вы подскажете?
Оригинальный Scan Tailor 0.9.11.1 (-featured тоже) не компилируется в свежей openSUSE.
Вот такая ошибка:

Код:
[ 483s] /home/abuild/rpmbuild/BUILD/scantailor-0.9.11.1/filters/fix_orientation/Filter.cpp:103:43: error: reference to '_1' is ambiguous
[ 483s] this, boost::ref(doc), var(filter_el), _1, _2
[ 483s] ^
[ 483s] In file included from /usr/include/boost/lambda/lambda.hpp:14:0,
[ 483s] from /home/abuild/rpmbuild/BUILD/scantailor-0.9.11.1/filters/fix_orientation/Filter.cpp:32:
[ 483s] /usr/include/boost/lambda/core.hpp:69:37: note: candidates are: boost::lambda::placeholder1_type& boost::lambda::{anonymous}::_1
[ 483s] boost::lambda::placeholder1_type& _1 = free1;
[ 483s] ^
[ 483s] In file included from /usr/include/boost/bind/bind.hpp:2247:0,
[ 483s] from /usr/include/boost/bind.hpp:22,
[ 483s] from /usr/include/boost/multi_index/sequenced_index.hpp:17,
[ 483s] from /home/abuild/rpmbuild/BUILD/scantailor-0.9.11.1/./ProjectWriter.h:30,
[ 483s] from /home/abuild/rpmbuild/BUILD/scantailor-0.9.11.1/filters/fix_orientation/Filter.cpp:29:
[ 483s] /usr/include/boost/bind/placeholders.hpp:46:28: note: const boost::arg<1> boost::placeholders::_1
[ 483s] BOOST_STATIC_CONSTEXPR boost::arg<1> _1;
[ 483s] ^
[ 483s] /home/abuild/rpmbuild/BUILD/scantailor-0.9.11.1/filters/fix_orientation/Filter.cpp:103:47: error: reference to '_2' is ambiguous
[ 483s] this, boost::ref(doc), var(filter_el), _1, _2
[ 483s] ^
[ 483s] In file included from /usr/include/boost/lambda/lambda.hpp:14:0,
[ 483s] from /home/abuild/rpmbuild/BUILD/scantailor-0.9.11.1/filters/fix_orientation/Filter.cpp:32:
[ 483s] /usr/include/boost/lambda/core.hpp:70:37: note: candidates are: boost::lambda::placeholder2_type& boost::lambda::{anonymous}::_2
[ 483s] boost::lambda::placeholder2_type& _2 = free2;
[ 483s] ^
[ 483s] In file included from /usr/include/boost/bind/bind.hpp:2247:0,
[ 483s] from /usr/include/boost/bind.hpp:22,
[ 483s] from /usr/include/boost/multi_index/sequenced_index.hpp:17,
[ 483s] from /home/abuild/rpmbuild/BUILD/scantailor-0.9.11.1/./ProjectWriter.h:30,
[ 483s] from /home/abuild/rpmbuild/BUILD/scantailor-0.9.11.1/filters/fix_orientation/Filter.cpp:29:
[ 483s] /usr/include/boost/bind/placeholders.hpp:47:28: note: const boost::arg<2> boost::placeholders::_2
[ 483s] BOOST_STATIC_CONSTEXPR boost::arg<2> _2;
[ 483s] ^
[ 487s] filters/fix_orientation/CMakeFiles/fix_orientation.dir/build.make:110: recipe for target 'filters/fix_orientation/CMakeFiles/fix_orientation.dir/Filter.cpp.o' failed
[ 487s] make[2]: *** [filters/fix_orientation/CMakeFiles/fix_orientation.dir/Filter.cpp.o] Error 1
Автор: Alex1234444a
Дата сообщения: 22.01.2016 13:37
LazyKent, если собираешь не под c++11, то попробуй _1, _2, ... заменить на std::placeholders::_1, std::placeholders::_2 или boost::lambda::_1, boost::lambda::_2.

Лично я собираю под c++11, и там такое уже не прокатит, ибо в новом стандарте, к примеру, тот же vector::push_back имеет две реализации с одним интерфейсом, а не одну. Я заменял каждый биндер лямбда-замыканиями, к примеру bind(&std::vector<int>::push_back, vec, _1) на [&vec](int p){vec.push_back(p);}
Автор: 4lex4
Дата сообщения: 28.01.2016 01:50
ScanTailor_Advanced_TEST

Ребят, все профиксил, потестируйте.

Очистка бэкграунда в цветном режиме и адаптивная бинаризация будут в следующем релизе, если с этим порядок.
Автор: allo04
Дата сообщения: 28.01.2016 16:32
Спасибо, стало намного лучше, еще бы скорость работы побольше и экспорт добавить.
Автор: 4lex4
Дата сообщения: 28.01.2016 17:38
[more] Экспорт в скантейлоре - выход за пределы проекта. ScanTailor не должен содержать элементы, которые не соответсвуют целям проекта, а создание djvu и подгонка под их утилиты - это далеко от ST. Лично я djvu не пользуюсь сейчас вообще, только pdf. Есть куча программ для экспорта в djvu из результатов ST, используйте их.
Плюс для деления на фореграунд и бекграунд из результатов ST я сделал отдельную утилитку, но она предназначена для раздельной обработки картинок и текста, и позволяет объединять обработанные слои обратно, пролистайте пару страниц назад этой темы.

Со скоростью поработаю, в любом случае будет новый алгоритм выбора контента, т. к. текущий много пропускает, и буду переделывать алгоритмы вывода, ибо размытие гаусса для сглаживания перед бинаризацие ведет к потере тонких засечек у букв и их слипанию. Плюс необходимы адаптивные алгоритмы бинаризации, ибо глобальный метод отсу для сканов плохо справляется, в одном месте буквы слишком жирные и слипаются, в другом обрываются.

Для поышения скорости можно сделать поддержку многоядерности. [/more]
Автор: allo04
Дата сообщения: 28.01.2016 17:48
4lex4 я djvu тоже пользую нечасто, но было бы удобно, прямо из ScanTailorа разделить на картинки и текст, зачем лишние утилитки запускать, если можно в той же программе пару раз мышкой кликнуть.
Автор: tlotr
Дата сообщения: 28.01.2016 18:28
Абсолютно напрасно отвергаете экспорт. Великолепная фича, помогающая создавать качественные книги. А с такими аргументами можно ещё много чего отрезать от существующей реализованной функциональности.
Автор: 4lex4
Дата сообщения: 28.01.2016 18:48
Никто не отвергавет экпорт, есть куча утилит, используйте их, а эта фича выходит за пределы проекта ScanTailor, я не хочу тратить время на то, что уже реализовано сотни раз, ибо старая реализация из Featured работать на этой версии не будет, а сидеть и тратить время над этим просто из-за того, что кому-то лень использовать отдельную утилитку - нет уж, извините, у меня есть задачи поважнее.
Автор: denver 22
Дата сообщения: 28.01.2016 19:13
Ребята, почитайте о принципах "открытых" программ. 1 функция - 1 программа.
Просто боюсь, что вы сейчас и нового разработчика также доведете, как когда-то случилось с Tylon-ом.
Пусть он сделает качественную реализацию базового функционала. Хотя бы пока его не дергайте. Он ведь и сам мотивирован на модернизацию Scan Tailor.
К тому же утилит реально много для сборки в djvu.
Автор: 4lex4
Дата сообщения: 28.01.2016 19:39
denver 22, да мне безразницы, я делаю для себя в первую очередь и только то, что мне нужно, альтруизмом не болею. Выкладываю как есть, кому надо, тот пользуется, но полезные советы и помощь в тестировании приветсвуется.
Автор: tlotr
Дата сообщения: 28.01.2016 20:01
Ну, для начала, давайте без того, чтобы считать всех вокруг безрукими. Уж вы-то должны понимать, что людям, собирающим дежавю, как раз не лень запускать утилитки. У нас на этих утилитках всё и держится. Одной больше, одной меньше - не так существенно. ScanTailor + Smalldjvu + DjvuImage + DjvuPal + Bookmaker + Finereader + F11Crutch - это тот путь, которым прошли у меня уже большинство книг. Ну, вставится после СТ утиль, которая будет делать экспорт, ничего страшного.

Без проблем. У вас своё видение развития проекта. Просто смущает то, что пропадают фичи, которые уже были. Вот недавно сообщалось:


Цитата:
Попробовал эту версию, работает шустрей, но почему-то пропал пункт при редактировании "применить к каждой второй странице", который был в прошлой версии.


Говорилось про поворот. Ладно, повороты тоже можно любым эйсидиси сделать. Но диалог ведь там один, если не ошибаюсь? Поля-то можно всё ещё к каждой второй странице применять или эту функциональность выпилили напрочь за ненадобностью?

Просьба одна. Дорабатывая под себя эту программу, сообщайте о выпиленной функциональности, которую можно больше не ожидать в вашей ветке. Я не очень много прошу?

Спасибо.
Автор: 4lex4
Дата сообщения: 28.01.2016 20:51
tlotr, вы все напутали.

Я ничего не выдерал и не убирал, а наоборот объединил две сборки - Enhanced и Featured (кроме экспорта), и это написал, когда выкладывал версию Enhanced+. А вы видимо говорите про версию experemental от Tulon'a, я к ней никакого отношения не имею.
Автор: tlotr
Дата сообщения: 28.01.2016 20:54
Ну, извиняйте, коли так.
Удачи в работе над проектом.
Автор: 4lex4
Дата сообщения: 28.01.2016 21:04
[more] Мои сборки называются старая: Enhanced+, новая Advanced, базируются на Enhanced (от Petr Kovar) и Featured (от monday2000, кроме экспорта). Зачем это было мне необходимо я описал ранее в этой теме. (старый логин: Alex1234444a)

Весь код переделан под новый стандарт c++11, свежие либы (boost 1.60, qt5, jpeg9 и т. п.), и новая своя система сборки как либ, так и самого ST.

На этой базе я и работаю, когда есть время, сделал новый интерфейс, и собираюсь внедрять новые возможности и исправления, которые описал ранее и которых мне самому не хватает. Я ответсвенен только за эти версии, к другим сборкам отношения никакого не имею и не нужны они мне.

Новая версия experemental от Tulon'a (разработчика официального ST) мне самому не понравилась, урезаны важные вещи в жертву упрощения, но он с самого начало предупредил, что его цель - упрощение всего и вся, видать в противовес ScanKromsator'y, по мне он явно переборщил. Я же напротив двигаюсь к усложнению и добавлению новых возможностей, чтоб получать более качественный выход. [/more]
Автор: trion1
Дата сообщения: 29.01.2016 07:55
4lex4,
пожалуйста, скомпилируйте для XP х32 свои сборки
Автор: ndch
Дата сообщения: 29.01.2016 08:52
4lex4

Цитата:
версия experemental от Tulon'a (разработчика официального ST) мне самому не понравилась, урезаны важные вещи в жертву упрощения, но он с самого начало предупредил, что его цель - упрощение всего и вся, видать в противовес ScanKromsator'y, по мне он явно переборщил
Нравится или не нравится зависит от того к какой категории относится пользователь и чего хочет. ScanKromsator и ScanTailor, как и их пользователи - яркие наглядные примеры.

Tulon не упрощал для того чтобы упростить, а упрощал интерфейс чтобы неподготовленному пользователю было интуитивно понятно, не в ущерб результату и общей архитектуры программы.
Автор: VSHY
Дата сообщения: 29.01.2016 12:59
Недавно озаботился обработкой сканированных старых нотных партитур (дальше их тоже много предстоит обрабатывать). Сразу скажу, что дальше полученные изображения передаются в программу Neuratron PhotoScore для распознавания. Основная проблема в том, что нотные станы плохо прорисованы, и после обработки ScanKromsator и ScanTailor Featured (monday2000) местами получаются разрывы, из-за чего PhotoScore не может распознать. Если сканы хорошие, там и так много работы (обычно часа 2-4 на одну страницу), а если нотные станы с разрывами, то получается такая мешанина из нот, что с этим вообще ничего нельзя сделать.
Совет "надо лучше сканировать" не подходит, т.к. ноты самостоятельно сейчас никто не сканирует, за редким исключением, потому что неоткуда сканировать, нет исходного материала. Источники долго ищутся в интернете, выбирая наиболее приемлемый.

Пробовал все методы очистки фона в ScanKromsator, в итоге более-менее работает Normal (как-то так работает и ScanTailor). Все остальные методы очистки дают какую-то жуть - слишком много убирается. 3-дневные эксперименты над ScanKromsator'ом привели к мысли, что большинство настроек там просто не работает (меняешь - ничего не происходит); либо на моём материале этого не видно. К тому же ужасный интерфейс.

В принципе вариант ScanTailor от monday2000 меня устраивает логичностью - функции разделены по группам. По моему такой интерфейс оптимален. Ну и красив, видимо у человека есть чувство вкуса и дизайнерский талант.

Сильно хотелось бы - это регулировать то, на сколько происходит чистка фона, т.к. страдают таблицы (причины описывал выше).
В идеале хотелось бы дополнительно интеллектуальную систему восстановления таблиц, - если видно что это таблица, то восстанавливать пропавшие части линеечек (бывает от нескольких миллиметров до нескольких сантиметров; возможно настраивать размер, чтобы вдруг ячейки не объединялись).

Ещё бывает, что таблицы перекошены (эффект от множественной прокатки при печати или мятости исходного материала).
В идеале хотелось бы, чтобы была хоть какая-то автоматическая обработка этого, хотя бы таблиц, т.к. углы прямые, потому это наверное (это я так предполагаю) нетрудно было бы сделать.

По моему, можно совместить и простоту программы и функциональность. И даже не добавлением режима Expert, а добавить всего лишь кнопку "Дополнительно" по которой будут выводиться расширенные настройки соответствующего этапа, где все параметры будут по умолчанию. Как обычно работает логика у пользователя - зашёл один раз, если видишь что-то непонятное, то в следующий раз уже не будешь заходить, но зато и пользователи, которым нужны расширенные настройки, не пострадают.

В идеале для материала одинакового качества я бы хотел видеть возможность экспорта/импорта настроек, чтобы использовать те же в других проектах.

В остальном всё отлично! Очень благодарен всем, кто делает такие чудо-программы! Огромное спасибо Вам!

Добавлено:
Вспомнил! Ещё хотелось бы иметь возможность выделить критическую область на скане, а также увеличенную область предпросмотра для выделенной области скана.
Поменял какие-то параметры, - сразу же увидел результат, без всех этих сохранений файлов, потом их визуальных сравнений... Это должно быть быстро, т.к. для предпросмотра будет обрабатываться только небольшой выделенный фрагмент.
Автор: 4lex4
Дата сообщения: 29.01.2016 21:31
trion1, выложу, когда будет релиз, а это тесты.

ndch, и ST, и SK хорошие проекты, но пока что меня не устраивает ни один из них.

VSHY, я вас понимаю, мне тоже не хватает ни SK, ни ST. Я собираюсь делать чистку фона для режима в цвете, для обработки журналов и изданий со сложной версткой.
Так же я собираюсь внедрять адаптивную бинаризацию, что подходит для вашего случая. Подождите немного, пока я все доделаю, потом выложу на тест и вы проверите.
Автор: VSHY
Дата сообщения: 29.01.2016 22:41
4lex4
Спасибо, буду ждать
Автор: unreal666
Дата сообщения: 30.01.2016 05:07
4lex4
- а чего ник у тебя (или у вас - не знаю как обращаться) поменялся?
- и почему исходники не в открытом доступе?
Автор: 4lex4
Дата сообщения: 30.01.2016 17:00
VSHY, выложите пожалуйста несколько страниц проблемного исходника, и неудачные результаты, я потестирую.
Автор: 4lex4
Дата сообщения: 03.02.2016 02:14
ScanTailor Advanced [test]

Изменения:
* Поддержка многопоточности при пакетной обработке.
* Портативность: все настройки теперь хранятся в папке с программой.
* Значительно улучшена производительность панели с миниатюрами.
* Значительно улучшена производительность программы при включенной опции автосохранения проекта.
* Улучшена производительность диалога применения настроек к страницам.
* Параметр выравнивания освещенности теперь доступен для mixed режима.
* При перелистывании страницы больше не пропадают для предотвращения резких перепадов яркости.

>> СКАЧАТЬ <<
Автор: 4lex4
Дата сообщения: 04.02.2016 13:38
Доступно к тестированию. Пишите, как у вас работает.

В разы увеличена скорость обработки на многоядерных процессорах.
Также доработал функцию с отделяющейся и расширяющейся многостолбцовой панелю с миниатюрами из версии Enhanced: прокрутка и расширение панели происходит теперь быстро и плавно.
Переделал функцию автосохранеия из Featured: теперь автосохранение происходит по истечении 30сек с последнего действия пользователя, а не на каждое действие сразу, что раньше вызывало сильные лаги и задержки.
Автор: arsvrn
Дата сообщения: 04.02.2016 16:33
А на 32-бита будет?
Автор: Tulon
Дата сообщения: 04.02.2016 16:37
Не имею ничего против форков, но исходники надо предоставлять. В идеале конечно надо использовать GitHub и через него же делать релизы. Поверьте мне, потенциальные работодатели косо смотрят на разработчиков, не использующих системы контроля версий.
Автор: allo04
Дата сообщения: 04.02.2016 16:42
При очистке от мусора, если выбрать агрессивное удаление, убирает целые буквы.
Автор: 4lex4
Дата сообщения: 04.02.2016 17:00
Tulon, я юзаю mercurial, исходники выложу на github после релиза как форк от твоего проекта, а это просто погонять выложил.
arsvrn, да, после релиза. Подождите пару неделек.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.