Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: monday2000
Дата сообщения: 27.01.2013 14:37
tlotr
Я Tulon написал письмо про баг, а то он сюда и не заходит же давно. Попробуйте запустить программу в режиме Инструменты - Режим отладки и посмотреть на вкладках стадии вывода, где косяк.
Автор: monday2000
Дата сообщения: 27.01.2013 18:39
Ответ Tulon

Цитата:
Сходу воспроизвести не удалось. Копать глубже не стану, из-за остутствия времени и желания. Может сами попробуете? Основную гипотезу могу назвать - нехватка памяти прямо в библиотеке libtiff. Если у человека время от времени вылетает диалог нехватки памяти - это аргумент в пользу этой гипотезы, так как ловятся не все такие ситуации, а только часть.

Мне тоже не до этого. Да и баг не выглядит смертельным.

Добавлено:
Я немного перекроил индикацию процесса экспорта. Теперь номер текущего экспортируемого файла выводится в реальном времени.

Вот сборка:
http://rghost.ru/43355161

Детали тут: http://www.djvu-scan.ru/forum/index.php?topic=1137.msg5413#msg5413

Добавлено:
tlotr
Всё же сохраните информацию об этом баге (желательно онлайн-доступность описания). Может, когда-нибудь что-то изменится, и этот баг станет возможным устранить.
Автор: tlotr
Дата сообщения: 27.01.2013 20:57
Спасибо за ответы. Не, баг нисколько не смертельный, просто интересовало, один ли я такой везучий или это известная штука.

Обнаружил, что воспроизводится если данные находятся на сетевом диске (не на локальном) при размере сохраняемого тифф файла более 16 Мб. После того, как я переписал данные на локальный диск проблема ушла. Т.е, видимо, действительно требуется, чтобы "звёзды сошлись" для воспроизведения этой неисправности.

monday2000
Вы не могли бы ввести для своих билдов какую-то версионность, чтобы была какая-то конкретика, если речь будет вестись о вашей сборке? Сегодня вы выдали на гора две версии и указывать при описании проблемы, что "вот такая-то проблема наблюдается в вечернем билде от такого-то числа" как-то странно.
Автор: monday2000
Дата сообщения: 27.01.2013 22:04
tlotr

Цитата:
Вы не могли бы ввести для своих билдов какую-то версионность, чтобы была какая-то конкретика, если речь будет вестись о вашей сборке?

Я просто очень тороплюсь. Хочется побыстрее покончить с кое-какими (давно назревшими, прямо-таки наболевшими) вещами. Со временем, конечно, всё образуется.
Автор: LazyKent
Дата сообщения: 27.01.2013 22:31
monday2000, не могли бы вы завести собственную ветку в git на sourceforge.net? Чтобы все имели доступ к исходникам.

На это есть две причины:
1. Пользователи операционных систем, отличных от Windows, могли бы компилировать программу в своей среде.
2. Лицензия GPL однозначно подразумевает, что все внесённые изменения в исходный код должны поступать в общественное достояние.

А в итоге, спасибо!

Автор: monday2000
Дата сообщения: 28.01.2013 18:06
LazyKent

Цитата:
не могли бы вы завести собственную ветку в git на sourceforge.net

Не обещаю. По крайней мере пока на это совсем нет времени.
Автор: monday2000
Дата сообщения: 30.01.2013 19:30
Очередное исправление экспорта разделённых сканов. Внесены некоторые улучшения:

- При нажатии на кнопку "Export" в окне сначала появляется надпись "Starting the export...", а уже после неё отображается в реальном времени постраничная индикация экспорта. Я никак не мог ранее этого добиться - но всё-таки смог с помощью Tulon.

- Добавил возможность прервать экспорт в процессе его совершения. После старта экспорта кнопка "Export" меняет своё название на "Stop" - и её можно нажать, чтобы остановить процесс. Правда, кнопка получилась слегка "жестковата" - т.е. не сразу реагирует на нажатие, а через полсекунды примерно.

- Добавил дату сборки в качестве "версии" программы.

- Попытался русифицировать свои добавления, но пока не слишком успешно. Удалось русифицировать пока лишь визуальные элементы.

- Убрал баг: ранее, если экспортировался чёрно-белый скан, установленный в режиме "Mixed", то для него создавался сплошной белый задний субскан. Теперь не создаётся.

- Кстати, галки "Split mixed" и "Default output folder" авто-запоминаются между сеансами запуска программы. По-видимому, в реестре Windows - больше негде. Точно не знаю, потому что это абстрагируется классом QSettings.

Вот сборка: http://rghost.ru/43427492 (4,5 МБ)

Технические подробности: http://www.djvu-scan.ru/forum/index.php?topic=1137.msg5427#msg5427
Автор: monday2000
Дата сообщения: 01.02.2013 17:39
Что-то у меня в последней официальной версии СТ (0.9.11.1) глючит перевод. Пример: в полностью готовом обработанном проекте переключаюсь на "Разрезка страниц", чуть двигаю резак (на любой странице), потом переключаюсь на "Вывод".

У меня в центре окна выводится - по-английски -


Цитата:
Output is not yet possible, as the final size of pages is not yet known.
To determine it, run batch processing at "Select Content" or "Margins".


Хотя раньше эта надпись была русской.

Интересно - эта проблема только у меня или нет?

Ещё пример: когда закрываем СТ с несохранённым проектом, он спрашивает:

Цитата:
Save this project?

Я посмотрел в Qt Linguist файл C:\build\scantailor_featured\translations\scantailor_ru.ts
В классе Main Window, оказывается, есть строка "Save this project?" и есть её перевод на русский - так что по идее, СТ должен эту фразу по-русски писать.
Автор: LonerDergunov
Дата сообщения: 01.02.2013 18:48
monday2000

Цитата:
Что-то не смог повторить.

Я на последних версиях тоже не смог повторить.
Зато появился новый (?) баг на версии 2013.01.30 с прямоугольным выделением. Зажимаем Ctrl, ставим мышку в правый верхний или левый нижний угол, выделяем. Потом пытаемся изменить размер прямоугольной зоны выделения (зажимаем Ctrl и тянем за уголок) - зона выделения искажается и теряет прямоугольную форму.
Автор: monday2000
Дата сообщения: 01.02.2013 19:50
LonerDergunov
Да, и у меня тоже. Сейчас поправлю. Спасибо за баг!
Автор: monday2000
Дата сообщения: 01.02.2013 21:55
Поправил http://rghost.ru/43477179
Автор: TeXpert
Дата сообщения: 02.02.2013 11:55
Господа, подскажите, как подчистить внутренние края djvu-книги, не разбивая на отдельные страницы, может есть такая опция? Книгу сделали, не подчистив после сканирования

Спасибо
Автор: monday2000
Дата сообщения: 02.02.2013 17:30
TeXpert
Никак. Только "разбивая на отдельные страницы".

Добавлено:

Цитата:
Интересно - эта проблема только у меня или нет?

Отвечаю сам себе: Tulon прислал мне ответ:

Цитата:
Да, воспроизвелось что в 0.9.11.1, что в последней Git версии. Почему такое происходит - непонятно. Видимо lupdate спотыкается на каких-то конструкциях в MainWindow.cpp или в любом из включаемых файлов. Для решения этой проблемы кому-то придется очень серьезно попотеть.

Автор: NME
Дата сообщения: 02.02.2013 17:45
TeXpert
залить цветом фона.. где-то слышал про такой метод.. у monday2000 вроде бы даже программа специализированная для этого была
Автор: LonerDergunov
Дата сообщения: 02.02.2013 18:24
monday2000
Иногда попадаются сканы с разным размером страниц. Их нужно предварительно просматривать, потом ресайзить, приводя к единому значению. Возможно, стоит добавить функцию ресайза в Scan Tailor?
Конкретно хотелось бы ресайз на двух этапах:
1) На любом этапе обработки между вторым и четвёртым выводить предупреждение, что размер некоторых страниц значительно (например более 10% по ширине или высоте) отличается от остальных и предлагать выполнить ресайз до того размера, который имеют большинство страниц.
2) На пятом этапе (margins) - сделать возможность не только добавления полей, но и увеличения/уменьшения тех страниц, чей размер сильно выбивается из общего.

Добавлено:

Всё не могу понять - каким образом обрабатываются зоны PictureZones в режиме Mixed, можно ли отключить их обработку в целом или для конкретной страницы/конкретной зоны?
Иногда хочется чтобы выделенная зона никаким образом не обрабатывалась, а добавлялась в итоговый обработанный файл в том виде, в каком она была в исходном файле.

Ещё пожелания - на шестом этапе при переключении в режиме Mixed между вкладками Output, PictureZones и т.д. - сохранять увеличение изображения. То есть если на вкладке Output мы покрутили колёсико, приблизили изображение, перешли на PictureZones - и видим ту же самую зону приближенного изображения.
Тут же сделать вкладку Original - чтобы можно было видеть оригинальное изображение, и сразу же переключаясь между Original и Output - сравнить как было и как стало.
Автор: monday2000
Дата сообщения: 02.02.2013 22:13
LonerDergunov
Не обещаю. Некогда. А сами пожелания мне представляются заслуживающими реализации.

Добавлено:
Я скачал из Git самые свежие исходники оригинального Scan Tailor, собрал их и накатил туда все свои правки. Попутно я навёл порядок в своих правках - все аккуратно пометил (в исходниках), и даже подписал каждую правку, к какому именно исправлению она относится. Я составил для этого список условных обозначений своих исправлений:

1. Delete_3_Red_Points - удаление 3-х красных точек на самой верхней (нижней) горизонтальной синей линии сетки dewarping - при её создании.

2. Manual_Dewarp_Auto_Switch - автоматическое переключение на ручной режим dewarping, как только пользователь стронет с места синюю сетку dewarping.

3. Blue_Dewarp_Line_Vert_Drag - вертикальное перетаскивание самой верхней (нижней) горизонтальной синей линии сетки dewarping за её самую левую (правую) красную точку - с зажатым Ctrl.

4. Square_Picture_Zones - создание прямоугольных зон иллюстраций - с зажатым Ctrl.

5. Ortho_Corner_Move_Square_Picture_Zones - прямоугольное сдвигание углов (прямоугольных) зон иллюстраций - с зажатым Ctrl.

6. Export_Subscans - экспорт (суб)сканов.

Также мне удалось временно решить проблему перевода программы - по найденному мною глюку в официальной последней версии СТ - там слетел частично перевод. Написал Tulon о причинах, надеюсь, он подправит. Подробности, думаю, ожидаются. Так что теперь у меня сборка полностью переведена на русский - в части моих добавлений.

Сборка от 2013.02.02: http://rghost.ru/43502918
Автор: LonerDergunov
Дата сообщения: 02.02.2013 22:44
monday2000
Я и не рассчитывал на быструю реализацию, просто предложил то, чего мне не хватает.

А что насчёт вопроса о PictureZones ? Можно ли настроить вывод зоны в исходном виде? Или повлиять на алгоритм программы пользователю в данном случае невозможно и остаётся только смириться с результатом?
Не очень приятно когда чёрная выделенная зона становится белой (часть зоны преображается до неузнаваемости).
Автор: anagnost96
Дата сообщения: 03.02.2013 07:08
LonerDergunov

Попробуйте ветку Plus: это именно то, над чем работал DikBSD, когда добавил флажок, позволяющий отключить выравнивание освещения в смешанном режиме. Но результат Вас, возможно, разочарует, поскольку, как тогда объяснил Tulon, алгоритм определения зон предполагает, что освещение уже выровнено, и если этот этап пропустить, то конфигурация зон может оказаться довольно странной.
Автор: monday2000
Дата сообщения: 03.02.2013 11:42
LonerDergunov

Цитата:
Иногда попадаются сканы с разным размером страниц. Их нужно предварительно просматривать, потом ресайзить, приводя к единому значению. Возможно, стоит добавить функцию ресайза в Scan Tailor?

Такую фичу я бы не стал добавлять в СТ. Возни много, а эффекта мало. Т.е. это редко нужный функционал. Речь, видимо, идёт о TIF-файлах, полученных изначально путём экспорта из растрового PDF (собранного кривыми руками, с разнобойными значениями DPI для каждой страницы). Потом такие экспортированные страницы могут очутиться и в виде DjVu - такие DjVu я тоже встречал - и при экспорте из такого DjVu тоже получается разнобой по размерам.

ИМХО целесообразнее для таких целей использовать ScanKromsator - который сейчас на фоне СТ выглядит как "инструмент для редких случаев". Да и разнобойность таких сканов, как правило, кратна 2 или 4.

Scan Tailor ведь задумывался автором для грамотно сделанных сканов - а в качестве средства исправления результатов криворукости был задуман ScanKromsator.

Добавлено:
NME

Цитата:
залить цветом фона..

Залить-то можно, но это ничего не даст - заливка-то - полупрозрачная. Исправлять криворукие DjVu можно только через экспорт их в TIF и обработкой в СТ/СК.

Добавлено:
LonerDergunov

Цитата:
Ещё пожелания - на шестом этапе при переключении в режиме Mixed между вкладками Output, PictureZones и т.д. - сохранять увеличение изображения.

Правильная фича ИМХО. И всем нужная.

Цитата:
А что насчёт вопроса о PictureZones ? Можно ли настроить вывод зоны в исходном виде? Или повлиять на алгоритм программы пользователю в данном случае невозможно и остаётся только смириться с результатом?
Не очень приятно когда чёрная выделенная зона становится белой (часть зоны преображается до неузнаваемости).

Не совсем понимаю, о чём речь. Я ещё в этом вопросе не начинал разбираться. А что, режим Mixed принудительно применяет выравнивание освещения к сканам - и в таком виде их и выводит? А режим Серый/Цветной позволяет отказаться от этой принудительности? Никогда не обращал на это внимание...
Автор: anagnost96
Дата сообщения: 03.02.2013 12:18
LonerDergunov, monday2000


Цитата:
Иногда попадаются сканы с разным размером страниц. Их нужно предварительно просматривать, потом ресайзить, приводя к единому значению. Возможно, стоит добавить функцию ресайза в Scan Tailor?


Я правильно понимаю, что речь идет о ситуации, когда разница в размере получилась не из-за того, что страница объективно больше других, а из-за того, что она снята с неправильным разрешением? Тогда ресайзить ничего не нужно: достаточно принудительно установить для данного конкретного скана другое разрешение, что и позволит выровнять его размер на выходе с другими. СТ вполне позволяет это сделать, причем в последних версиях -- не только на этапе загрузки сканов, но и в любой момент работы (раньше это приходилось делать путем правки проекта в текстовом редакторе).

Так что, IMHO, нужный функционал присутствует, менять ничего не надо. Ну, конечно, для правильного подбора цифры разрешения требуются определенные усилия, но это всё же не так сложно.

Добавлено:
monday2000

Цитата:
А что, режим Mixed принудительно применяет выравнивание освещения к сканам - и в таком виде их и выводит? А режим Серый/Цветной позволяет отказаться от этой принудительности?


Да, именно так. Здесь была об этом обширная дискуссия, в ходе которой объяснялось, почему это сложно изменить. Возможность не выравнивать освещение в смешанном режиме была добавлена в ветке Plus, но нынешняя реализация представляет собой скорее хак, чем настоящее решение, поскольку зоны в этом случае определяются вкривь и вкось.
Автор: NME
Дата сообщения: 03.02.2013 12:40
monday2000

Цитата:
но это ничего не даст - заливка-то - полупрозрачная.

возможно, хотя это как-то странно..
изв. за но есть другой вариант - наложение непрозрачных аннотаций..

Цитата:
Исправлять криворукие DjVu можно только через экспорт их в TIF и обработкой в СТ/СК.  

на данный момент - да, но теоретически возможно написание программы, позволяющей редактирование DjVu без лишнего экспорта/повторного кодирования.. и, вполне возможно, что такая программа таки появится..
Автор: monday2000
Дата сообщения: 03.02.2013 13:52
anagnost96

Цитата:
Я правильно понимаю, что речь идет о ситуации, когда разница в размере получилась не из-за того, что страница объективно больше других, а из-за того, что она снята с неправильным разрешением?

Да, совершенно так.

Цитата:
Да, именно так. Здесь была об этом обширная дискуссия, в ходе которой объяснялось, почему это сложно изменить. Возможность не выравнивать освещение в смешанном режиме была добавлена в ветке Plus, но нынешняя реализация представляет собой скорее хак, чем настоящее решение, поскольку зоны в этом случае определяются вкривь и вкось.

А, понятно. Забавно. Ну это, наверное, можно попробовать изменить. Просто в случае mixed брать одноименный скан в режиме серый/цветной (с невыровненной освещённостью) и для каждого пикселя из mixed, который находится в зоне иллюстраций, делать подмену его на соответствующий ему пиксель из серого/цветного скана. Чёрно-белые области mixed, думаю, оставить как есть - т.е. пусть для них выравнивание освещенности (перед бинаризацией) сохраняется - ничего, кроме пользы ИМХО от этого не будет.

Действительно, даже странно, что Tulon сам этого не сделал. Такая фича, очевидно, должна быть сделана.


Добавлено:
Хорошо бы в режиме отладки глянуть - как называется "нетронутый" серый/цветной скан, откуда можно брать пиксели подмены. А то у меня нет такой картинки, где "порча зон" была бы визуально наглядна. Или дайте мне образец такой картинки.
Автор: LonerDergunov
Дата сообщения: 03.02.2013 14:21
monday2000

Цитата:
Речь, видимо, идёт о TIF-файлах, полученных изначально путём экспорта из растрового PDF (собранного кривыми руками, с разнобойными значениями DPI для каждой страницы). Потом такие экспортированные страницы могут очутиться и в виде DjVu - такие DjVu я тоже встречал - и при экспорте из такого DjVu тоже получается разнобой по размерам.


Цитата:
речь идет о ситуации, когда разница в размере получилась не из-за того, что страница объективно больше других, а из-за того, что она снята с неправильным

Разное бывает. Иногда и при обработке сырых сканов попадаются страницы с одинаковым DPI, но разным разрешением. Иногда сырые сканы - неполные, приходится добавлять отсутствующие страницы из другого источника (с другим разрешением и DPI) и хочется обрабатывать их все вместе, приводя в исходное состояние.
А в итоге получается манюнькая страничка и вокруг неё огромные белые поля. Приходится предварительно всё сверять, изменять размеры страниц в других программах.


Цитата:
ИМХО целесообразнее для таких целей использовать ScanKromsator

Посмотрю ещё в его сторону, хотя кода-то "не осилил" из-за обилия специфических функций, не понятных рядовому пользователю.


Цитата:
Не совсем понимаю, о чём речь

Визуально это выглядит примерно так.
Было: http://rghost.ru/43513096.view (выделяем верхнюю прямоугольную зону, если не выделять - результат такой же)
Стало: http://rghost.ru/43513114.view
Верхняя чёрная зона после обработки стала довольно странно выглядеть. Оно-то понятно, что вверху добавляется белая полоса и происходит выравнивание освещение, но результат не совсем корректный.


Цитата:
Чёрно-белые области mixed, думаю, оставить как есть

Лучше в Свойствах (Properties) для них сделать возможность выбора - выравнивать освещение или взять их из режима Mixed.


Цитата:
Попробуйте ветку Plus

Спасибо, помню ж вроде когда-то было нечто подобное.

monday2000
Ещё пожелания.
- Сделать выбор цвета подветки PictureZones. Синие мигающие зоны на серых страницах плохо различимы. В большинстве случаев вместо синего я бы предпочёл более контрастный красный.
Мигание - тоже не очень наглядно, приходится всматриваться, да и мигание начинается не сразу после переключения картинки. Удобней было бы добавть: если на этой странице зажать пробел - тогда зоны подсвечиваются сразу и постоянно, без мигания, отпустить пробел - мигание возвращается.

- Сделать выбор чувствительности зон картинок. Иногда выделяется по дефолту чересчур много, иногда чересчур мало в зависимости от качества скана...
- Сделать выбор чувствительности "Select Content". Иногда бывает, что во всех страницах остаются белые поля, иногда наоборот почти все страницы обрезаются чрезмерно - всё зависит от качества скана.
Автор: LonerDergunov
Дата сообщения: 03.02.2013 16:57
monday2000
Баг в версии от 02.02. Mixed. Зона картинок. Начинаю выделять зону, ставлю точку слева от изображения, потом ещё. В результате получаются лучи, выходящие из точки, которая немного выше левого верхнего угла картинки.
Автор: monday2000
Дата сообщения: 03.02.2013 17:25
Новая сборка.

Цитата:
В результате получаются лучи, выходящие из точки, которая немного выше левого верхнего угла картинки.

Исправлено.

Добавлено:

- Автосохранение существующего проекта.

Условное наименование:

Auto_Save_Project

1. Включается в меню Настройки - в виде новой отдельной галки. Значение сохраняется между сеансами работы с программой.

2. Действует только для существующего проекта, если проект не сохранён изначально пользователем, то автосохранение не работает.

3. Автосохранение происходит при переключении со скана на скан - как в ScanKromsator.

4. При пакетной обработке (кажется) тоже работает.

Короче, надо ещё эту фичу тестировать - правильно ли она работает, хорошо ли получилась. Лично мне она совсем без интереса - у меня СТ никогда не падает.

Сборка 2013.02.03: http://rghost.ru/43524866

Технические подробности: http://www.djvu-scan.ru/forum/index.php?topic=1137.msg5445#msg5445
Автор: monday2000
Дата сообщения: 03.02.2013 19:26
LonerDergunov

Цитата:
Стало: http://rghost.ru/43513114.view

Давайте сам исходный скан.

Добавлено:

Цитата:
Лучше в Свойствах (Properties) для них сделать возможность выбора - выравнивать освещение или взять их из режима Mixed.

Из моего опыта сканобработки - это излишне. Выравнивание освещённости всегда благоприятно сказывается на последующей бинаризации.

Цитата:
Ещё пожелания.

Не, такие я точно не буду делать. Есть более актуальные проблемы.
Я буду делать только самые важные, самые бесспорные, и самые всем нужные фичи. А также я не намерен захламлять Scan Tailor до состояния ScanKromsator.
Автор: LazyKent
Дата сообщения: 03.02.2013 19:52
monday2000, так где брать изменённый вами исходный код или патчи?

Автор: LonerDergunov
Дата сообщения: 03.02.2013 20:12

Цитата:
Давайте сам исходный скан.

http://rghost.ru/43526322


Цитата:
Не, такие я точно не буду делать.

Вам виднее, у меня опыта мало в этом вопросе. Просто попадаются сканы разного качества. На некоторых после автообрезки приходится править чуть ли не все страницы из-за того, что недорезалось, на других - обрезается лишнее, и выбор чувствительности был бы весьма кстати. То же самое про выделение картинок - иногда автоматом выделяется чересчур много ненужного (скан тёмный, текст серый, пятна на страницах).
А красная подсветка на синих страницах всяко наглядней и быстрее воспринимается взглядом, чем синим по серому.
Автор: monday2000
Дата сообщения: 03.02.2013 22:18
Официальный выпуск моего клона Scan Tailor:

Scan Tailor Featured

https://sourceforge.net/projects/scantailor/files/scantailor-devel/featured/
Автор: unreal666
Дата сообщения: 03.02.2013 22:42

Цитата:
Ещё пожелания.
- Сделать выбор цвета подветки PictureZones. Синие мигающие зоны на серых страницах плохо различимы. В большинстве случаев вместо синего я бы предпочёл более контрастный красный.
Мигание - тоже не очень наглядно, приходится всматриваться, да и мигание начинается не сразу после переключения картинки. Удобней было бы добавть: если на этой странице зажать пробел - тогда зоны подсвечиваются сразу и постоянно, без мигания, отпустить пробел - мигание возвращается.

+1.
Синий цвет фигово видно. Красный был бы лучше. Да и по части мигания верно подмечено.

Добавлено:
monday2000

Цитата:
Из моего опыта сканобработки - это излишне. Выравнивание освещённости всегда благоприятно сказывается на последующей бинаризации.

выравнивание освещенности часто косячит содержимое зон картинок. Поэтому возможность его отключения желательна.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.