Admig314 Такое исправление вроде делает
Book Restorer.
Tulon Отчет по Rev.258:
- Кнопка "Автоматически переходить к выбранной страницу" может переименовать в "Включить автоматическую прокрутку"? А то, если бы я на форуме не прочитал, не понял бы что это означает.
- в продолжение этой функции: Если во время Пакетной обработки выделить обработанный скан, обработка останавливается. Это известный факт? Если ДА, то я не вижу смысла "прокрутки ленты", если по сканам нельзя щелкнуть для просмотра результата. В ней есть смысл, если реализовать фоновую обработку, по примеру фонового распознавания в FineReader-е, когда можно увидеть результат уже в процессе обработки.
- Если возможно, предлагать по-умолчанию сохранять проект в папке с исходными сканами (сейчас: первично - это установочная папка программы; затем - папка предыдущего проекта).
- При ручной проходке на этапе Полезная область (проверял только здесь) лента предпросмотра остается на месте (на 1-м скане). При переходе на другой этап и возврате в "Полезную область", лента стала перемещаться.
Сначала думал, что то баг. Как выяснилось, причиной могла быть выключенная кнопка автоскроллинга. Но зачем её функция при ручной обработке? Может оставить её действие только в режиме Пакетной обработки, а при ручной - постоянное действие автоскроллинга?
- Впервые компенсация наклона сработала "никак" (парвда это связано с кривым сканом - табличные границы не перпендикулярны друг другу) - см. примеры (Наклон\).
- Очередной пример картинки, не вошедшей в полезную область - Рисунок\aa_0197.tif.
- Рисунок\aa_0083.tif - после предварительного поворота на 90 град - в полезную область вошла незначительная часть рисунка (в нижней правой части страницы).
- Ситуация: после декодирования ч/б книги (решил попробовать не в битональном - вышло в 256 color) очень на многих страницах книги обрезались низ букв нижней строчки и вчерх букв верхних строк. (примеров не представил)
- В частности: Рисунок\aa_0222.tif - вся нижняя строка не вошла в область; aa_0241.tif - вся нижняя формула не вошла в область.
- На будущее: не мешало бы сделать в нижнем поле программы (или отдельное окно) счетчик времени предположительного завершения Пакетной обработки. Надо же знать сколько кофе пить...
- Despeckling:
- программе пока сложно работать с ч/б сканами для очистки.
Очистка\ aa_0009.tif, 0009_aa_0009.tiff - удалил полезный контент в таблице - символы ",,". Но в остальном очисткой доволен.
Очистка\ aa_0082.tif, 0082_aa_0082.tiff - удалена даже четкая штриховка на рисунке.
Очистка\ aa_0001.tif, 0001_aa_0001.tiff - удалены точки в строках содержания (странно, они же такие большие...).
- с появлением Despeckling функция "исключения" области из обработки ещё более актуальна (см. примеры).
Вот и сами материалы -
http://narod.ru/disk/5464135000/Scan-Test-258.7z.html Как результат, пришлось вернуться в SK, т.к. потери контента для меня неприемлемы. В новых сборках буду продолжать тестировать Despeckling, т.к. эта функция сейчас для меня самая сырая (да ещё и неуправляемая).
Сейчас хотел бы от вас услышать, реально ли улучшить ситуацию с исчезновением полезного контента при Despeckling? По идее, решение должно быть. SK справился с этими местами без дополнительных шаманств. При этом степень очистки от мусора как всегда на уровне. Жду мнение на этот счет.
ИМХО, в Despeckling сейчас важнее это поправить, а потом улучшать очистку мусора, которая и так уже очень хороша. Есть примеры, которые для меня практически образцовые (Очистка\Образцы хорошей очистки).