Автор: bolega
Дата сообщения: 15.08.2014 14:20
Работа над новой версией СК почти подходит к завершению.
Новое:
- Обработка распределяется параллельно по нескольким процессорам/ядрам. Кол-во задействованных ядер задается пользователем: File->Options->Processing->Number of used cpu kernels.
Скорость параллельной обработки в зависимости от используемых опций выросла в 2..5 раз (проверялось на 4-х ядерном i5).
- Используется новый менеджер памяти, позволяющий СК выполнять обработку сканов большого размера. В предыдущей версии обработка таких сканов аварийно завершалась с сообщением out of memory.
Программа откомпилирована с ключом, позволяющим использовать более 2 Гб оперативной памяти каждым процессом (при соответствующей настройке windows).
- После обработки сканов прямо в окне VR можно выполнять быструю ре-бинаризацию результата с другими значениями порога бинаризации. Для этого СК сохраняет в папке out промежуточный обработанный, но небинаризованный файл. Это требует достаточно большого объема свободного места на ж/диске.
- В окне VR можно выполнять переобработку выбранной зоны, не выходя из окна. Параметр File>Options>Processing: Restore zone position after reprocessing определяет, нужно ли помещать зону в положение, которое было перед переобработкой, либо оставлять ее в расчетном месте.
- На закладке Quality два новых фильтра: Blur2, Sharpen2. Это аналоги одноименных фильтров Blur, Sharpen, но более сильные. Sharpen2 особенно эффективен в случае жирного текста.
Все фильтры на закладке переписаны на MMX-ассемблере и выполняются быстрее в несколько раз.
- Фильтр sharpen в Gray image enhance переписан на MMX-ассемблере. Макс. значение радиуса фильтра уменьшено до 5.
- Фильтр Enhance contour [Auto] в Gray image enhance переписан на MMX-ассемблере и выполняется на порядок быстрее.
- Диапазон значений радиуса фильтра Gauss blur увеличен вдвое чтобы регулировка была более плавной. Задания и профили, созданные в предыдущих версиях, будут при открытии автоматически подстраивать значение радиуса. Т.е. значение 1 в старом задании соответствует значению 2 в новом.
- В опции picture-зон добавлены фильтры Mean, Blur2, Sharpen2, Autolevels, Background substract. Опция mean может эффективно применяться для удаления растра (наряду или вместо descreen). Background substract позволяет избавляться от паразитного фона, как правило желтого. Autolevels автоматически улучшает контраст/яркость, степень улучшения регулируется одним параметром.
Добавлена кнопочка Info, выдающая информацию о геометрических свойствах зоны, на входе и на выходе.
Каждая зона имеет свойство Group index. Это число от 1 до 10. При копировании опций зоны (всех, одной или набора) на другие зоны можно указать, что опции следует копировать только на зоны с заданным Group index.
- Для защиты рваных букв от despeckle введены новые опции: Page>Special>Protect: Protect from despeckle и Protect from white hole filling. Защита реализована с использованием OCR-движка Tesseract.
В опциях пользователь выбирает язык (один или более) распознавания (включены наиболее распространенные языки) и задает, какие буквы следует защищать, например "инймМ". Множество букв для despeckle и hole filling задается независимо. Следует отметить, что скорость работы Tesseract чрезвычайно мала, но результат того стоит, если печать в книге очень плохая, в частности, если пропадают перемычки, кусочки серифов и проч. части букв. Следует иметь также ввиду, что результат защиты целиком зависит от точности распознавания Tesseract. На мой взгляд, Tesseract вполне сносно распознает русский текст, по крайней мере, в том объеме, который необходим СК.
Опции защиты применяются как к странице, так и к picture-зонам.
- Новая команда Zones>Paste zone to other pages. Зону, скопированную в карман, можно продублировать на заданном диапазоне страниц. Задается диапазон страниц, а также способ горизонтального и вертикального выравнивания зоны при вставке (оригинальное положение, в заданную точку, в левый верхний угол, в левый нижний и т.д.)
- Работа с библиотекой глифов пополнилась рядов усовершенствований: регулировка представления окошка с глифами (количество колонок, авто-ширина), мульти-выделение и мульти-перетаскивание глифов внутри окошка, авто-кроп вставляемых глифов (удаление лишнего белого пространства вокруг глифа), добавление заданного белого зазора со всех сторон глифа.
Добавлена возможность авто-установки глифа в место вставки: теперь не обязательно точно выбирать точку вставки глифа, СК сам постарается найти оптимальное положение для вставки, анализируя некоторую окрестность вблизи курсора.
- В гл. окне список последних открываемых файлов расширен до 5. Имя последнего из открытых файлов помещается всегда в конец.
- В гл. окне произвольное выделение, полученное с помощью magic wand, можно преобразовать в полигональную зону. Ранее magic-выделение преобразовывалось только в прямоугольную зону.
- File>Options: Max number of vertexes in polygonal zones (=300) задает максимально допустимое количество вершин в полигональной зоне. Если при создании зоны количество вершин превосходит это значение, СК автоматически оптимизирует полигон для достижения предельного числа вершин.
Там же новая опция exclude pic-zones from magic-wand selection. При включении опции magic-wand selection не будет захватывать имеющиеся на странице picture-зоны.
- Если в режиме mouse-up-zone расставлять зоны, то в случае нажатого Shift тип зоны будет всегда exclude независимо от текущего значения переключателя Mouse-up-mode.
- Новая опция Quality>Gray enhnce>Contrast: apply contrast/brightness before illumination correction. Назначение понятно из названия.
- Немного изменен алгоритм deskew:art, теперь он должен точнее работать для разряженных страниц.
- Реорганизовано и упорядочено контекстное меню главного окна и окна VR.
- Новая опция окна VR: Options>Editor: paste point location. При вставке изображения (из кармана или библиотеки глифов) точкой вставки может быть или верхний угол глифа, или его середина.
- Новые hotkey для гл.окна: "Fit width", "Rotate&save", "Выделить следующую picture-зону", "Выделить предыдущую picture-зону".
- Новые hotkey для окна VR: Add glyph to library, Insert glyph to library
- при создании djvu в лог пишется командная строка вызова DEE
- Пути к утилитам в File>Options>Apps (djvulib, dee и т.д.) могут задаваться относительными. Для этого они должны начинаться с символа точки, напр. "..\folder", "..\..\folder", ".\folder". Пути считаются заданными относительно папки с исполняемым файлом.
- Унифицированы принципы именования файлов при импорте из pdf и djvu. Исключена возможность перезаписи файлов в случае, когда импорт выполняется в одном и том же задании несколько раз.
- Исправлен баг с утечкой памяти при создании djvu.
- Исправлен баг: форма полигональной зоны на выходе в процессе обработки определяется неверно в случае, когда резак пересекает ребро зоны под малым острым углом или касается его края.
- Исправлен баг с опцией File->Options->Processing->process priority: ранее смена значения не влияла на реальный приоритет. Приоритет меняется только на время выполнения обработки.
- Исправлен баг: при выполнении draft kromsate с использованием параметра Use options from = named profile из выбранного профиля не применялись глобальные опции обработки (Files->dpi, color; Book->gaps; Options и т.п.).
- Исправлен баг: при импорте pdf при извлечении раскрашенных зон в опции picture-зон помещался правильный цвет раскраски, однако опция paint text color "enabled" не включалась.
- Параметр File>Options>Misc: Temp folder for djvu creating задает временную папку, используемую для хранения временных файлов при создании djvu.
- Закладка binarization: у полей threshold новая команда в контекстном меню - "Change threshold...". Позволяет менять порог бинаризации с учетом дополнительных условий. Задается диапазон файлов, способ изменения (поменять на новое значение, прибавить к существующему значению заданную величину, вычесть из существующего значения) и опционально два логических условия (>,=, <>, <, <=, >=). Условия соединяются оператором "и" или "или". Пример команды: увеличить на 10 порог тех файлов, у которых на текущий момент порог лежит в диапазоне 150..180. Еще пример: заменить порог на 180 у тех файлов, у которых на текущий момент порог <185. Команда влияет не только на файлы, у которых порог задан явно, но и на файлы с порогом auto, при условии, что auto-значение уже определено в результате обработки. На пороги smooth и highdark команда не действует.
- В контекстном меню зон две новые команды: "convert to convex polygon" и "convert to enclosing circle". Первая преобразует форму произвольной полигональной зоны в выпуклую, вторая - в окружность минимального диаметра, которая содержит внутри себя все вершины полигона зоны (minimum enclosing circle).
- После обработки маркированных зон (команда Zones>Picture zones>process marked zones for files...) в окне VR выводятся только те страницы, зоны на которых были обработаны. Соответственно появилась новая команда Result>show for pages with marked zones.
- В окне VR можно включать отображение сетки с заданным шагом. На команду включения/отключения сетки добавлен hotkey.
- Значение параметра smoothness фильтра C.Smooth может быть равно 0. При этом искажения контуров букв будут минимальными, сглаживание будет в основном затрагивать только горизонтальные и вертикальные участки контуров. Если вы считаете, что сглаживание данным фильтром слишком сильное, задайте smoothness=0, round=middle, thickness=130..150.
- В поля book size, gap можно загружать значения из заранее подготовленного списка стандартных размеров. Список хранится в отдельном текстовом файле. Предлагается готовый список типовых типографских размеров книг.