Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: driver1991
Дата сообщения: 16.07.2014 10:45
slava_kry


Цитата:
Отключают для того, чтобы сканы были одинаковыми по контрасту/яркости/цвету.


Сразу оговорюсь - о цвете речь не идет.

При отключении настроек получается одинаковое качество сканов для всей книги (книга - как пример). Я думаю то, что книги бывают разные - дотаточно известно. Логично предположить, что качество сканов при этом тоже получается различным.

Как мне представляется, люди, посещающие этот форум, хотят получить качественно оцифрованную книгу или какой-то другой печатный материал. Работа с Кромсателем - не самоцель. Может быть, я предъявляю слишком большие требования к умственным способностям людей, но, как мне кажется, довольно легко и достаточно логично предположить, что если предложить СК к обработке плохие сканы, то на выходе получится соответствующий результат. Технология производства конфет из дерьма еще плохо отлажена во всем мире. Какого-то значительного улучшения плохих сканов нельзя добиться ни в одном графическом редакторе, не говоря уже о пакетной обработке, что-то улучшить можно только в определенных и достаточно ограниченных пределах. К сожалению, качество печати оставляет желать много лучшего, и это не только в России. но и во многих других странах. Поэтому мне представляется, что улучшая качество исходных сканов, можно добиться лучшего конечного результата при облегчении, и может быть значительном, процесса обработки.

Когда на сканах просвечивают буквы с другой стороны страницы, то бороться с этим трудно. Когда издатель объявляет борьбу за экономию типографской краски и цвет букв весьма незначительно отличается от цвета бумаги - с этим боротся также затруднительно. Когда на странице часть текста просто не видна, а часть - настолько же черна, как совесть издателей, в результате вся страница похожа на географическую карту, то единственное, чем можно получить хоть какие-то более или менее нормальные результаты - настройки сканера. Другого варианта я не вижу.
Автор: VadimirTT
Дата сообщения: 16.07.2014 19:21

Цитата:
Может быть, я предъявляю слишком большие требования к умственным способностям людей, но, как мне кажется, довольно легко и достаточно логично предположить, что если предложить СК к обработке плохие сканы, то на выходе получится соответствующий результат. Технология производства конфет из дерьма еще плохо отлажена во всем мире.

Не хочется всё цитировать, но поймите одну вещь, всего одну, от сканирования требуется получить на выходе максимально контрастную картинку, а дальше всё в ваших руках, неужели Вы считаете, что софт сканера, рассчитанный на среднюю погоду по больнице умнее Вас?
Автор: slava_kry
Дата сообщения: 17.07.2014 06:53

driver1991
Вы странно представляете сканирование, тем более поточное. Вы стадию "обработки сканов" упихиваете в само сканирование, что, конечно же, прекрасно, но мало реализуемо. При необходимости желательно сканы обработать прежде чем их отдавать СК.
И в дальнейшем по сканированию нужно топать сюда: http://forum.ru-board.com/topic.cgi?forum=93&bm=1&topic=3514&start=1560#lt

VadimirTT

Цитата:
от сканирования требуется получить на выходе максимально контрастную картинку

Вы чутка ошиблись. Не "максимально контрастную картинку", а максимум информации (разрешение и ДД) и не более, остальное можно сделать програмно.

Автор: driver1991
Дата сообщения: 17.07.2014 10:41
slava_kry

Во-первых, спасибо за нормальный ответ, это один из немногих случаев, когда пришла информация, а не высказывания о личности спрашивающего.


Цитата:
Вы стадию "обработки сканов" упихиваете в само сканирование


Ни в коем случае.


Цитата:
желательно сканы обработать прежде чем их отдавать СК.
- именно этого я и хочу. Т. е. сканы должны быть подготовлены к обработке в СК, в идеале в СК надо устанавливать резаки и порог бинаризации. Профиль в СК должен быть таким, чтобы оптимально обработать получаемые сканы. Естественно, этих профиле может или должно быть несколько, скажем, для книг с плохой печатью и бумагой, для страрых книг и т. д., но число их досаточно ограничено, А вот сканы должны отвечать определенным требованиям и их перед тем, как отдать в СК нужно обработать. Сканы должны, конечно, иметь высокий контраст. но ведь контраст может быть настроен и в сканере. Выпадение элементов букв и знаков препинания - это, вероятно, требует увеличения разрешения при сканировании, что может замедлить прицесс сканирования, но снимет головную боль при обработке и, возможно, ускорит ее. Не понял абревиатуру ДД и не понял также какой максимум информации должен содержать скан, кроме разрешения.
Давать в СК плохие сканы и надеяться на чудо - тоже вариант, только это может долго продолжаться.

Спасибо за топик о сканах, я его не смог найти.
Автор: VadimirTT
Дата сообщения: 17.07.2014 12:28

Цитата:
Не "максимально контрастную картинку", а максимум информации

Да, чуть попутал, конечно же речь идет о максимальном динамическом диапазоне.

Цитата:
При необходимости желательно сканы обработать прежде чем их отдавать СК.

Это еще за чем? Для чего СК делался?
Автор: ScrewDriver78
Дата сообщения: 17.07.2014 14:36

Цитата:
Какого-то значительного улучшения плохих сканов нельзя добиться ни в одном графическом редакторе, не говоря уже о пакетной обработке, что-то улучшить можно только в определенных и достаточно ограниченных пределах.


Сканов "плохих" не бывает. Бывают сканы неправильные. Отличную книгу можно сделать даже с очень слабоконтрастного серого скана разрешением в 100-150 dpi, если он еще свежий и не изуродован никакими постобработками.
Гораздо труднее привести в порядок материал, который или зажимали в джипег с низким качеством, или в djvu с неправильными настройками. Вот это _опа.


Цитата:
Когда на сканах просвечивают буквы с другой стороны страницы, то бороться с этим трудно.

Вообще не проблема.

Цитата:
Когда издатель объявляет борьбу за экономию типографской краски и цвет букв весьма незначительно отличается от цвета бумаги - с этим боротся также затруднительно.

То же самое, наименьшее из зол.

Цитата:
Когда на странице часть текста просто не видна, а часть - настолько же черна, как совесть издателей, в результате вся страница похожа на географическую карту, то единственное, чем можно получить хоть какие-то более или менее нормальные результаты - настройки сканера.

Вот это уже сложнее, но тоже решается.

Единственное, что требуется от сканера - это чтобы в выходном файле, в идеале самые светлые участки бумаги были "0,0,0", а самые темные участки шрифта - "FF.FF.FF". Или близко к тому. Это легко настраивается кривой по гистограмме предпросмотра. А все остальное решается постобработкой.


Цитата:
Давать в СК плохие сканы и надеяться на чудо

Я "даю в СК" отвратительные сканы и получаю отличные результаты. Всё зависит от рук, головы и опыта. Надеятся на чудо, конечно, глупо
Автор: driver1991
Дата сообщения: 17.07.2014 15:10
ScrewDriver78

Был бы очень благодарен за конкретные указания, как Вы убираете просвечивающие буквы, слабый контраст и другие указанные недостатки.
Утверждать, что


Цитата:
Я "даю в СК" отвратительные сканы и получаю отличные результаты. Всё зависит от рук, головы и опыта. Надеятся на чудо, конечно, глупо


может каждый, вот результатов я не видел. Конечно, чего-то можно добиться, но с затратой такого количества времени, что пропадает всякое желание этим заниматься.

Я меня есть плохие сканы. можете Вы описать и показать, что можно из них сделать и сколько это займет времени?
Автор: VadimirTT
Дата сообщения: 17.07.2014 15:39
driver1991
Выложите несколько страничек сканов, желательно без предобработки и сжатия в джипег.
Автор: driver1991
Дата сообщения: 17.07.2014 16:11
VadimirTT

Вот два развоторота:

https://yadi.sk/i/q2ehn9B0WnXrR

https://yadi.sk/i/mGl65ubTWnXwG

Это необработанные сырые сканы.

Забыл указать: 300 DPI, серые, 8 бит.
Автор: VadimirTT
Дата сообщения: 17.07.2014 19:27
driver1991
С ходу, пока без обработки, у Вас сканы разворот размером 1280 на 1002 точек, а у меня одна страница, при сканировании в 300 дпи, 1468 на 2336?
Говорят, что джипег 100% не портят сканы, но я в любом случае его избегаю, на контрастных переходах, границы букв, джипег делает ореол, с этим бороться наверное можно, но зачем?
Для примера некоторые мои сканы, это отнюдь не hi-fi, но так может сделать каждый, при соблюдении минимальных правил.

Добавлено:
Вот что у меня получилось, но это "ужас, ужас, ужас"!
Можно ли устранить притензии, озвученные выше?
Автор: driver1991
Дата сообщения: 17.07.2014 20:24
VadimirTT

Я сейчас открыл эти сканы в IrfanView, вот данные:

Current size 3029x2370 pixels.

Это в обоих случаях. Т. е. если увеличить ширину Вашей страницы вдвое (разворот). получится приюлизитеоьно те же размеры, что и у Вас. Я ничего не сжимал и при сканировании всегда отключаю все сжатия и другие обработки. Почему к Вам попали такие файлы - я не могу понять. Я также не сжимал их, когда грузил на яндекс. Размер файла должен быть 7 102 кВ.

Я сгрузил файлы с яндекса - размеры не изменены.

Если у Вас есть время - прикиньте, в чем может быть причина и скажите, что нужно сделать?

Я сегодня пытался сканировать с переменной контрастностью, интересно, что выпадение элементов букв происходит при любой контрастности.


Вдогонку.

Вот мой скан:
http://rutracker.org/forum/viewtopic.php?t=4692421. Там есть еще несколько.
Автор: VadimirTT
Дата сообщения: 17.07.2014 20:55
driver1991
Приношу извинение, скачал с яндекса немного не то, вот вариант, соответствующий оригинальному скану.
Случай действительно сложный, характерный для худлита советских времен, у меня те же проблемы с Тагором, может гуру помогут, тут нужен не стандартный подход.
Автор: driver1991
Дата сообщения: 17.07.2014 21:24
VadimirTT

"Не ошибается только тот, кто ничего не делает", так что здесь-то ничего страшного. Что действительно плохо - это то, что при сканировании даже с разной контрастностью, оказывается, выпадают элементы букв и это не восстановишь. И хотя текст на взгляд нормальный, сканы получаются плохие, ну Вы видели. Это издание Булгакова 1999 года, но от этого оно лучше не стало. Вот с Тютчевым проблем не было.
Автор: VadimirTT
Дата сообщения: 17.07.2014 21:44
driver1991
Булгакова не видел, но и к Тютчеву у меня притензии.
Могли бы Вы рассказать, как Вы сканировали и обрабатывали.
У Тютчева явные глюки джипега, так назывемые изъеденные буквы.
В делании е-буков, самое затратное по времени это сканирование. Сканировать собрания сочинений, почти подвиг . Так что, есть повод разобраться с деталями. Надеюсь, что примут участие и более древнии аксакалы.
Автор: driver1991
Дата сообщения: 17.07.2014 22:10
VadimirTT

Претензии - это не страшно, это можно исправить.

Я всегда сканирую и обрабатываю без сжатия, поэтому о каких-либо скажениях букв в результате использования "сжимающих" программ речи быть не может. "Изъеденность" букв есть на сканах, почему меня этот вопрос и волнует.

Какие подробности Вас интересуют? Так я мог бы подробнее ответить на все вопросы.


Цитата:
примут участие и более древнии аксакалы
было бы хорошо, но у них обычно нет времени.

Насчет Булгакова - задайте на сайте в поиске "Булгаков". Там же есть еще мои Ахматова, Гумилев, Хлебников, Блок, Волошин, Пушкин... Они не без греха, но читабельны.
Автор: shch_vg
Дата сообщения: 18.07.2014 00:24
VadimirTT
driver1991
Вы тему случайно не перепутали?
Вам же давали ссылку на тему, где это обсуждается.
Автор: ScrewDriver78
Дата сообщения: 18.07.2014 08:18

Цитата:
вот результатов я не видел

Вот раздача - http://rutracker.org/forum/viewtopic.php?t=1633242 - все 1800 документов (кроме десятка pdf, и десятка изначально качественных) обработаны мной.


Цитата:
но с затратой такого количества времени

А кто вам обещал, что будет легко и быстро? SK - инструмент, отличная острая стамеска в руках мастера. А дальше - или ручками, или не делать совсем.


Цитата:
Был бы очень благодарен за конкретные указания, как Вы убираете просвечивающие буквы, слабый контраст и другие указанные недостатки.

Подбираются режимы обработки; самый простой вариант - адаптивный порог, если не срабатывает - далее по вкусу, увеличение резкости, коррекция контрастности, чистка фона в разных режимах и т.д. Всё подбирается на одной странице, наиболее показательной; потом применяется ко всей книге, проходится пакетной обработкой, результат просматривается, выпадающие из общего результата страницы обрабатываются отдельно.



Добавлено:

Цитата:
Вот два развоторота:

http://rghost.ru/56955070 - очень быстро, буквально пять минут, пора на работу бежать.
Стоило бы увеличить разрешение выхдного файла до 600 - у шрифта слишком тонкие перемычки, и поиграть с очисткой фона, но это не успеваю.
Автор: driver1991
Дата сообщения: 18.07.2014 10:54
ScrewDriver78

То, что Вы сделали действительно можно сделать за пять минут. К сожалению, потери элементов в буквах, например, потеря перемычек у буквы "н" во многих местах текста, так и остались. Почистить остатки просвечивающего текста на открытых местах - тоже не "сильно" трудно. Эти разговоры "поиграть" и прочее - остаются только разговорами, хороших результатов я не видел. Даже если увеличить разрешение на выходе до 1200 - потерянные элементы букв не появятся, ни один графический редактор не может этого сделать, потому что он не может догадаться, что там за буква, не знает он их, неграмотный. Увеличение порога бинаризации ведет к появлению грязи.

Игры с чисткой фона также имеют границы, к сожалению. Очистка между букв приводит к потере знаков препинания, а иногда даже к потере элементов букв.

Где Вы видели, что я требую "легко и быстро"? Но между разумными затратами времени на получение хорошого результата и работой, которая может длиться месяцами с неопределенным результатом - на мой взгляд разница есть.

Свои выкладки на рутрекере я указал, так что кое-какой опыт есть.

Вообще, господа, я очень благодарен, когда мне хотят помочь, но мы здесь являемся участниками форума, кто мы и что мы - никому из нас неизвестно, некоторые имеют знания и опыт, соответствующие тематике форума, остальные приходят учиться и что-то узнавать. Давайте жить дружно, не поучать, а учить и делиться опытом, а не хамить. У нас говорят: "Тот, кто спрашивает - невежда, а тот, кто не спрашивает - остается невеждой навсегда".
Автор: ScrewDriver78
Дата сообщения: 18.07.2014 11:42

Цитата:
Игры с чисткой фона также имеют границы, к сожалению. Очистка между букв приводит к потере знаков препинания, а иногда даже к потере элементов букв.

Надо побирать размер спекла под скан, чтобы не пропадали знаки.


Цитата:
Даже если увеличить разрешение на выходе до 1200 - потерянные элементы букв не появятся

больше 600 бесполезно. Касательно потерянных элементов букв - то тут есть два варианта: если шрифт такой, что они не пропечатываются, так их и взять неоткуда; а если они физически ОЧЕНЬ тонкие, существенно тоньше пикселя при разрешении скана 300 dpi - то воленс-ноленс придется сканить в 400 или 600. Или сканить в цвете, а фон смахивать вручную "мэджик клинером".


Цитата:
Давайте жить дружно, не поучать, а учить и делиться опытом

В случае СК всё настолько индивидуально для каждого скана, что научить чему-либо тут IMHO невозможно. Некоторые сканы, которые я не могу возможности получить в лучшем состоянии, вылеживаются у меня годами, я делаю по нескольку заходов - пока ВНЕЗАПНО не получается оптимальная комбинация настроек именно для этого варианта.

А чаще в критических случаях я просто прощаю себе небольшую "загрязненность" текста, не мешающую чтению. В конце концов, реальные книги практически всегда имеют небольшую замусоренность, и ничего.
То есть при выборе - или потери шрифта, или загрязненность шрифта, я предпочитаю загрязненность потерям.


Цитата:
ни один графический редактор не может этого сделать, потому что он не может догадаться, что там за буква, не знает он их, неграмотный

Да, к сожалению, пока нет продукта, сочетающего мощь СК и FineReader-a. А хотелось бы...
Автор: driver1991
Дата сообщения: 18.07.2014 12:25

Цитата:
Надо побирать размер спекла под скан


По моему опыту - 8 - 9 пикселей, больше уже рискованно, тогда обрабатывать только небольшие площади и очень внимательно смотреть, достаточно часто некоторые знаки препинания теряются и при этих значениях. Здесь уже играет роль время.


Цитата:
Касательно потерянных элементов букв

Здесь в последнее время меня достали некоторые издания.
Ситуация такова. В книге на странице все выглядит нормально, все буквы и все их элементы хорошо видны. На сканах пропадают элементы букв. При этом увеличение контрастности не дает никакого улучшения, иногда уменьшение яркости дает лучший результат, но это не всегда.
Я заметил, что эта особенность имеет место на книгах отпечатанных репринтными способами, т. е. на тех, книгах, которые были репродуцированы (каким-либо способом), и печатаются с диапозитивов или как там это все называется, я с этим еще не разбирался. Наткнулся я на это чисто случайно, при сканировании перепечатки Пушкина, выпущенной "Воскресеньем" (не могу удержаться - отвартительное издательство). При сканировании одного тома этого издания у меня выпали две страницы. В пределах досягаемости у меня есть старое издание 1930-х годов. Я сравнил их, разницы никакой (ведь перепечатка!), отсканировал недостающие страницы и вставил эти страницы. Сканы страниц старого издания получились идеальными, хотя и сканер и метода и руки остались теми же.


Цитата:
или потери шрифта, или загрязненность шрифта


Есть вариант очистки вручную, но это - рабский труд и, как я уже писал, о-о-о-чень долго.


Цитата:
пока нет продукта, сочетающего мощь СК и FineReader-a


Мне все-такм кажется, что bolega прав, когда не хочет расширять СК. Здесь одни цели и задачи и если расширять их - то может получиться нечто не только неуправляемое, но и содержащее огромное количество ошибок.
Автор: ScrewDriver78
Дата сообщения: 18.07.2014 13:03

Цитата:
Я сравнил их, разницы никакой (ведь перепечатка!), отсканировал недостающие страницы и вставил эти страницы. Сканы страниц старого издания получились идеальными, хотя и сканер и метода и руки остались теми же.


Хранение материала и печать осуществляются в цифре, с низким разрешением. А оригинал - аналоговый. Поэтому при переводе уже "цифрового" изображения еще раз в цифру неизбежно возникает интерференция между "их" разрешением и вашим. Т.е. часть "их" пикселей попадает в ваш скан только краями, и результирующие пиксели оказываются очень бледными.
Решение неожиданное - может помочь повышение разрешения скана вдвое ПОСЛЕ сканирования и размытие (blur) - перед обработкой. Пару раз мне это помогало вытянуть читаемое качество из очень убитых исходников.
Автор: driver1991
Дата сообщения: 18.07.2014 14:02

Цитата:
неизбежно возникает интерференция между "их" разрешением и вашим


Насколько я понимаю, при репродуктивной печати оригинал проходит (или его проводят) через следующие стадии:
1. Оцифровка исходого оригинала.
2. Сохранение полученной копии.
3. Печать нового оригинала с сохраненной копии.
4. Полученный оригинал не имеет никакго отношения к цифре(?), он аналоговый.

Далее, я вновь сканирую имеющийся оригинал. Если можно, подробнее, откуда здесь интерференция, чего с чем и откуда? Новый аналоговый результат "помнит" о цифре?

Похожая, возможно(?), ситуация иногда возникает, когда в СК используется "Background cleaner" в "Gray enhance", там тоже черные пискели многда становятся белыми. Но там есть "Protect black pixels", после чего получается нормальная картинка.
Автор: ScrewDriver78
Дата сообщения: 18.07.2014 15:33

Цитата:
4. Полученный оригинал не имеет никакго отношения к цифре(?), он аналоговый.

Какой же он аналоговый, если фотошаблон, с которого делается матрица, печатается на лазер-гравере? Положим, это неплохой лазер-гравер и разрешение у него 600 dpi. У вашего сканера тоже 600, но чуть-чуть другие. В итоге пиксели вашего сканера то попадают точно в середину их пикселей, то, через какой-то промежуток - смещаются к краю. И одинаковые элементы шрифта то получаются отлично, то совсем бледно.
Когда печать традиционная - такого быть не может, расстояние между элементами шрифта меняется столбец к столбцу (я имею в виду столбцы пикселей сканера) случайно, и целиком перемычка в букве "н" пропасть не может, могут выпасть только отдельные точки и это будет незаметно.
Автор: bolega
Дата сообщения: 15.08.2014 14:20
Работа над новой версией СК почти подходит к завершению.

Новое:

- Обработка распределяется параллельно по нескольким процессорам/ядрам. Кол-во задействованных ядер задается пользователем: File->Options->Processing->Number of used cpu kernels.
Скорость параллельной обработки в зависимости от используемых опций выросла в 2..5 раз (проверялось на 4-х ядерном i5).

- Используется новый менеджер памяти, позволяющий СК выполнять обработку сканов большого размера. В предыдущей версии обработка таких сканов аварийно завершалась с сообщением out of memory.
Программа откомпилирована с ключом, позволяющим использовать более 2 Гб оперативной памяти каждым процессом (при соответствующей настройке windows).

- После обработки сканов прямо в окне VR можно выполнять быструю ре-бинаризацию результата с другими значениями порога бинаризации. Для этого СК сохраняет в папке out промежуточный обработанный, но небинаризованный файл. Это требует достаточно большого объема свободного места на ж/диске.

- В окне VR можно выполнять переобработку выбранной зоны, не выходя из окна. Параметр File>Options>Processing: Restore zone position after reprocessing определяет, нужно ли помещать зону в положение, которое было перед переобработкой, либо оставлять ее в расчетном месте.

- На закладке Quality два новых фильтра: Blur2, Sharpen2. Это аналоги одноименных фильтров Blur, Sharpen, но более сильные. Sharpen2 особенно эффективен в случае жирного текста.
Все фильтры на закладке переписаны на MMX-ассемблере и выполняются быстрее в несколько раз.

- Фильтр sharpen в Gray image enhance переписан на MMX-ассемблере. Макс. значение радиуса фильтра уменьшено до 5.

- Фильтр Enhance contour [Auto] в Gray image enhance переписан на MMX-ассемблере и выполняется на порядок быстрее.

- Диапазон значений радиуса фильтра Gauss blur увеличен вдвое чтобы регулировка была более плавной. Задания и профили, созданные в предыдущих версиях, будут при открытии автоматически подстраивать значение радиуса. Т.е. значение 1 в старом задании соответствует значению 2 в новом.

- В опции picture-зон добавлены фильтры Mean, Blur2, Sharpen2, Autolevels, Background substract. Опция mean может эффективно применяться для удаления растра (наряду или вместо descreen). Background substract позволяет избавляться от паразитного фона, как правило желтого. Autolevels автоматически улучшает контраст/яркость, степень улучшения регулируется одним параметром.
Добавлена кнопочка Info, выдающая информацию о геометрических свойствах зоны, на входе и на выходе.
Каждая зона имеет свойство Group index. Это число от 1 до 10. При копировании опций зоны (всех, одной или набора) на другие зоны можно указать, что опции следует копировать только на зоны с заданным Group index.

- Для защиты рваных букв от despeckle введены новые опции: Page>Special>Protect: Protect from despeckle и Protect from white hole filling. Защита реализована с использованием OCR-движка Tesseract.
В опциях пользователь выбирает язык (один или более) распознавания (включены наиболее распространенные языки) и задает, какие буквы следует защищать, например "инймМ". Множество букв для despeckle и hole filling задается независимо. Следует отметить, что скорость работы Tesseract чрезвычайно мала, но результат того стоит, если печать в книге очень плохая, в частности, если пропадают перемычки, кусочки серифов и проч. части букв. Следует иметь также ввиду, что результат защиты целиком зависит от точности распознавания Tesseract. На мой взгляд, Tesseract вполне сносно распознает русский текст, по крайней мере, в том объеме, который необходим СК.
Опции защиты применяются как к странице, так и к picture-зонам.

- Новая команда Zones>Paste zone to other pages. Зону, скопированную в карман, можно продублировать на заданном диапазоне страниц. Задается диапазон страниц, а также способ горизонтального и вертикального выравнивания зоны при вставке (оригинальное положение, в заданную точку, в левый верхний угол, в левый нижний и т.д.)

- Работа с библиотекой глифов пополнилась рядов усовершенствований: регулировка представления окошка с глифами (количество колонок, авто-ширина), мульти-выделение и мульти-перетаскивание глифов внутри окошка, авто-кроп вставляемых глифов (удаление лишнего белого пространства вокруг глифа), добавление заданного белого зазора со всех сторон глифа.
Добавлена возможность авто-установки глифа в место вставки: теперь не обязательно точно выбирать точку вставки глифа, СК сам постарается найти оптимальное положение для вставки, анализируя некоторую окрестность вблизи курсора.

- В гл. окне список последних открываемых файлов расширен до 5. Имя последнего из открытых файлов помещается всегда в конец.

- В гл. окне произвольное выделение, полученное с помощью magic wand, можно преобразовать в полигональную зону. Ранее magic-выделение преобразовывалось только в прямоугольную зону.

- File>Options: Max number of vertexes in polygonal zones (=300) задает максимально допустимое количество вершин в полигональной зоне. Если при создании зоны количество вершин превосходит это значение, СК автоматически оптимизирует полигон для достижения предельного числа вершин.
Там же новая опция exclude pic-zones from magic-wand selection. При включении опции magic-wand selection не будет захватывать имеющиеся на странице picture-зоны.

- Если в режиме mouse-up-zone расставлять зоны, то в случае нажатого Shift тип зоны будет всегда exclude независимо от текущего значения переключателя Mouse-up-mode.

- Новая опция Quality>Gray enhnce>Contrast: apply contrast/brightness before illumination correction. Назначение понятно из названия.

- Немного изменен алгоритм deskew:art, теперь он должен точнее работать для разряженных страниц.

- Реорганизовано и упорядочено контекстное меню главного окна и окна VR.

- Новая опция окна VR: Options>Editor: paste point location. При вставке изображения (из кармана или библиотеки глифов) точкой вставки может быть или верхний угол глифа, или его середина.

- Новые hotkey для гл.окна: "Fit width", "Rotate&save", "Выделить следующую picture-зону", "Выделить предыдущую picture-зону".

- Новые hotkey для окна VR: Add glyph to library, Insert glyph to library

- при создании djvu в лог пишется командная строка вызова DEE

- Пути к утилитам в File>Options>Apps (djvulib, dee и т.д.) могут задаваться относительными. Для этого они должны начинаться с символа точки, напр. "..\folder", "..\..\folder", ".\folder". Пути считаются заданными относительно папки с исполняемым файлом.

- Унифицированы принципы именования файлов при импорте из pdf и djvu. Исключена возможность перезаписи файлов в случае, когда импорт выполняется в одном и том же задании несколько раз.

- Исправлен баг с утечкой памяти при создании djvu.
- Исправлен баг: форма полигональной зоны на выходе в процессе обработки определяется неверно в случае, когда резак пересекает ребро зоны под малым острым углом или касается его края.
- Исправлен баг с опцией File->Options->Processing->process priority: ранее смена значения не влияла на реальный приоритет. Приоритет меняется только на время выполнения обработки.
- Исправлен баг: при выполнении draft kromsate с использованием параметра Use options from = named profile из выбранного профиля не применялись глобальные опции обработки (Files->dpi, color; Book->gaps; Options и т.п.).
- Исправлен баг: при импорте pdf при извлечении раскрашенных зон в опции picture-зон помещался правильный цвет раскраски, однако опция paint text color "enabled" не включалась.

- Параметр File>Options>Misc: Temp folder for djvu creating задает временную папку, используемую для хранения временных файлов при создании djvu.

- Закладка binarization: у полей threshold новая команда в контекстном меню - "Change threshold...". Позволяет менять порог бинаризации с учетом дополнительных условий. Задается диапазон файлов, способ изменения (поменять на новое значение, прибавить к существующему значению заданную величину, вычесть из существующего значения) и опционально два логических условия (>,=, <>, <, <=, >=). Условия соединяются оператором "и" или "или". Пример команды: увеличить на 10 порог тех файлов, у которых на текущий момент порог лежит в диапазоне 150..180. Еще пример: заменить порог на 180 у тех файлов, у которых на текущий момент порог <185. Команда влияет не только на файлы, у которых порог задан явно, но и на файлы с порогом auto, при условии, что auto-значение уже определено в результате обработки. На пороги smooth и highdark команда не действует.

- В контекстном меню зон две новые команды: "convert to convex polygon" и "convert to enclosing circle". Первая преобразует форму произвольной полигональной зоны в выпуклую, вторая - в окружность минимального диаметра, которая содержит внутри себя все вершины полигона зоны (minimum enclosing circle).

- После обработки маркированных зон (команда Zones>Picture zones>process marked zones for files...) в окне VR выводятся только те страницы, зоны на которых были обработаны. Соответственно появилась новая команда Result>show for pages with marked zones.

- В окне VR можно включать отображение сетки с заданным шагом. На команду включения/отключения сетки добавлен hotkey.

- Значение параметра smoothness фильтра C.Smooth может быть равно 0. При этом искажения контуров букв будут минимальными, сглаживание будет в основном затрагивать только горизонтальные и вертикальные участки контуров. Если вы считаете, что сглаживание данным фильтром слишком сильное, задайте smoothness=0, round=middle, thickness=130..150.

- В поля book size, gap можно загружать значения из заранее подготовленного списка стандартных размеров. Список хранится в отдельном текстовом файле. Предлагается готовый список типовых типографских размеров книг.
Автор: Torino
Дата сообщения: 15.08.2014 15:28

Цитата:
Работа над новой версией СК почти подходит к завершению

Олег, спасибо, что не бросаете эту замечательную программу!
Автор: shch_vg
Дата сообщения: 15.08.2014 18:16
bolega

Цитата:
- После обработки сканов прямо в окне VR можно выполнять быструю ре-бинаризацию результата с другими значениями порога бинаризации.
А это распространяется на режим просмотра "Zones" и на обработку отдельной зоны на странице?

P.S. Две последние возможности - супер!
Автор: bolega
Дата сообщения: 15.08.2014 22:38
shch_vg

Цитата:
А это распространяется на режим просмотра "Zones" и на обработку отдельной зоны на странице?

Пере-обработку зоны выполнять можно, не выходя в главное окно. What's new поправил.
Ре-бинаризация (по сути интерактивная) не влияет на зоны и не затрагивает их.
Автор: Gazoved
Дата сообщения: 16.08.2014 01:00
bolega

Цитата:
- В гл. окне произвольное выделение, полученное с помощью magic wand, можно преобразовать в полигональную зону

А можно добавить еще жестко несколько фигур, раньше был только квадрат, а часто помимо полигонов бывает круг, может его есть возможность жестко задать?

Спасибо большое за нововведения!!!
Ожидаем
Автор: shch_vg
Дата сообщения: 16.08.2014 02:20
bolega
Забыл спросить насчет черноты полигональной picture-зоны после выполнения команды merge.
Автор: VadimirTT
Дата сообщения: 16.08.2014 05:37
Gazoved

Цитата:
А можно добавить еще жестко несколько фигур, раньше был только квадрат

В 5.96.2 это уже есть: эллипс, лассо и полигон

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.