Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: Olive77
Дата сообщения: 16.06.2010 09:44
romanef
А что, Zones->Picture zone->Merge zones ... не работает?
Автор: romanef
Дата сообщения: 16.06.2010 09:49

Опс, спасибо, а я искал в постобработке....
Автор: ghosty
Дата сообщения: 16.06.2010 10:19
Torino

Цитата:
Коллеги, прошу помочь с настройками для приложенного фрагмента.
Мне не удалось подобрать параметры, при которых не терялась бы часть перемычек (например, в букве "х").

Там проблемы нет, и быть не может: перемычки все на месте, фон равномерный, значит, всегда можно выделить текст без каких-либо потерь. Может быть, взяли не самый удачный образец - т.е. есть хуже?

Если пользоваться моим профилем, то все, что нужно будет сделать - увеличить порог бинаризации до 230. Если и в этом случае где-то будут проявляться проблемы, то можно снизить Illum.Corr до 5-ти.

http://rapidshare.com/files/399553835/test.rar.html
Автор: Torino
Дата сообщения: 16.06.2010 13:02
ghosty
Я однажды уже попадался на эту удочку - пытался обработать качественный скан умными фильтрами СК.
Не приняв в расчет, что эти фильтры созданы для "вытягивания" некачественных сканов.
В данном случае помогло отключение ВСЕХ инструментов grey enhance с последующей бинаризацией ))
Спасибо ))
Автор: ghosty
Дата сообщения: 16.06.2010 13:36
Torino

Цитата:
Я однажды уже попадался на эту удочку - пытался обработать качественный скан умными фильтрами СК.
Не приняв в расчет, что эти фильтры созданы для "вытягивания" некачественных сканов.

Совсем не обязательно. Умные фильтры на то и умные Надо очень постараться, чтобы заставить их портить сканы.
Автор: Torino
Дата сообщения: 16.06.2010 13:48
Ну вот конкретый пример:
при включенном grey enhance
включаем background cleaner, настройки не трогаем.
Проверяем - т.к. скан был волнистым, то часть букв жирные и сливаются друг с другом, а другая часть - без перемычек.
Включаем autolevels - результат лучше, но неприемлемый.
Включаем correct illumination (normal) - яркость выравнивается, но буквы истоньшаются.
Другие способы correct illumination также дают неприемлемый результат.
Отключаем БК...

Ну и так далее. Я весь вечер провел играя с настройками и пришел к выводу, что чем меньше фильтров мы используем - тем качественней результат.
Автор: ghosty
Дата сообщения: 16.06.2010 14:15
Torino
Попробуйте начать все-таки с моего профиля (в сборке) - там все более менее оптимизировано для 60-70% книг. Причем я использовал при его составлении не только свою статистику и опыт, но и представления других участников, и, прежде всего, самого автора СК, о настройках, используемых ими по умолчанию.

Например, BC и IC лучше, по-моему, вообще не использовать одновременно - результат действительно может оказаться непредсказуемым, да и параметров слишком много получается.

Главное ведь, чтобы контролируемых параметров было как можно меньше. Поэтому я и постарался сделать так, чтобы пользователю оставалось крутить только один параметр - порог бинаризации. Все остальные алгоритмы более или менее адаптивны. Лишь в крайних случаях можно покрутить Ill.Corr.

В последней версии есть возможность адаптивной бинаризации, но пока она реализована не совсем надежно, ИМХО. А так можно было бы теоретически сделать полностью "автоматизированный" профиль
Предлагаю, кстати, в следующей версии сделать такой профиль включенным по умолчанию.
Автор: Torino
Дата сообщения: 16.06.2010 15:11
ghosty
Спасибо ))
Автор: shch_vg
Дата сообщения: 19.06.2010 15:55
Сканирую бюллетени газетного типа (А4) в цвете в 300dpi и без обработки в Сканкромсаторе компилирую в djvu в Lizardtech Document Express Editor.
После завершения компиляции в нем же есть возможность посмотреть содержимое отдельных страниц как в foreground, так и в background.
В background практически на каждой странице вижу много мусора, который хотелось бы удалить.
Вопрос, касающийся Сканкромсатора:
можно ли это как-то сделать средствами Сканкромсатора (конечно, не из djvu, а из тифов перед компиляцией) как автоматически, так и вручную?
М.б. для этого есть еще какие-то средства?
Автор: ghosty
Дата сообщения: 19.06.2010 22:06
shch_vg
Т.к. примеров не выложено, тоже спрошу, пробовали ли мой профиль?
Автор: shch_vg
Дата сообщения: 20.06.2010 02:17
ghosty

Цитата:
пробовали ли мой профиль?

Нет, т.к. в Вашей инструкции написано, что он оптимизирован под серые сканы, а я работаю с цветными.
Выложить пример мне не составит труда, но один скан около 19 мб. Могу его предварительно Сканкромсатором загнать в ПДФ с JPG quality=80%, получится около 2 мб. Такой вариант можно скачать по этому адресу.
Автор: ghosty
Дата сообщения: 21.06.2010 07:11
shch_vg

Цитата:
а я работаю с цветными
Да, не заметил, извините - бросилось в глаза слово "газетного". На этой неделе уезжаю, поэтому помочь не смогу, к сожалению.

Цитата:
Выложить пример мне не составит труда, но один скан около 19 мб. Могу его предварительно Сканкромсатором загнать в ПДФ с JPG quality=80%, получится около 2 мб.

Наверное, ни у кого не будет проблем скачать 19мб. Но можно сжать с помощью JPG2000. В обычном джипеге будут неприятные артефакты.
Автор: VadimirTT
Дата сообщения: 05.07.2010 22:48
Есть страницы с цветными заголовками, можно ли в кромсаторе как то их раскрашивать?
Автор: C0USIN
Дата сообщения: 09.07.2010 15:01
VadimirTT

bolega уже отвечал на подобный вопрос в теме Scan Tailor:
http://forum.ru-board.com/topic.cgi?forum=5&topic=27424&start=840#9

Цитата:

Цитата: На данное время разбираюсь, как пользователь, с возможностью создания многослойных pdf с возможностью "подцвечивания" каждого слоя "однобитный" изображений - бывают малоцветные изображения (черный и пурпурный на белой бумаге)

Именно так создает pdf сканкромсатор (так называемые раскрашенные зоны) - зона (слой) помещается в pdf как 1-битная, а раскрашивается уже средствами самого pdf.
Автор: VadimirTT
Дата сообщения: 09.07.2010 15:25
C0USIN
спасибо
кстати, bolega дал ответ тут
Автор: bookserg
Дата сообщения: 12.07.2010 17:30
Имеется изрядное количество сканов следующего типа:
http://img340.imageshack.us/img340/7283/0002xh.png
http://img24.imageshack.us/img24/410/0005v.png
http://img688.imageshack.us/img688/7782/0007g.png
http://img34.imageshack.us/img34/8006/0004n.png
У многих букв имеются тонкие перемычки и виден текст с обратной стороны.
Какие фильтры в "grey enhance" лучше использовать в данной ситуации?
Автор: slava_kry
Дата сообщения: 13.07.2010 13:40
Вам поможет такой вариант.
Как он делается в СК я не знаю
Сначала накладываете страницу на саму себя 2 раза в режиме Overlay, а потом уже делать апсемплинг с бинаризацией. При наложении Overlay светлые места (127-255) становятся светлее, тёмные (0-127)- темнее. Дубликаты букв пропадают. При бинаризации нужно подобрать порог.
Автор: juvaforza
Дата сообщения: 14.07.2010 10:55
У меня попался пример, на котором нижний резак отображается не вертикальной линией, а "косой" (диагональной). Такие проблемы часто бывают?
разобрался сам.
Автор: berzSPB
Дата сообщения: 15.07.2010 13:22
slava_kry, я так понимаю это в фотошопе, если да, то можно подробнее
пример файла прилагается, как получить приемлемое качество обработки
http://www.onlinedisk.ru/file/477218/

Добавлено:
Уважаемые, кто силен в ScanKromsator, как добротно обработать подобные сканы (1000 шт), чтобы и текст читался и картинки смотрелись
http://www.onlinedisk.ru/file/477218/
Автор: Palis
Дата сообщения: 15.07.2010 13:27
Здравствуйте.
Спасибо Вам за
Ваши труды.

У меня такая незадача.
Болею опухолью мозга (астроситома 3 степени).
Не могу читать книги с компьютера, с белым фоном.
Например: djvu.
Я делаю так: разбираю djvu на tiffs в программе djvu_small_v0_4.
Потом в Irfane , в пакетном режиме применяю color corrections.(R -115 G -145 B -255).
Получаю текст на цветном фоне и собирают tifs в программе djvu_small_v0_4.



Получается не очень резко, сильно устаю читать.
Посоветуетe лучший способ. Я бы хотел, научился
пакетно присоединять фон (темно-коричный) к черно-белым текстам.
Побывал c помощью СК 92 beta. Не окрашивает. Мне кажется, пакетно не получется.
С надеждой, уважением, Петр.
suntrest2006@mail.ru (http://print-palisander.narod.ru/)
Автор: slava_kry
Дата сообщения: 15.07.2010 19:07
berzSPB
Отправил в ПМ
Автор: Torino
Дата сообщения: 15.07.2010 20:52
Palis
Петр, что касается djvu:
программа WinDjView
Меню -> Настройки
Вкладка "Отображение".
Галочка "Применить коррекцию отображения".
Ползунками убираете Яркость и Контраст.
Для начала можно попробовать оба значения на -50.
Программа лежит здесь:
http://windjview.sourceforge.net/ru/
Автор: monday2000
Дата сообщения: 16.07.2010 14:08
Palis

Цитата:
Посоветуетe лучший способ. Я бы хотел, научился
пакетно присоединять фон (темно-коричный) к черно-белым текстам.

Особой проблемы сделать такое нет. Если подождёте с неделю, я сделаю для этого специальную программу.

Сейчас делайте так:

1. Открываете DjVu-файл в WinDjView.
2. На каждой странице делаете одно и то же:
- Нажимаете на панели инструментов кнопку "Выделить область".
- Мышью выделяете всю текущую страницу целиком.
- По правой кнопке мыши в контекстном меню выбираете пункт "Параметры аннотации".
- Ставите там желаемый цвет и прозрачность.

Данные об этих аннотациях хранятся в реестре, так что при переносе такой "раскрашенной" DjVu-книги с компа на комп нужно делать Экспорт-Импорт раскраски через Файл - Экспорт закладок... и (на другом компе) Файл - Импорт закладок...

Я давно собирался сделать программу, которая автоматизирует подобный процесс раскраски. Будете указывать только цвет и прозрачность - и нажатием кнопки раскрашивать сразу всю книгу.

Добавлено:
Преимущество такой раскраски в том, что она позволяет "подкрашивать" в т.ч. и DjVu-книги с иллюстрациями - а не только чёрно-белые. А также такая раскраска наиболее проста, быстра, и не увеличивает размер DjVu-книги.

Цитата:
Болею опухолью мозга (астроситома 3 степени).

Желаю полного выздоровления. Не отчаивайтесь, ищите пути излечения. По телевизору иногда показывают самые невероятные истории выздоровления людей от тяжелейших недугов - даже от таких, которые официальная медицина уже отказывалась лечить в таком-то конкретном случае.
Автор: bookserg
Дата сообщения: 16.07.2010 16:21

Цитата:
Имеется изрядное количество сканов следующего типа:
http://img340.imageshack.us/img340/7283/0002xh.png
http://img24.imageshack.us/img24/410/0005v.png
http://img688.imageshack.us/img688/7782/0007g.png
http://img34.imageshack.us/img34/8006/0004n.png
У многих букв имеются тонкие перемычки и виден текст с обратной стороны.
Какие фильтры в "grey enhance" лучше использовать в данной ситуации?



Цитата:
Вам поможет такой вариант.
Как он делается в СК я не знаю
Сначала накладываете страницу на саму себя 2 раза в режиме Overlay, а потом уже делать апсемплинг с бинаризацией. При наложении Overlay светлые места (127-255) становятся светлее, тёмные (0-127)- темнее. Дубликаты букв пропадают. При бинаризации нужно подобрать порог.


slava_kry, спасибо за ответ... Я про такую возможность знаю.
К сожалению эта процедура приводит к утоньшению букв, а это в данном случае неприемлемо...
Ну а что знатоки SK? Неужели никто не может подсказать?
Автор: monday2000
Дата сообщения: 16.07.2010 16:37
Palis
Вот буквально за пару часов накропал прототип программы по раскраске DjVu:

http://www.onlinedisk.ru/file/477946/ (55 КБ)

Это лишь демо - для иллюстрации.

Использование:

1. Положите на диск "С:\" файл "1.djvu".

2. Запустите программу и нажмите кнопку "Generate tint file".

3. Создастся файл "С:\1.bookmarks".

4. Открываете файл "1.djvu" в WinDjView и делаете "Файл - Импорт закладок...", указывая там файл "1.bookmarks". И всё - Ваш DjVu-файл тут же закрасится.

Пока что закрашивается тёмно-зелёным с прозрачностью 50%. Пока я не сделал полнофункциональной версии, чтобы изменить цвет и прозрачность закраски, можно поправить желаемым образом файл "1.bookmarks" в любом текстовом редакторе (это простенький XML-файл) - пакетно заменив значения цвета и прозрачности (fill-color и fill-transparency) на желаемые (это нет проблем сделать хоть в WordPad).

Извиняюсь за такой оффтоп, просто захотелось помочь человеку побыстрей.

PS Недостаток подхода в том, что "закрашивается" и текст (маска), что снижает контрастность чтения (это плохо).
Автор: berzSPB
Дата сообщения: 16.07.2010 21:39
Уважаемые, подскажите имеет ли значение порядок наложения фильтров для grey enchance, или же программа пакетно их применяет по своему внутреннему порядку ?
Автор: Arcand
Дата сообщения: 17.07.2010 05:56
bookserg

Ответил здесь
Автор: slava_kry
Дата сообщения: 17.07.2010 06:35
bookserg
С обработкой в другой топик
Ответил здесь
Автор: shch_vg
Дата сообщения: 21.07.2010 01:08
bolega
Пытался Сканкромсатором импортировать пдф. Это удалось, но оказалось, что почти все импортированные сканы двухстраничные 300 дпи ч/б(нормальная страница + инверсная).
Можно было бы заново загрузить эти сканы и на вопрос, в каком виде их загружать, ответить - в обычном, а после обрабатывать, НО...
Есть еще один тип импортированных сканов. В сканкромсаторе он представлен как простой одностраничный 150 дпи серый, но в папке импорта присутствует с номером + 1 двухстраничный пдф, который вместе с отраженным в СК дает целую страницу.
Возможно ли Сканкромсатором обработать подобное как один скан?
Автор: bolega
Дата сообщения: 21.07.2010 09:18
shch_vg
Мне бы глянуть на эти pdf. А то ничего не понял

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.