Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: monday2000
Дата сообщения: 27.11.2009 11:23
bolega
У меня возникла такая идея: можно в СТ делать авто-распознавание зон - а потом результат этого автораспознавания загружать в СК, преобразуя его в Picture-зоны (альтернативно можно реализовать автораспознавание Picture-зон в СК по алгоритму из СТ).

Не могли бы Вы дать спецификацию формата out-task? Я бы тогда написал программу-конвертор СТ-СК для зон.
Автор: Arcand
Дата сообщения: 27.11.2009 18:03
monday2000
Угомонитесь! Что Вы суетитесь, обойдутся без нас
Автор: monday2000
Дата сообщения: 28.11.2009 10:15
Arcand
А мне же побыстрее хочется. Точнее, пара свежеотсканенных книжек с кучей полутоновых картинок нужно побыстрее сделать. СТ меня не устраивает (т.к. слабовато выравнивание освещёности и нет исправления искривленных строк), а в СК зоны руками натыкивать явно не вариант (особенно на фоне того, как СТ великолепнейше и без единой ошибки авто-распознал все несколько десятков полутоновых иллюстраций в обоих книжках).
Автор: Arcand
Дата сообщения: 28.11.2009 10:43
monday2000

Цитата:
А мне же побыстрее хочется.
Можете посмотреть плагины к Корелу и Фотошопу
http://abab.front.ru/ScanTools/ScanTools.ZIP
Исходники http://abab.front.ru/ScanTools/ScanTools_scr.ZIP
Там есть плагин выделения растровых рисунков
Автор: monday2000
Дата сообщения: 28.11.2009 11:39
Arcand
Смотреть где - в PictureMask.cpp?

Мне бы получать массив данных о зонах на скане: количество зон и координаты вершин зон.

Добавлено:
PictureMask.cpp - это же исходники DLL-библиотеки. А где основной код - оперирующий функциями из DLL и, собственно, выполняющий всю работу программы?


Добавлено:
А как Вы сумели реализовать на низком уровне матлабовские функции из скрипта http://alexrey036.narod.ru/graylayers.html U235, где взяли исходники?
Автор: Gazoved
Дата сообщения: 28.11.2009 13:35
Проблемки, обратите внимание!

При обработке цветных сканов, если использовать автоматическое выравнивание страниц (Deskew) и не поставить крыжик в окошке Art, то изображение конвертируется в Grey, тоже происходит и при поставленном крыжике а окошке Ortho, для сохранения оригинального цвета необходимо поставить крыжик в окошке Art или вовсе отключить Deskew.
Это правильно или это БАГ? Разумеется для выходного файла устанавливается Color - Original.


В закладке Options пункт Text vert. sensivity и Text horiz. sensivity перепутаны местами, т.е. комментарий, выскакивающий при наведении правильно отображает – где-что, а подписи – перепутаны.

Помогите!!

Недавно занимался обаботкой определителей по грибам это около 400 страниц в каждой книге на каждой странице - цветные рисунки (исходники сканил в 300 dpi), часть картинок выделял руками, а страницу переводил в 600 dpi, позже начал делатоь следующим образом: отключил какую-либо обработку страниц, кроме despecle и Deskew, после обрезания определял средний цвет фона и делал чистку усредненным цветом, единственное, что не знаю как сделать так это как назначить для этой операции Hot key, может кто подскажет?

P.S.
Вопрос в определении координат картинок стоит очень остро!
Автор: Olive77
Дата сообщения: 28.11.2009 14:26
Gazoved
может это http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=29984&start=520#6 поможет.

P.S.: СК сейчас под рукой нет.
Автор: monday2000
Дата сообщения: 28.11.2009 15:48
Gazoved
Скорее всего, баг. Ну делайте Deskew отдельно: т.е. загрузите сканы в СК, нажмите clear all options and mark all. Задайте Ctrl + Deskew, нажмите Process! и получите на выходе свои цветные выровненные сканы (в 5.92 сейчас попробовал - работает без глюков).

Затем закройте СК, откройте свой СК (5.93?), загрузите сканы, и делайте уже всё остальное (зоны и т.п.).
Автор: monday2000
Дата сообщения: 28.11.2009 19:25
Gazoved

Цитата:
не знаю как сделать так это как назначить для этой операции Hot key, может кто подскажет?

Может, поможет программа AutoIt http://www.autoitscript.com/autoit3/ - спросите, как ею пользоваться у U235 - вот у него на сайте всякие примеры её использования: http://alexrey036.narod.ru/
Автор: DikBSD
Дата сообщения: 30.11.2009 08:27
Здравствуйте! Совсем недавно стал пользоваться SK. Нужна помощь в настройках для вот такого скана: http://ifolder.ru/15227353
Скан бледненький. Но главное - на правом развороте у линии сгиба буквы светлее, чем на остальной части этого разворота. Т.е. ситуация, обратная к тени от изгиба.
После Process! эти буквы получаются рваные, более тонкими и кое-где наполовину исчезнувшими.
Все мои манипуляции с опциями бинаризации и Gray enhance ни к чему не привели.
Подскажите, КАКИЕ надо выставить настройки и ГДЕ?
Спасибо!
Автор: shch_vg
Дата сообщения: 01.12.2009 19:47
DikBSD
Заключите область со светлыми буквами в одну или несколько (если эта область не прямоугольная) picture-зону(ы), в свойствах зоны задайте Color=B/W, а в Thr выберите Custom, а затем выбирайте значение по вкусу.
Автор: Olive77
Дата сообщения: 02.12.2009 10:20
DikBSD
я бы заключил светлые буквы в change contrast region.
Установите contrast = 15.
Еслу захотите поиграться с установками, на закладке Quality нажимаете Gray enhance и выбирайте там закладку Contrast.

P.S.: я еще на стадии кромсания (draft kromsate) выбрал опцию Light scan.
На стадии обработки, в закладке Quality, blur=2, sharpen=1
Автор: DikBSD
Дата сообщения: 02.12.2009 19:08
Спасибо за ответы, попробую...

Добавлено:
Только что попробовал на сканах. Мне больше понравился метод Olive77. Не ожидал такого прекрасного результата от серых, бледных сканов с пересветкой части одной стороны!!! Огромное спасибо за советы, а bolego - за его прогу.
Одно у меня плохо - таких сканов у меня где-то 200 (часть книги). Контрастные зоны придется ставить на все эти сканы - много времени понадобится. Но - это лучше, чем сделать книгу отвратительного качества.
Автор: Melirius
Дата сообщения: 05.12.2009 16:21
Баг, 5.93, Win7x64: даже если отключить тулбары, то резаки сверху всё равно начинаются так, как будто строка тулбаров есть - не с самого верха картинки.
Автор: shch_vg
Дата сообщения: 07.12.2009 17:43
bolega
Добавил в задание около 50 разворотов, на них задал множество picture-зон, обработал эти развороты и приступил к ручной очистке полученных страниц, забыв сохранить текущее состояние задания.
После скачка электричества (даже ИБП не сработал ) нашел только предыдущее состояние задания.
Вопрос: можно сделать так, чтобы не создавать заново зоны, а выбирать из уже имеющихся pic.xxxx.tif, тем более что какое-то количество из них уже было обработано до скачка элекстричества?
Автор: Smokeer
Дата сообщения: 08.12.2009 14:21
лучше автосохранение заданий через заданые промежутки времени
Автор: monday2000
Дата сообщения: 09.12.2009 21:42
Что-то давненько не видно bolega. Не случилось ли чего...
Автор: VadimirTT
Дата сообщения: 09.12.2009 22:55
monday2000
может он Вас послушался: сжег исходники и принял постриг...
Автор: Arcand
Дата сообщения: 10.12.2009 06:26
monday2000

Цитата:
А как Вы сумели реализовать на низком уровне матлабовские функции из скрипта http://alexrey036.narod.ru/graylayers.html U235, где взяли исходники?
Исходники в основном взял из головы
Автор: wasp238
Дата сообщения: 11.12.2009 08:15
Нашлась неприятность (использую сборку от ghosty, настройки не трогал). Проблема в плохой обработке текста когда его мало на странице. Но иногда все нормально обрабатывается. Вот что я имею ввиду - пример:
1) Правая часть разворота (где мало текста) обработалась нормально.

2) Левая часть разворота (где мало текста) обработалась плохо - текст довольно трудно прочитать.


Подскажите, пожалуйста как можно исправить, и где настроить?
Автор: Azazel82
Дата сообщения: 13.12.2009 20:24
Есть скан - http://ifolder.ru/15456113 -14,5 Мб (В качестве примера выкладываю 2 файла) Как сделать чтобы буквы на сгибе на правых страницах меньше всего пострадали при переводе в ч/б tif ? Подскажите пожалуйста какие опции надо изменить. Делал по руководству, результат не очень хороший.
Автор: telenin20
Дата сообщения: 14.12.2009 14:08
Вот что получилось http://ifolder.ru/15468005 - 0,552 мгб
пиши в ПМ
Автор: Dimock
Дата сообщения: 17.12.2009 12:38
Мне прислали словарь в формате PDF. Нужно конвертировать его в tiff-ы, чтобы с их помощью находить ошибки распознавания в PDF- файле. Будет ли файл на выходе таким же “оригинальным”, как исходник? Например, после сканирования, распознавания и конвертации в PDF буква “l” превратилась в “i”. Станет ли буква “i” опять “l”, если PDF преобразовать обратно в tiff-ы?
Автор: VadimirTT
Дата сообщения: 17.12.2009 13:23
Dimock
в тифах будет то же что и в пдф, если только пдф не скан страниц с наложенным текстовым слоем.
Автор: Dimock
Дата сообщения: 17.12.2009 19:50
VadimirTT

Если в СК после импорта 500 страниц ПДФ показываются только две, то этот файл - с наложенным текстовым слоем? Как его накладывают?
Автор: tukktukk
Дата сообщения: 18.12.2009 14:36
Dimock

Нет, это другая какая-то проблема. VadimirTT говорил о другом. В пдф с наложенным текстом, есть и скан, и текст, но показывается в основном только текст (по умолчанию). Когда СК вынимает скан (скан под текстом в пдф), то понятно, что он выглядит не так, как текстовый (верхний) слой в пдф.

Хотя может быть у вас текстовый пдф, с несколькими затерявшимися сканами. Тогда будет такая штука, как вы описали.
Автор: Dimock
Дата сообщения: 18.12.2009 22:15
tukktukk

В этом словаре 636 страниц, а СК импортировал только первые две.

Добавлено:
Посмотрите на словарь - http://slil.ru/28367913
Качество хорошее, но обязательно будут ошибки. Чтобы их исправить, нужно из словаря вытащить сканы, это того стоит. Как это сделать?
Автор: VadimirTT
Дата сообщения: 19.12.2009 08:48
Dimock
Я не понял, этож векторный пдф, что с ним еще надо делать?
А кромсатор и не импортирует векторные пдф, только если в пдф засунуты сканы страниц.
Если хотите получить из него тифы, то используйте полный акробат или бесплатный PDF-XChange PDF Viewer, в настройках извлечения указать чернобелые тифы с разрешением 600 дпи.
Автор: Dimock
Дата сообщения: 19.12.2009 17:50
VadimirTT

PDF-XChange Viewer - Portable v.2.042.9 после экспорта с Вашими настройками не смог выдать оригинальное изображение - вместо KClO3 - КСЮ3 и т.д.
Первоначальное изображение можно как-то по-другому вытащить?
Автор: VadimirTT
Дата сообщения: 19.12.2009 17:59
Dimock
В этой теме это все оффтоп, кромсатор тут не причем, а в Вашем случае уже ничего не поможет, кто-то уже распознал сканы, и теперь остались только художества файнридера - "KClO3 - КСЮ3 и т.д."

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.