Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: romanef
Дата сообщения: 04.11.2005 17:18


Цитата:
Тогда непонятно, зачем в BR заниматься вырезанием из сканов иллюстраций и сохранять их отдельно


это, видимо, я советовал?

опыт приходит со временем, и как оказалось, в БР тоже есть возможность
обрабатывать блоки отдельно от текста и наоборот.

когда появится возможность таскать их по странице мышкой - вообще будет замечательно....
Автор: VadimirTT
Дата сообщения: 04.11.2005 22:52
Я что-то не нашел, а может ее и просто нет, опции - выключение компьютера после завершения задания. По моему, это может быть иногда полезно, если поставить кромсать на ночь глядя.
Автор: Arcand
Дата сообщения: 13.11.2005 10:42
bolega
Вы уже в курсе статьи VadimirTT. Высокое качество его книги связываю с одновременным применением фильтров Blur и Sharpen (а Вы как считаете?).
В этой связи, хотелось бы побольше узнать о работе фильтров. Если выбрать сразу несколько фильтров, то в каком порядке они работают? Это задается в окошке справа? Как можно регулировать "интенсивность" работы фильтров (задать радиус)?
Заранее спасибо.
Автор: Kazakalitopus
Дата сообщения: 26.11.2005 03:13
Господа, никто не наблюдал некоего странного
взаимодействия Кромсатора с сервисами Windows?
У меня Win2k и болтаются несколько сервисов,
в частности, Apache2 и Tomcat5.5. Никому они
не мешают, и машину не грузят.

Но вот Кромсатор (5.52бета) перестал работать.
Точнее, работает, но и за два часа не может
обработать страницу (висит "changing dpi", при
переводе серых 300 дпи в ч.б. 600 дпи). Если
посмотреть в Task Manager'e, Кромсатор берет
процентов 10 времени CPU (в норме 96-99) и всего
лишь 10 мбайт RAM, т. е. ресурсов ему хватает.

А вот если пустить Кромсатор, когда Апач остановлен,
или сначала пустить Кромсатор, а потом Апач, все
работает нормально! Минуты за две разворот готов.

Никто не представляет себе, что все это значит, и
как с этим цивилизованно бороться? Вопрос
для меня потерял 90% важности, после того, как я
понял, что достаточно остановить сервисы, чтобы
Кромсатор заработал, но ведь непорядок...
Автор: bolega
Дата сообщения: 26.11.2005 22:53
Kazakalitopus
Я тоже с этим часто сталкиваюсь, и без сервисов. У меня это происходит при запуске Кромсатора из-под отладчика. На самом деле перевод gray 300->600 требует от 50 до 100 Мегабайт памяти, которой, видимо и нехватает. Либо хватает, но она дефрагментирована из-за наличия нескольких работающих сервисов. Поэтому имеет место интенсивный своп, при котором процессор загружен не сильно, но диск шуршит во всю. Если у Вас показывает, что кромсатор забрал всего 10 метров, а реально ему надо бы в несколько раз больше, то, наверняка он не получил требуемого объема памяти из-за дефрагментации или просто из-за ее недостатка, и поэтому идет усиленный своп этих 10 метров.
Это мое предположение.
Попробую пересмотреть метод ресэмплинга.
Автор: Kazakalitopus
Дата сообщения: 27.11.2005 01:52
bolega
А Вы не пробовали под отладчиком программу
профилировать, чтобы узнать, где же она в таком
своем состоянии время тратит? Радует уже, что
такое положение вещей в какой-то мере
воспроизводимо, так что есть надежда на
успешное расследование...

На своп (по крайней мере, в моем случае) не
похоже, потому что filemon почти не показывает
обращений к pagefile.sys. Да и физической памяти
в это время много свободной, так что свопа быть
не должно.


Автор: Alexx S
Дата сообщения: 02.12.2005 20:25
В процессе работы с Кромсатором назрело одно пожелание по редактору постобоработки:

Нельзя ли, помимо выделения спеклов красным, сделать так, чтобы они еще и мигали.

Необходимость в данной функции возникла после того, как я стал замечать, что пропускаю при обработке довольно много мусора, хотя делаю два прохода с разными масштабами.
Проходит время, открываешь книгу на нужной странице - и на тебе - на видном месте невычищенная жирная точка.
Автор: NOBIL
Дата сообщения: 07.12.2005 17:18
Здравствуйте. У меня такой вопрос: как сделать, чтобы Кромсатор только поворачивал и обрезал, без очистки от мусора? Т.е. как полностью отключить деспеклинг? А то, если скан не грязный, то буквы при обработке истончаются, индексы в формулах порою совсем стираются. Возможно, я что-то не так настраиваю?
Да, я, перед тем, как задавать вопрос, почитал топик... В общем, претензии г-на monday2000 меня крайне удивили: "в большинстве случаев, всё-таки отсекается хотя бы немного лишнего от голого текста - начиная от ножки буквы "и" и вплоть до половины ширины буквы (но не было случая, чтобы более чем полбуквы было отсечено)." Ощущение такое, что человеку нужна не книга, которую можно без проблем читать, а картинка, чтоб распечатать и на стенку повесить. Да, грязные, кривые сканы раздражают, не очень приятно, когда сильно скачут поля - то сантиметр, то пять, - но во всем должна быть мера. Подавляющему большинству абсолютно безразлично, будут ли во всей книге поля по 30 мм или в одном месте по 30,5, а в другом - 29,5. И из-за этого предъявлять ТАКИЕ претензии к превосходно сделанной программе... Не красиво это. В общем, bolega, не обращайте внимание на такие претензии, у Вас прекрасная программа Хотя хелп к ней, конечно, не помешал бы
Автор: ging
Дата сообщения: 07.12.2005 17:42
NOBIL

Цитата:
Т.е. как полностью отключить деспеклинг?

Posle DRAFT KROMSATE snyatj galku na optsii DESPECKLE, derga pri etom CRTL (a mogno i
ALT - uvidite mnogestvo variantov)
Автор: izograv
Дата сообщения: 07.12.2005 18:08
Вопрос такой: грязные сканы с полосами слева-справа, у каждого своя отцентровка, draft очень часто ошибается в левой-правой границе. Приходится ручками править, очень удобно удерживая ctrl двигать одновременно левый-правый резаки. А вот как после этого одновременно устанавливать левую-правую границы для всех последующих файлов? Я сейчас щелкаю правой на маркере резака, выбираю "распространить для всех вниз", это приходится делать и для левого и для правого резаков. Может есть как чуть быстрее делать подобное?
Автор: NOBIL
Дата сообщения: 07.12.2005 19:08



Цитата:
ging

Posle DRAFT KROMSATE snyatj galku na optsii DESPECKLE, derga pri etom CRTL (a mogno i
ALT - uvidite mnogestvo variantov)

Спасибо. Самое смешное, что я чисто случайно, методом научного тыка, около получаса назад наткнулся на эту опцию )
Автор: bolega
Дата сообщения: 07.12.2005 22:48
NOBIL
Да ничего, у каждого свои требования к качеству. Теоретически можно было оконтуривать и с пиксельной точностью, но, понятное дело, для этого придется анализировать контуры каждой буквы по отдельности на краю! А это значительно увеличит время кромсания. Именно поэтому я этого до сих пор не сделал. Будет время - почему бы и не сделать.

Цитата:
А то, если скан не грязный, то буквы при обработке истончаются, индексы в формулах порою совсем стираются. Возможно, я что-то не так настраиваю?

Можно еще задать в опциях метод despeckle=safe. Если скан совсем плохенький, то возможно, лучше действительно вообще отключить despeckle, так как при сильных разрывах в буквах и safe может навредить.
izograv

Цитата:
Может есть как чуть быстрее делать подобное?

Т.е. иметь команду клонирования положения сразу нескольких резаков?
Можно сделать.

Цитата:
грязные сканы с полосами слева-справа, у каждого своя отцентровка, draft очень часто ошибается

Если на сканах имеются большие по ширине грязные области по краям (либо большие части соседней страницы, от 1/3 до 1/2), сбивающие с толку кромсатор, то при drafte можно задать пред-обрезку таких областей (поддерживается пред-обрезка слева, справа или поочередно, все это есть в настройках самого draft). Пред-обрезка - условная, реально ничего не отрезается, просто draft сразу пропускает такие области при анализе.
Автор: izograv
Дата сообщения: 08.12.2005 14:10
bolega

Цитата:
Т.е. иметь команду клонирования положения сразу нескольких резаков?
Можно сделать.


Хорошо бы. По аналогии как ctrl двигает сразу 2 резака, то и, например, при нажатом ctrl клонировать сразу позиции левого-правого /верхнего-нижнего резаков на указанные страницы.
Автор: izograv
Дата сообщения: 11.12.2005 15:33
Еще вопрос: при despeckle и при enhance, можно как-то исключать картинки в исходном имидже? Имеется ввиду не ручками exclude, а сам кромсатор чтоб определял, что это картинка и не нужно ее despeckle? или как-то опционно "если есть подозрение, что это картинка, то ее пропустить или иной режим despeckle".
Автор: Alexx S
Дата сообщения: 11.12.2005 16:06
На предыдущей странице обсуждаласть обработка сканов, содержащих иллюстрации и возможность их автоматического определения.
Разговор преимущественно велся о раздельном хранении черно-белого текста и серых иллюстраций.

Лично я расставил бы акценты по другому. Меня прежде всего интересует возможность автоматического определения областей, занятых рисунком для создания exclude-регионов для векторной графики и, также автоматическое, определение серых иллюстраций (на данном этапе - уже реализованный битонал).

С серыми иллюстрацииями я бы поступил так:
1. В Mouse- up mode добавить опции для выделения регионов конвертировани в серый (и в цветной, наверное, тоже не помешает).
2. Вокруг выделенного региона замазать все белым цветом и хранить во временном файле.
3. Обрабатывать два файла одновременно - с первым делаем все, что выставили в опциях (поворот, чистка мусора, поля и т.д.) а со вторым только то, что влияет на положени картинки (поворот, поля) для того, чтобы картинка осталась на том же месте, где была.
4. В окне редактора постобработки сделать возможность переключения между "текстом" и "иллюстрациями". Если получится их наложить друг на друга будет вообще великолепно, но, боюсь, тормоза будут нешуточные.
5. Сохранение. Меня бы устроило сохранение черно-белой и серой картинок в одну серую. Если получится в PDF и Djvu, будет совсем хорошо.
Автор: pikvvik
Дата сообщения: 11.12.2005 17:22
2 Alexx S
Мы еще не видели 6 версии (паблик вроде не выкладывалась?), вдруг туда это все уже вошло
Имхо, предложения тянут на СканКромсатор Паблишер Только, боюсь, Боливар не..., тьфу, у bolega другие планы
Автор: Arcand
Дата сообщения: 12.12.2005 11:25
Вопросы и ответы по работе со СканКромсатором здесь.
Наши вопросы и ответы bolega на форуме.
Добавил в шапку.
Автор: bolega
Дата сообщения: 12.12.2005 12:17
izograv
Alexx S

Цитата:
Меня прежде всего интересует возможность автоматического определения областей, занятых рисунком для создания exclude-регионов для векторной графики и, также автоматическое, определение серых иллюстраций

Я тоже так хочу
Но вы должны понимать, что такая фича за один присест не делается. Тянет как минимум на кандидатскую
Кое-какие методы мне известны, но, боюсь, что на грязных сканах они будут работать из рук вон плохо. Отличить грязный зашумленный фон от тоновой иллюстрации, имеющей такую же подобную текстуру, очень проблематично.
Сейчас, чтобы делать это вручную, можно включить режим Mouse-Up Mode = Set exclude zone, и зоны будут создаваться в момент отпускания клавиши мыши.
Чтобы хранить картинки в отдельных файлах и потом совмещать их с текстовым слоем с сохранением результата в pdf или grey - над этим, как я недавно писал, я уже работаю.
План такой - либо пользователь сам накладывает уже готовые картинки в исх.окне (эти картинки могут быть получены либо в другом редакторе, либо предварительно вырезаны из текщего скана самим кромсатором по вашей команде), либо кромсатор вырезает их из скана в процессе обработки. Формат картинок - на выбор: lossless либо lossy jpeg с заданным качеством. Думаю, что для многих картинок lossy jpeg будет лучшим выбором.
Главная проблема здесь - должно быть выполнено условие: исх. скан не должен подвергаться deskew. Т.е. если перекос есть, то он должен сначала быть выпрямлен (при первом проходе кромсатора), и уже в другом задании продолжать работу с картинками.
Автор: Alexx S
Дата сообщения: 12.12.2005 18:06
bolega

Цитата:
Я тоже так хочу
Но вы должны понимать, что такая фича за один присест не делается. Тянет как минимум на кандидатскую
Кое-какие методы мне известны, но, боюсь, что на грязных сканах они будут работать из рук вон плохо. Отличить грязный зашумленный фон от тоновой иллюстрации, имеющей такую же подобную текстуру, очень проблематично.


Согласен. Book Restorer, в котором это реализовано уверенно распознает только контрастные полутоновые зоны. На данном этапе лучше применять ручной труд.

Но, все-таки, задачи вытягигивать иллюстрации из грязных сканов и на стоит. У меня на работе один сотрудник сканирует только в 76dpi и сохраняет в JPEG с большим сжатием, такчто даже читать этот текст становится трудно. И под него надо подстраиваться? Я считаю, что вполне достаточно выделять уверенно распознаваемые иллюстрации, которые не сливаются с фоном, а все остальные можно и руками сделать.

Теперь о векторных рисунках. Думаю, что их не так трудно определить, как полутоновые. А вот чистку на них надо проводить с особой бережностью, сейчас я все рисунки заключаю в exclude zone.


Цитата:
Формат картинок - на выбор: lossless либо lossy jpeg с заданным качеством. Думаю, что для многих картинок lossy jpeg будет лучшим выбором.


Во многих случаях jpeg добавляет кучу мусора. Хотелось бы опцию по заданию качества иллюстраций. Лично я никогда не пользуюсь jpeg, предпочитая ему методы сжатия, не уродующие картинку.


Цитата:
Главная проблема здесь - должно быть выполнено условие: исх. скан не должен подвергаться deskew. Т.е. если перекос есть, то он должен сначала быть выпрямлен (при первом проходе кромсатора), и уже в другом задании продолжать работу с картинками.


А почему нельзя повернуть вырезанное изображение на тот же угол? А то уж больно неудобно получается.

P.S. Сейчас попробовал сделать ч/б страницу с серыми иллюстрациями в Photoshop'е. Делается элементарно.
Вделеляем область, создаем слой через обезание и переводим слой с основным текстом в черно-белый.
Я конечно понимаю, что мало ли что у этого монстра есть, но может на мысли какие натолкнет .

Автор: Kazakalitopus
Дата сообщения: 12.12.2005 19:12
bolega
По поводу обработки полутоновых изображений, Вы писали

Цитата:
Выделите нужную зону изображения мышкой (для обработки, в отличие от работы с исходным сканом, поддерживаются только прямоугольные выделения), в контекстном меню команду Exclude and mark as dither. Данная зона при обработке будет переводиться в b/w по специальному алгоритму, предназначенному для правильной передачи полутоновых или цветных изображений.

Вот, наконец, взяла жизнь за одно место, и пришлось пробовать этот способ.
Увы, при обработке страницы я неизменно получаю лишь ошибку
"Access violation at address 00402B55 in module 'sk.exe' Read of address 03EAFFFE"
(Использую СК 5.52 бета под Win XP).
Это я один такой "везучий", или у всех так? Можно как-то обойти?


Добавлено:
Надо же, на другой машине под Win 2000 та же самая ошибка,
даже первый адрес тот же...
Автор: bolega
Дата сообщения: 12.12.2005 20:31
Alexx S

Цитата:
А почему нельзя повернуть вырезанное изображение на тот же угол? А то уж больно неудобно получается.

Повернуть-то можно. Но после поворота прямоугольная зона перестает быть прямоугольной (по отношению к осям), и не совсем тогда понятно, как вырезать такую зону, чтобы сохранить в отдельный файл. Что брать в качестве левой и правой границ, например.

Kazakalitopus
А dpi изменяете при этом?
Автор: Alexx S
Дата сообщения: 12.12.2005 20:42
А если с прозрачностью сохранять, например в PNG или Gif?
Еще можно сначала повернуть, затем вырезать, а уж потом конвертировать в B&W/
Автор: Kazakalitopus
Дата сообщения: 12.12.2005 21:01
bolega

Цитата:
А dpi изменяете при этом?

Да, я перегоняю серые 300dpi в чернобелые 600dpi
Автор: Glebych
Дата сообщения: 13.12.2005 13:23
Друзья, может быть кто-нибудь сможет выложить версию 5,07? Сижу под 98, 5,51 и 5,52 не работают......
Автор: Arcand
Дата сообщения: 13.12.2005 17:57
Glebych

Цитата:
webfile.ru/688161
Имя файла - sk-5.07.ok.zip , размер 1754 Кбайт, будет доступен до 20.12.2005 18:53.
Автор: Glebych
Дата сообщения: 13.12.2005 21:54
Arcand

Громадное спасибо!
Автор: monday2000
Дата сообщения: 15.12.2005 09:04
Glebych

Цитата:
Друзья, может быть кто-нибудь сможет выложить версию 5,07?

Положил к себе ( http://www.dstu2204.narod.ru/djvu/ ) снова: http://www.dstu2204.narod.ru/djvu/scan_kromsator_v5_07_full.rar (1,98 МБ) - у меня уже он лежал тут раньше.

Ещё могу предложить вот что: ftp://ebooks.jinr.ru/DjVu%20software/Windows/ScanKromsator-3.5-exe.zip (1,05 МБ) - тоже переложу к себе на днях (для коллекции ).

Цитата:
Сижу под 98, 5,51 и 5,52 не работают......

У меня всё то же самое, один к одному.

Добавлено:
bolega
А что Вы скажете в отношении библиотеки libtiff ? (которая в djvulibre применяется). Она чем-нибудь плоха? И где Вы взяли исходники для длллок Кромсаторных, если не секрет?

Добавлено:
bolega
Может всё-таки сделаете Кромсатор способным работать под Win98? Там просто файлы не открываются и всё - надо 1 функцию поменять. Не хотите себе 98 ставить - сделайте пару прожек-болванок только с кнопкой открывания файлов - а я потестю и скажу, какая работает.
Автор: bolega
Дата сообщения: 15.12.2005 16:58
monday2000

Цитата:
Может всё-таки сделаете Кромсатор способным работать под Win98?

Уже сделал.
Автор: Arcand
Дата сообщения: 15.12.2005 17:06
monday2000

Цитата:
И где Вы взяли исходники для длллок Кромсаторных, если не секрет?

А Вы гляньте в свойствах файла, там и увидете .
Автор: bolega
Дата сообщения: 15.12.2005 17:34
Arcand
У меня к Вам будет просьба. Я тут добавил кое-какие фильтры (размытие, улучшение контура). Не могли бы Вы оценить их полезность (или бесполезность). Пока что сохранять в файл задания параметры этих фильтров не буду, чтобы в случае отказа от них не нарушать структуру файла, т.е. сейчас можно считать их как глобальные установки. Думаю, через недельку уже положу пробную версию.
Спасибо.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.