Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: kimserge
Дата сообщения: 12.01.2007 00:07
bolega
Скажите, можно ли к каким-либо зонам применять опции иллюминации отличные от основной страницы?
Спасибо за новую версию!
Автор: ghosty
Дата сообщения: 12.01.2007 06:17
bolega
Очень, очень много хорошего!

1. В последней версии не работают всплывающие подсказки.
2. Options -> Image Rendering работает только для просмотра (или при работе Draft Kromsate тоже)? Пока прироста скорости открытия больших серых изображений не наблюдаю.
3. Что нужно сделать, чтобы изменять профили - пока все опции в окне Profiles "greyed out" - нет возможности изменять что-либо.
4. Почему для серых изображений доступны опции Convert to... (в том числе почему-то и Convert to grey), а для черно-белых - недоступны?

5. Вот еще какой случай. Размер обрабатываемых страниц у меня может меняться: обычно в среднем 3500х2500, но иногда почему-то попадаются страницы 1700х1200. Последние при обработке не масштабируются (использую Fixwd Page Width), т.е. на обработанной странице область текста отображаются маленьким прямоугольником. Есть ли возможность автомасштабирования - к примеру, если размер исходной страницы существенно меньше, то контур текста увеличить до размеров, заданных на закладке Book?
Автор: Alexx S
Дата сообщения: 12.01.2007 06:38
bolega
Спасибо за подробный ответ. Сегодня попробую.
Автор: bolega
Дата сообщения: 12.01.2007 08:30
kimserge

Цитата:
Скажите, можно ли к каким-либо зонам применять опции иллюминации отличные от основной страницы?

Это будет в следующей версии. Будет новый универсальный тип чистящей зоны, где предусмотрен выбор типа чистки, обычный clean, заливка floodfill, bckground clean или illum.correct.


Цитата:
2.

Я знаю. К сожалению, так.


Цитата:
3. Что нужно сделать, чтобы изменять профили - пока все опции в окне Profiles "greyed out" - нет возможности изменять что-либо.

При вызове диалога все изменения недоступны, т.к. они показывают default-опции, зашитые в кромсатор. Чтобы разблокировать, нужно сперва ввести в верхнем поле название своего профиля (уже после ввода одного символа блокировка исчезнет).


Цитата:
5. Вот еще какой случай. Размер обрабатываемых страниц у меня может меняться: обычно в среднем 3500х2500, но иногда почему-то попадаются страницы 1700х1200.

Этот вопрос уже когда-то поднимался. Я объяснил тогда, почему нельзя полагаться на автомасштабирование.
То, что размер другой страницы так сильно отличается от других, однозначно говорит о том, что она отсканирована с другим dpi. Следовательно, нужно задать опции так, чтобы привести их в итоге на выходе к единому dpi (например, с помощью опций в окошке exclusive options или использовать фиксир. значение в поле output dpi, а не twice greter). Можно оставить и с разными выходными dpi, но тогда на закладке Pages нужно все размеры задавать в мм, а не в пикселях.
Автор: shch_vg
Дата сообщения: 12.01.2007 09:13
bolega

Цитата:
Не совсем понял, точнее совсем не понял, что такое режим width. Он относится к списку One page,Two pages,... или к списку масштабов?

Писал из дома, под рукой не было нового кромсатора, поэтому по памяти не смог объяснить точнее.
Я спрашивал про аналог Fit width, хотелось бы его иметь в списке One page,Two pages,... , т.к. при работе в режиме Fit width, заданном в списке масштабов, и при переходе в режим One page через список One page,Two pages,... трудно вернуться в режим полной страницы на этом же скане.

И еще просьба: нельзя ли в в окне Rotate selection слева, где высвечивается результат поворота, сделать возможность проводить пунктирную горизонтальную линию (прямоугольник?), чтобы точнее знать результат поворота. Иногда бывает, вроде повернул нормально, а при возврате в окно постредактора выясняется, что чуть недокрутил или перекрутил.
Автор: ghosty
Дата сообщения: 12.01.2007 10:11
bolega
Спасибо за ответы.

Цитата:
То, что размер другой страницы так сильно отличается от других, однозначно говорит о том, что она отсканирована с другим dpi.
Да нет, у меня как раз dpi тот же - видимо, тот, кто сканировал, масштабирование зачем-то применял, что ли... Как в этом случае быть? Если масштабировать на этапе постобработки, то как-то слишком грубо получается...

А как все-таки BW изображение преобразовать в greay? Очень хотелось бы, чтобы это можно было сделать из View Results.
Автор: bolega
Дата сообщения: 12.01.2007 10:54
ghosty

Цитата:
Да нет, у меня как раз dpi тот же - видимо, тот, кто сканировал, масштабирование зачем-то применял,

Ну почему, я и раньше с таким сталкивался - когда либо сканер, либо какая-то прога после ресэмплинга не проставляла в файл новое значение dpi. Собственно, изменение масштаба и изменение dpi - суть одно и то же.
Самый простой способ - проставить в файл насильно правильный dpi (команда в меню Service), в Вашем случае - изменить просто вдвое. Тогда кромсатор наверняка будет знать, как с ним обращаться.


Цитата:
4. Почему для серых изображений доступны опции Convert to... (в том числе почему-то и Convert to grey), а для черно-белых - недоступны?

Сделаю и для b/w. Можно и просто выкрутиться. Выбрать команду Result->Show source files, исходный файл будет показан в окне постобработки, а там уже доступно и b/w->gray.


Цитата:
А как все-таки BW изображение преобразовать в greay? Очень хотелось бы, чтобы это можно было сделать из View Results.

А это там и не возбраняется.


Цитата:
в том числе почему-то и Convert to grey

Объясню. Эта команда не столько к исх. файлу, сколько к текущему содержимому, которое в результате, например, preview, может быть каким угодно. Чтобы выяснить, является ли текущее содержимое окна серым, нужно для каждой точки проверить равенство R=G=B и убедиться в отсутствии палитры (хотя и серые бывают с палитрой). А это время. Вряд-ли кого-то обрадует даже 0,3-сек задержка при появлении меню.
Чтобы не тратить время на выяснение того, точно ли это 8-битный серый или просто 8-битный цветной, кромсатор не блокирует эту команду. К ошибке это все равно не приведет.
Автор: vitaly1
Дата сообщения: 12.01.2007 13:54
bolega
Давно хочу попросить, но все забываю. СК при чистке сканов "знает" о буквах i и j и не удаляет точки над ними. Можно ли тоже самое сделать для украинской буквы ї (i с двумя точками)? А то видел несколько книг, обработанных в СК, так все ї потеряли одну очку и превратились в і. И на последующем OCR это тоже плохо отражается.
Автор: bolega
Дата сообщения: 12.01.2007 14:27
vitaly1
Можно попробовать, только у меня нет таких книг, а без проверки ничего не выйдет. Если не трудно, подкиньте десяток-другой страниц, желательно из разных книг с разным качеством и dpi. Или может есть книжный сайт, где выкладывают книги на украинском, тогда я бы сам примеров накачал.
Автор: vitaly1
Дата сообщения: 12.01.2007 14:32
bolega
Можно глянуть на фтп КВК, папка Ukrainian (заходить по lingvo:ruboard)
Если не подойдет, подкину нужное число страниц.
Автор: kimserge
Дата сообщения: 12.01.2007 15:52
bolega
В чем тут дело?


Все по умолчанию
Спасибо
Автор: ghosty
Дата сообщения: 12.01.2007 16:04
bolega

Цитата:
Самый простой способ - проставить в файл насильно правильный dpi (команда в меню Service), в Вашем случае - изменить просто вдвое. Тогда кромсатор наверняка будет знать, как с ним обращаться.
Понял, так и сделал, работает.
kimserge

Цитата:
В чем тут дело?
А в чем проблема?
Автор: kimserge
Дата сообщения: 12.01.2007 16:33
ghosty
Пропала цифра 16* справа, хотя на исходнике она входит в зону выделения.
И как я не пытаюсь ее восстановить, ничего не выходит..

bolega
Вот тут бы пригодилась возможность копирования кусочка картинки с исходника, чтобы потом вставить в результат..
Автор: ghosty
Дата сообщения: 12.01.2007 16:45
kimserge

Цитата:
Пропала цифра 16* справа, хотя на исходнике она входит в зону выделения.
И как я не пытаюсь ее восстановить, ничего не выходит..

Закладка Page->Automargins - снять галочку для резака возле цифры (он поменяет цвет на малиновый).
Автор: kimserge
Дата сообщения: 12.01.2007 16:58
ghosty
Ура! Получилось, спасибо
А может вообще их все убрать? Зачем они?
Автор: ghosty
Дата сообщения: 12.01.2007 17:03
kimserge

Цитата:
А может вообще их все убрать? Зачем они?
Опять. Что убрать-то, не говорите загадками.
Автор: kimserge
Дата сообщения: 12.01.2007 17:09
Галочки в Авто-маргинах
Автор: ghosty
Дата сообщения: 12.01.2007 17:25
kimserge
"Автомаргины" определяют контур текста, в то время, как резаки определяют область, которая точно должна быть отрезана на странице. Т.е. Вы определяете (либо вручную, либо автоматически при помощи Draft Kromsate) все то, что должно быть отрезано по краям страницы - мусор, тени и т.п., а automargins уже определяет автоматически контур текста, по которому и производится окончательная обрезка, после чего к обрезанному по этому контуру тексту прибавляются поля (размер которых задается на закладке Book.
Автор: bolega
Дата сообщения: 12.01.2007 17:57
kimserge

Цитата:
Галочки в Авто-маргинах

Ни в коем случае!

Чтобы не убирать галочки, лучше сразу для всего задания задать чувствительность повыше: на закладке Options оба бегунка Sensitivity поместить в центральное положение. После этого срезаний не будет.

Автор: kimserge
Дата сообщения: 12.01.2007 18:15
bolega
ghosty
Большое спасибо.
А как насчет этого:
Цитата:
возможность копирования кусочка картинки с исходника
?
Это было нужно в других случаях.
Автор: Alexx S
Дата сообщения: 12.01.2007 20:01
bolega
У Вас много работы, надо доводить новые функции... Так что просить у Вас новые сейчас глупо и я это понимаю, поэтому, давайте хоть обсудим
Часть я писал выше, но повторюсь:
Для меня работа по созданию книги всегда состояла из трех этапов:
1. Сканирование
2. Обработка сканов
3. Создание книги
К последнему этапу относится добаление полей, создание PDF и добавление закладок.
Добавление полей в моем случае не всегда получается сделать во время обработки. Причины:
1. Делается одновременно несколькими людьми - надо срочно сделать книгу и подключаются сотрудники. У всех поля разные и на заключительном этапе я создавал новое задание, делал расстановку резаков и кромсал по-новой.
2. Много мусора или есть тени на сгибах, которые не удалены. Тени удалаяются не всегда корректно, иногда прихвытывается текст, поэтому я предпочитаю делать это в редакторе постобработки.
В этом случае ширина страницы получается заметно большей из-за того, что на отдельных страницах автомаргины работали с мусором

После появления новой версии с picture-зонами положение осложнилось - нельзя слить задания в одно из-за наличия зон. В той книге, что я сейчас делаю я просто похерил часть работы и собрал все в один пакет, но сделал я это из-за большого количеста тех самых зон, в противном случае я, скорее всего, просто слил страницы с зонами и выделил бы их заново.

Таким образом, по-моему, крайне важно иметь возможность:
1. Делать поля после обработки сканов, поскольку на качество обработки эта операция не влияет, а вот из-за неправильного определения полей или ошибочного выставления их размера переделывать уже обработанные и вычешенные вручную сканы приходилось.
Я не призываю убрать эту функцию, при обработке предварительное добавление полей нужно, не хватает возможности у практически готовой книги изменить размер полей не прибегая к повторной обоработке. Может, не совсем корректный пример, но составляя любой документ прежде всего заботишься о качестве содержимого, а поля и другое форматирование делаются в последнюю очередь.

Если реализация такой функции достаточно сложная, можно упростить задачу - вместо повторного определения полей можно добавлять/обрезать существующие поля по типу того, как это делается в Фотошопе или других редакторах. С указением стороны, к оторой добаляем или отрезаем поля и с заданием величины полей или размеров изображения. Можно только небольшую проверку сделать - если обрезается поле, содержащее цвета, отличные от белого - сообщить пользователю. Иначе можно случайно испортить один из сотен файлов и не заметить этого.

2. Иметь возможность импортировать одно задание в другое.

И по добавлению закладок - я когда-то просил Вас добавить возможность втавки закладок из текстового файла в PDF, благо что-то похожее в кромсаторе уже было. Но вчера такая потребность отпала - нашелся плагин к Акробату, который это делает довольно удобно и без проблем с русским.
Если кому интресно, смотрите здесь . Прошу прощения за небольшой оффтоп.
Автор: seka1894
Дата сообщения: 13.01.2007 02:18
to BOLEGA


Цитата:
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/



Скачал последнюю версию Кромсатора 5.81 NY -Новогодняя? А какой пароль?
В чем отличья от 5.6А?

Добавлено:


К BOLEGA


Цитата:
Скачал последнюю версию Кромсатора 5.81 NY -Новогодняя? А какой пароль?
В чем отличья от 5.6А?



Оч извеняюсь - не глянул за две страницы назад. Я повел себя очень по хрю-хрю.
Спасибо и сорри еще раз

Добавлено:
К Bolega

Хотел спросить - а можно уменьшить его потребности - а если он вкл - то ничего более не работает, все в дауне пока он стоит. Так много треба ресурсов - это решаемо?
Автор: Alexx S
Дата сообщения: 13.01.2007 09:26
seka1894

Цитата:
Хотел спросить - а можно уменьшить его потребности - а если он вкл - то ничего более не работает, все в дауне пока он стоит. Так много треба ресурсов - это решаемо?

Опциях, на вкладке Processing есть опция Priority.
По идее, выставление низкого приоритета должно тебе помочь.
Автор: izograv
Дата сообщения: 13.01.2007 14:58

Цитата:
По идее, выставление низкого приоритета должно тебе помочь

Я пробовал, если трудоемкие операции идут, например bicibic, все равно о какой-то комфортной работе с остальными приложениями мона забыть. Лучше на ночь оставлять

Автор: shch_vg
Дата сообщения: 13.01.2007 15:15
izograv

Цитата:
Я пробовал, если трудоемкие операции идут, например bicibic, все равно о какой-то комфортной работе с остальными приложениями мона забыть.

Не понял, что понимается под "трудоемкими операциями", к тому же понятие "комфортной работы" субъективно, но хочу сказать, что запускал на пентиум3 667 мггц параллельно 2 кромсатора (оба с низким приоритетом), они на двоих занимали 100% ЦПУ, но это мне не мешало пользоваться интернетом, какими-то программными средами (типа оракловских формсов). Конечно, мне не приходило в голову пробовать просматривать какой-либо фильм, м.б. там я имел бы какие-то проблемы
Автор: izograv
Дата сообщения: 13.01.2007 15:43
shch_vg

Цитата:

Не понял, что понимается под "трудоемкими операциями"

Подробно:
На amd3k 64бит выполняется апсемплинг с 300 до 600 с фильтром bicubic. приоритет в кромсаторе - низкий, включен task manager, параллельно я работаю в firefox. Ясно, что спу=100. При просмотре сайтов в браузере (открытии окон, заполнении форм etc) задержки ощутимые. Я это субъективно назвал термином "нет комфортной работы". Конечно это нельзя назвать "мешать пользоваться инетом" О просмотре фильма я и не думал. Давайте дальше не описывать ощущения, автор вопроса имеет пару мнений, думаю он сам разберется как ему удобнее
Автор: ghosty
Дата сообщения: 13.01.2007 15:57
izograv

Цитата:
На amd3k 64бит выполняется апсемплинг с 300 до 600 с фильтром bicubic.
А bicubic - это критично?
Автор: Alexx S
Дата сообщения: 13.01.2007 16:08
izograv
Про bicubic и я хотел спросить - самый медленный метод преобразования. Для обычной литературы это, имхо, роскошь. Мне вполне удовлетворяет Lanczos 3
Автор: izograv
Дата сообщения: 13.01.2007 17:35
ghosty

Цитата:
А bicubic - это критично?

Сейчас обрабатываю книгу - по visio - на той неделе выложу. Специально взял 3 характерные картинки - и обработал в Lanczos и бикубик. imho последний смотрится лучше (конечно это на экране, после кодирования эти отличия еще более уменьшатся). Это я к тому, что говорил выше: если оставлять на ночь - над тобой не давлеют эти тормоза, книга 340 страниц, как раз за 12 часов преобразовалась. Ну даже если там на выходе после всего-всего отличия будут мизерны, мне что, жалко процессорного времени ? ) тем более, что с пикче-зонами так великолепно выходит.


bolega, ghosty

У меня такая совершенно дурная просьба: вот у bolega в примере к последней версии описывается процесс создания. В конце фраза: "...впрочем я сначала делаю pdf, затем ocr, и только потом слияние и djvu". А вот можно попросить чуть подробнее написать, как автор делает "затем ocr, и только потом слияние и djvu"? Интересует чуть более подробная последовательность действий, расписать в нескольких строках. Просто у меня с появлением этих файлов с только текстом и файлов с картинками чуть каша в голове, как лучше сделать ocr.
Автор: bolega
Дата сообщения: 13.01.2007 19:19
Bicubic - это роскошь (в моей медленной реализации). Даже на моем 3200 МГц он выполняется очень долго. Кроме того, для 300dpi разницы с lancoz практически никакой. Я использую его только если мне надо обрабатывать паршивые 150dpi-сканы.

izograv
В инструкции Scan&Share (ссылка в шапке) процесс создания OCR расписан лучше некуда.
Делаю я ocr до слияния (т.е. с дырками вместо иллюстраций) по причине того, что по умолчанию SK серые/цветные сканы делает с LZW-сжатием, а мой лицензионный FR 7 (не знаю, может у нелиценз-го таких проблем нет ) не хочет понимать такие тифы. Приходиться в опциях Sk отключать галку на use LZW, но тогда файлы получаются громадного размера, а места у меня на винте не много.

Alexx S
Слияние заданий я сделаю. Спасибо за идею. Я про это как-то забыл, что как раньше, с зонами уже не получится объединить. Но не пойму, почему Вы все-таки не хотите использовать fixed-размеры, лучше заданные в мм. В крайнем случае, можно ведь линейкой померить на книге нужные размеры и тогда кромсатор будет выдерживать их изначально, не тратя время на унификацию, и возня с resume тогда не нужна будет.
И про переделку полей тоже подумаю, это действительно полезно иметь.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.