Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: shch_vg
Дата сообщения: 18.01.2007 16:31

Цитата:
Arcand

Цитата:Из интереса сделал сделал Ваш скан

Из интереса хотелось бы знать как


Я бы тоже хотел это знать.
Очевидно, что одними возможностями Кромсатора здесь не обошлось.
Перевел color2.tif в 2 файла дежавю с помощью Document Express Editor 5.0:
1 - с параметрами Нормальный-Форсированный, 2 - Фото-Нормальный.
В результате визуально эти два файла почти не отличаются, только не бросающейся в глаза толщиной отдельных букв.
Зато размер первого файла 96 778 байт, второго - 818 031 байт!!!
При переводе исходного файла color.gif в дежавю с параметрами Фото-Нормальный получается 237 503 байт.
Обычно же при присоединении цветной обложки, отсканированной в 150dpi в сером с теми же параметрами файл дежавю увеличивается максимум на 100 кб.
Автор: bolega
Дата сообщения: 18.01.2007 17:14
shch_vg
Что-то у Вас большие файлы получились.
Здесь лежат 2 варианта: http://www.bolega.hotmail.ru/temp/
Color2.djvu - вариант Arcand, 0001.djvu - вариант после кромсатора (использовался DEE)
Размеры обеих файлов практически одинаковы (23кБ). Качество тоже, может быть только в 0001.djvu размытостей на рисунке чуть меньше.
Автор: Alexx S
Дата сообщения: 18.01.2007 20:33
bolega


Цитата:
В связи с поломкой компа пока ничего отвечать не могу.
Из ремонта ожидаю недели через 2.


Потерпим. А вы отдохнете. От нас и от Кромсатора

А я пока буду пытать Arcand
Автор: shch_vg
Дата сообщения: 19.01.2007 09:10
bolega

Цитата:

Что-то у Вас большие файлы получились.

Это не у меня получились, а у Document Express Editor 5.0
Я получил указанные мной размеры, применяя DEE к исходным файлам (color2.tif - вариант Arcand и color.gif - исходный Alexx S), а Кромсатор вообще не использовал.
Параметры для DEE я тоже указал. Ни в одном из моих вариантов не наблюдается размытости, как в Ваших. Вы в обоих случаях предварительно обрабатывали Кромсатором? Меня особенно интересует, как Вы получили Color2.djvu, мой минимум - 96 кб.

P.S. Каждый из приведенных мной файлов я получал по несколько раз, и каждый раз был тот же результат.

Автор: bolega
Дата сообщения: 19.01.2007 10:38
shch_vg

Цитата:
Меня особенно интересует, как Вы получили Color2.djvu, мой минимум - 96 кб.


Color2.djvu сделан непосредственно из Arcand-го color2.tif, без всяких обработок.
Профиль DEE я когда-то для себя настраивал, его и использовал.
Автор: shch_vg
Дата сообщения: 19.01.2007 13:30
bolega

Цитата:
Профиль DEE я когда-то для себя настраивал, его и использовал.

У меня такое ощущение, что мы говорим о разных программах, т.к. у меня Document Express Editor 5.0 профилей не имеет. (по крайней мере мне не удалось найти такую возможность )
Наверное, Вы используете Document Express Enterprise?
Если да, не могли бы Вы положить свой файл настроек профиля в директорию temp на Вашем сайте?
Автор: terminat0r
Дата сообщения: 19.01.2007 16:32
bolega
а вот про пакетное кромсание Вы наверное забыли?
А у меня как всегда- 6 книжок отсканированы- почти 20 Гиг на винте, а времени на кромсание нет абсолютно.
Поэтому сижу и мечтаю o пакетном кромсании- запустить на ночь все вместе, а потом только пересматривать готовое
Автор: Arcand
Дата сообщения: 19.01.2007 17:55
Alexx S
Цитата:
Из интереса хотелось бы знать как
Делал в Корел. Чтобы не повторяться: частично о принципе обработки было здесь , о реализации здесь . Сейчас я сделал рабочую версию VBA макросов и занимаюсь наведением красоты (код я не собираюсь закрывать). Еще потребуется немного времени, чтобы по возможности все потестить.
Имеет смысл обсуждать дальше, если у Вас стоит Корел или Вы готовы его поставить. В этом случае я готов оказать всяческое содействие . Без опыта работы в Корел будет затруднительно написать оптимальные скрипты. Поэтому, я готов их сделать. Вам останется только нажимать кнопки и пить кофе в ожидание результата .

shch_vg
Цитата:
Это не у меня получились, а у Document Express Editor 5.0
Я наверное ввел в Вас в заблуждение. В свойствах исходного скана было указано разрешение 72 дпи. На самом деле по виду он 300 дпи. Предполагаю, что gif делали в Paint, а он гад, всегда ставит такое разрешение (меня он в свое время этим достал). Я не стал исправлять дпи и сделал ресемплинг до 144 дпи. При кодировании важно указать правильное дпи. От этого зависит разрешение фона и слоя foreground colors, это сильно скажется на размере дежавю. В Эдиторе с 300 дпи, профиль - нормальный, качество текста - агрессивный, размер дежавю у меня 28 кБ.
При кодировании в DEE стандартным профилем Scanned цветные рисунки line art размываются. Я его изменил, получается без фона, т.е. без размытия. Но есть в этом случае небольшие искажения. Можете посмотреть сами http://abab.front.ru/color2a.djvu . Их можно уменьшить, но ценой увеличения размера дежавю.
Автор: Alexx S
Дата сообщения: 19.01.2007 18:18
Arcand
Кофе не пью, на все остальное согласен
Как Вы видели (или можно уже на ты?) книга представляет собой словарь, т.е на каждой странице есть что-нибудь цветное, начиная с номеров страницы. Так что всего их будет больше тысячи. Естественно, желательно обойтись без индивидуальной настройки под каждую картинку.
Времени у меня на сканирование мало, поэтому для отработки Вашей технологии его будет много Сканирую на работе, во время обеденного перерыва. Сделал страниц 60 из 600, так что до обработки еще куча времени и можно поэкспериментировать.
Корел знаю плохо, один раз делал в нем рекламу для фирмы. Пробовал что-то похожее на Вашу методику реализовать в Фотошопе - делал с зонами, после этого открывал зону в Фотошопе, выделял по красному, сохранял выделение , после обрабатывал в Кромсаторе для чистки мусора и сливал получившееся ч/б изображение с цветной. Была мысль сделать макрос, но ни времени, ни знаний не хватило и решил остановиться только на Кромсаторе (до того, как выложил здесь).
Кстати, такая книга попадается мне не в первый раз - есть еще двухтомник, там номера страниц и названия разделов тоже красные. Еще просили сделать книжку по оригами - та была, по-моему, трехцветное - красный, синий и черный, но могу и ошибаться, впрочем, красный точно был.
Так что если будет отработан алгоритм, его вполне можно будет использовать в Кромасаторе - потребность есть.
Автор: shch_vg
Дата сообщения: 20.01.2007 12:47
Arcand
Большое спасибо за ценную для меня информацию по DEE!
Однако есть несколько вопросов:

Цитата:
В свойствах исходного скана было указано разрешение 72 дпи

Как Вы это увидели? Ирфанвью вообще не показывает разрешение этого скана. Да и Кромсатор дает DPI = unknown. Зато DEE по сохранить как показывает для color.gif разрешение 300 (м.б. это установка по умолчанию?)

Цитата:
Я не стал исправлять дпи и сделал ресемплинг до 144 дпи

Поставили в Кромсаторе Dpi = Twice greater, так?
Тогда непонятно, почему тот же DEE при сохранении для Вашего color2.tif дает разрешение 143, ведь установить такое в Кромсаторе невозможно.

Цитата:
При кодировании важно указать правильное дпи. От этого зависит разрешение фона и слоя foreground colors, это сильно скажется на размере дежавю.

Вот это я не знал!

Цитата:
В Эдиторе с 300 дпи, профиль - нормальный, качество текста - агрессивный, размер дежавю у меня 28 кБ.

Здесь я пробовал ставить и 400 и 600, размер еще уменьшался, хотя качество компилируемого, на мой взгляд, ухудшалось.
При 300 дпи я получил ту же длину - 28 кб, однако в дежавю заметна размытость местами красных линий. Зато при компиляции с установленным по умолчанию 143 dpi на мой взгляд получается наилучший результат, никаких размытостей, хотя длина великовата - 95 кб.

Цитата:
При кодировании в DEE стандартным профилем Scanned цветные рисунки line art размываются. Я его изменил, получается без фона, т.е. без размытия.

Я использую русифицированную версию DEE, поэтому здесь мне многое непонятно.
1.Что означает стандартный ? Если тот, что стоит в профиле при заходе в DEE, то у меня всегда стоит Нормальный
2.Вы изменили стандартный профиль Scanned на Нормальный, я правильно Вас понял?
3.Под фоном Вы понимаете размытие отдельных фрагментов дежавю?

Цитата:
Но есть в этом случае небольшие искажения

Единственые искажения, которые я заметил это появление красных участков в черных линиях, Вы это имели ввиду?
Автор: Dracula
Дата сообщения: 20.01.2007 12:48
Всем привет!
Я сканирую только медицинские книги и они в основном с рисунками и фотографиями (почти что все ) - серые и цветные.
Вопрос в том, как обрабатывать книги с серыми и цветными фотографиями? Как я понял ScanKromsator тут не подойдёт? Ведь его конечный результат в чёрно-белом виде получается хорошо - а с фотографиями ему не справиться? Хотя я не знаю - поправьте, если что.
Скачаю любую программу, которую посоветуете (благо Internet халявный (тьфу, через плечо).
Заранее благодарю.

Добавлено:
Я при скачивании с сайта Boleg'и программы (последней) при открытии выдаёт такое окошко. Как быть?
http://www.ringo.com/photos/photo.html?photoId=188905902
Автор: Alexx S
Дата сообщения: 20.01.2007 12:56
Dracula
Зачем дублировать сообщения? Я Вам ответил в той теме, где Вы оставили это сообщение в первый раз.
Советую прочитать несколько последних страниц и все вопросы отпадут.
Автор: Dracula
Дата сообщения: 20.01.2007 12:58
Alexx S
Я про то, что сама прога не открывается.
Автор: Alexx S
Дата сообщения: 20.01.2007 13:02
Не открывается прога, или архив не распоковывается?
Картинку вашу посмотреть без регистрации не могу.
Если архив - то он запоролен. Пароль в ПМ
Автор: vitaly1
Дата сообщения: 20.01.2007 13:02
Dracula
Нужны 2 dll-ки, ссылка в шапке. Киньте их в папку с программой.
Автор: Arcand
Дата сообщения: 20.01.2007 16:30
Alexx S
Цитата:
Кофе не пью, на все остальное согласен
Отлично . Тогда приступаем к делу. Мне требуется пара сканов (хотелось бы побольше, но трафик...). Но не исходных, а покромсанных в СканКромсаторе: deskew и обрезка полей, дпи и color оригинальные. Если тень не налезает на текст и отрезается резаками, то чистить фон или делать цветокоррекцию не надо. В противном случае, сделайте дополнительно цветокоррекцию или удаление фона (думаю, background cleaner для твоих сканов будет нормально). Для уменьшения размера преобразуй скан в jpg 95%, качество будет приемлемым. Предполагаю, что он будет весить около 1.5-2 мега, что нормально.
Небольшой совет, когда делаете gif или преобразуете в индексированные цвета, делайте это в проге, в которой можно отключить dithering и использовать адаптивную палитру. Иначе на скане будут цветные пупырышки - эта прога смешивает индексированные цвета для имитации промежуточных цветов. Что является мусором и мешает обработке. Уж лучше небольшие цветовые искажения.

shch_vg
Очередное недоразумение . Document Express Editor - это Editor (Эдитор),
Document Express Enterprise - это DEE, так здесь принято их называть . Дпи можно посмотреть в любых прогах, в том же Ирфане, а также в свойствах файла. Показания в разных прогах иногда отличаются на единицу. С чем это связано, не знаю. Ресемплинг делал в Кореле.
Цитата:
Под фоном Вы понимаете размытие отдельных фрагментов дежавю
Под фоном понимается фон (слой background) . Эффект размытия возникает, когда часть штрихового рисунка попадает в маску (слой foreground) а часть в фон (слой background). В цветных дежавю есть еще третий слой - foreground colors. При 600 дпи в профиле Scanned600 дпи background - 600/6=100, дпи foreground colors - 600/12=50. Для сравнения, в профиле Scanned150 дпи background - 150/1=150, дпи foreground colors - 150/4~37.
Поясняю, если к скану 600 дпи вы применяете профиль Scanned150 то дпи фона будет 600/1=600, дпи цветов - 600/4=150. Соответственным будет и размер.

Цитата:
Единственые искажения, которые я заметил это появление красных участков в черных линиях, Вы это имели ввиду?
Именно это
Автор: Alexx S
Дата сообщения: 20.01.2007 18:54
Arcand
К сожалению, сканы остались на работе и раньше понедельника отправить не получится.

Цитата:
Если тень не налезает на текст и отрезается резаками, то чистить фон или делать цветокоррекцию не надо.

Тени практически нет.

Цитата:
Мне требуется пара сканов (хотелось бы побольше, но трафик...)

Может, лучше сделать десяток страниц с зонами и выслать зоны отдельно?
Размер будет такой же, а материала для работы больше.

Цитата:
Небольшой совет, когда делаете gif или преобразуете в индексированные цвета, делайте это в проге, в которой можно отключить dithering и использовать адаптивную палитру.

GIF я решил пока не делать. Все сканы лежат в TIFF. Gif мне был нужен при сканировании, я после твоих слов от этого отказался.
Автор: OlegDobrij
Дата сообщения: 21.01.2007 12:38
Подскажите, где можно почитать о настройках в Grey image enhance
Автор: Arcand
Дата сообщения: 21.01.2007 14:51
shch_vg
Э... поправочка, в очередной раз лопухнулся . Для обработки скана я преобразовал его в tif и благополучно забыл про это. Gif не содержит информации о дпи. Поэтому, при преобразовании в тиф Корел (и другие проги) прописывают 72 дпи - разрешение монитора. Вот откуда все это вылезло и пр.

Alexx S
Цитата:
Может, лучше сделать десяток страниц с зонами и выслать зоны отдельно?
Размер будет такой же, а материала для работы больше.
Лучше сделать так. Если какой-то скан будет обработан не так как нужно, ты его мне скинешь, а я поправлю скрипт.
Я тут подумал как следует . Кидай-ка мне исходные сканы. Мало ли что потом вылезет.
Автор: Alexx S
Дата сообщения: 21.01.2007 15:10
Arcand

Цитата:
Кидай-ка мне исходные сканы. Мало ли что потом вылезет.

Как скажешь Только там по 15мегов за штуку, причем обработка с background cleaner никакого влияния на фон не оказывает. Или я что-то не так делаю.

Впрочем, это мало кому интересно, предлагаю перенести диалог в ПМ, ICQ или почту по твоему усмотрению.

OlegDobrij

Цитата:
Подскажите, где можно почитать о настройках в Grey image enhance


Как выяснилось, и мне почитать не мешало бы.
На данной момент можно поискать на этом форуме и в вопросах и ответах из шапки. Хелпа пока нет, надо подождать.
Автор: Arcand
Дата сообщения: 21.01.2007 15:35
Alexx S
Цитата:
Только там по 15мегов за штуку, причем обработка с background cleaner никакого влияния на фон не оказывает. Или я что-то не так делаю.
В jpg? Такого быть не может! Сейчас сканирую книгу в цвете и в jpg 100%. Не чета твоей . На страницу приходится 3.5 мега.
Автор: Alexx S
Дата сообщения: 21.01.2007 15:41
Arcand

Цитата:
В jpg? Такого быть не может! Сейчас сканирую книгу в цвете и в jpg 100%. Не чета твоей . На страницу приходится 3.5 мега.

В TIF-е
У нас с JPG взаимная непереносимость
Автор: Arcand
Дата сообщения: 21.01.2007 15:44

Цитата:
предлагаю перенести диалог в ПМ
В ПМ. Пчелка у меня почему-то не работает. Разбираться нет времени.
Автор: shch_vg
Дата сообщения: 21.01.2007 19:55
Arcand

Цитата:
Поэтому, при преобразовании в тиф Корел (и другие проги) прописывают 72 дпи - разрешение монитора

Вот теперь стало понятно... почти все
Большое спасибо за разъяснение эффекта размытости, но остался непонятен один момент:
в Эдиторе (уже усвоил ) сделал из Вашего color2.tif два дежавю с разными опциями - первый 96 кб (разрешение - 143, форсированный), второй 28 кб (разрешение - 300, форсированный). Во втором наблюдается размытость (т.е. часть рисунка ушла в фон, верно?), в первом же размытости не наблюдается совсем, я так понимаю, что в фон не попало ничего. Получается, что экономия в размере дежавю произошла за счет части рисунка, попавшего в фон (т.е. он теряется, либо резко уменьшается). Я верно понимаю?
Если это так, то набольшее качество (но не длина!) получается на двойном разрешении преобразования гифа в тиф.
Честно говоря, я не стал бы применять второй вариант для получения дежавю, т.к. размытость бросается в глаза.
Автор: umup
Дата сообщения: 21.01.2007 21:21
bolega

Несколько вопросов :

1) часто вылетает на некоторых страницах с access violation. Стоит немного передвинуть полоски разрезания, тогда обрабатывает нормально. Hапрягает, когда оставляеш на обработку, приходиш через час, а обработано 3 листа и висит сообщение об ошибке. Особенно вылетает при обработке черно-белых изображений (именно на deskew, без него все проходит гладко).
2) при draft kromsate даже если задано обязательное разрезание страниц, иногда не разрезает (часто если одна страница полностью чистая) и средние резаки устанавливает слева, приходится вручную передвигать в центр и включать (дополнительные затраты времени). Или перепутывает резаки местами (верхние ставит левее нижних). По моему, дополнительно проверить их положение несложно.
3) обработка, перелистывание TIFF на порядок быстрее например GIF, почему такая большая разница в скорости ?
Автор: Dracula
Дата сообщения: 22.01.2007 13:06
Всем привет!
Сканирую книги по медицине и в них наблюдается очень много фотографий (как серых, так и цветных) - вот кто бы мне наглядно (досконально) и желательно в рисунках объяснил на Новогодней версиии СканКромсатора - как обрабатывать - был бы очень признателен (горит - книги отсканированы, но не обработаны) - начальство меня съест - если узнает - плииииииз помогите.
Автор: Varjag2
Дата сообщения: 22.01.2007 13:11
Уважаемый "bolega"! Сегодня, наконец-то, отважился поработать с Вашей новой версией кромсатора. О лучшем даже не мечталось! Земной Вам поклон за Ваш благородный труд.
С уважением и благодарностью, Варяг.
Автор: Alexx S
Дата сообщения: 22.01.2007 13:25
Dracula
В шапке есть пособие "ScanAndShare". Единственное отличие - надо выделять зоны, но с этим разберешься. Если в двух словах - на панели выбираешь из выпадающего списка "Mark as picture zone" и выделяещь картинку. Двойно клик - ДПИ, цвет и т.п.
Ну а как разберешься - ждем инструкции, доскональной и с картинками
Автор "ScanAndShare" так и поступил.
Автор: Dracula
Дата сообщения: 22.01.2007 13:32
Alexx S
Одна просьба - рапида забила на меня - не качает оттуда (сижу в локалке) и мой IP постоянно в дауне. Выложи где-нибудь - на megaupload.com например.
Заранее спасибо. Желательно конечно версию 1.06
Автор: Alexx S
Дата сообщения: 22.01.2007 13:56
Dracula
http://www.megaupload.com/?d=5P8TZZ2I

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.