Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: Young teapot
Дата сообщения: 25.06.2007 20:49
bolega

Дурацкий вопрос, а откуда они берут книжки, если сканирование им неинтересно?
Автор: Olive77
Дата сообщения: 25.06.2007 21:24
Нашел тут новое применение Кромсатору.
Отксканировал некоторые из своих документов и обработал в SK для уменьшения размера и повышения качества.

Вот только мне не надо ничего отрезать.
Соответсвено откключаю опцию Automargins, выбираю H.Gap value=0
Задаю Page width (fixed) = 4874, Page height (fixed) = 6956,
что соответствует размерам обрабатываемого файла.

На выходе почему-то получаю файл с размером 4885x6964

Добавлено
всем спасибо
Автор: timmer
Дата сообщения: 26.06.2007 00:23
VadimirTT

Цитата:
Вы где нибудь с ними общаетесь, с бусурманами?
Интересно, на планетедежваю у них есть форум сканировщиков?
Вот книжечка, которую я как то отсканировал Design for Air Combat. Ray Whitford, 1987, может им подсунете, вдруг заинтересует, вдруг спросят как это делается?


Да можете и сами попробовать "подсунуть" (нужна регистрация) Только я вот уже и сам начинаю сомневаться в том, что это будет иметь какие-то далеко идущие последствия. Пока той паре человек, которая поинтересовалась, чем это я так ловко обработал корявый PDF, и, кхм, как сделать DjVu, посоветовал пользоваться BookRestorer'ом и пр. стандартными программами. Со временем, если будет интерес, возможно и стоит попробовать заняться продвижение кромсатора, а пока я не вижу достаточного количества людей, которые предпринимают хоть какие-то попытки регулярно сканировать интересные материалы и как-то совершенствовать свои методы сканирования. А агитировать людей сканировать больше и использовать для этого продвинутые инструменты вроде кромсатора слишком затратно по времени и не гаранитурует притока энтузиастов

Young Teapot

Цитата:
Дурацкий вопрос, а откуда они берут книжки, если сканирование им неинтересно?


netLibrary, Gale Virtual Referene Library, Wiley Intersciense, Ingenta, Springer и т.д. и т.п. Все это, конечно, открывает богатые возможности, но с другой стороны развращает и, как следствие, мы имеем "непопулярность сканирования как такового"
Автор: Arcand
Дата сообщения: 26.06.2007 04:03
Olive77
Цитата:
Вот только мне не надо ничего отрезать.
В таких случаях я задаю Page width и Page height = None.
Автор: bolega
Дата сообщения: 26.06.2007 07:19
Olive77
Если отключаете полностью Automargins, то кромсатор не будет смотреть на fixed-размеры, а будет оставлять их как есть, в данном случае, они будут равны исходным плюс поправка на deskew

Добавлено:
timmer

Цитата:
А агитировать людей сканировать больше и использовать для этого продвинутые инструменты вроде кромсатора слишком затратно по времени и не гаранитурует притока энтузиастов

Лично я никогда не рекламировал кромсатор "там", и в мои планы это не входило и не будет входить. Мне даже удобнее, когда я получаю от них необработанный файл, уж лучше я сам его покромсаю. Если конечно они по дурости не запихнут его в jpg 100dpi а потом в pdf с последующей оптимизацией. Вот это уже ужас какой-то, причем не редкий.
Автор: djdtyfhu
Дата сообщения: 29.06.2007 13:31
Покромсал довольно большую книгу (540 страниц), но не посмотрел, что опции Page Width и Page Height стояли в "NONE". Теперь имею полностью удовлетворяющие меня выходные файлы, но разного размера. Вопрос: можно как-нибудь подогнать все страницы под единый формат без повторной полной обработки в Кромсаторе?
Автор: IZVER
Дата сообщения: 29.06.2007 16:42
Подскажите пожалуйста, где-пробегала
ссылка на файл proof-csep.rar

Добавлено:
Обработка цветных сканов в DJVU с минимальными потерями качества (как фото, так и текста)
--------------
Как известно, при кодировании в DJVU кодер сам определяет, какую часть скана отнести к слою foreground (в него, по идее, надо затащить текст), а остальное, грубо говоря - к background (картинки). Вмешаться напрямую в ход работы нельзя, можно покрутить параметры кодера. Делается это методом научного тыка.
Однако, есть всё-таки возможность напрямую указать что и как кодировать. Такую возможность даёт open-source кодер djvulibre. В его состав входит утилита csepdjvu, которая кодирует в DJVU файл, на её вход подаётся специальный файл, состоящий из двух частей. Первая часть - битональная маска (текст), вторая - цвет. Файлы формируются с помощью двух других утилит tifftopnm и pbmtodjvurle
Рассмотрим на примере:

tifftopnm foreground.tif | pbmtodjvurle > out.sep
tifftopnm background.tif |pamscale 0.5 >> out.sep
csepdjvu out.sep demo.djvu
del out.sep
pause

Здесь 1 шагом открывается tiff(Ч/Б маска) и передаётся tifftopnm (конвертация в ЧБ RLE формат ) и записывается в out.sep
2 Шаг: цветное изображение дописывается в out.sep в цвете, формат RLE . Для увеличения компрессии разрешение файла при записи снижается вдвое (pamscale 0.5). Как правило, при снижении разрешения цветно картинки с 300 до 100 DPI, визуально ухудшение не сильное. Кому не нравится - можно писать (tifftopnm background.tif >> out.sep)
3 Шаг: csepdjvu на основе файла out.sep формирует DJVU, тупо записывая первый слой в foreground, второй в background

В итоге получаем файл с хорошими цветными фото и текстом в одном флаконе.

Данный метод подойдёт для обработки текстов, в которых есть цветные иллюстрации, которые надо максимально точно сохранить при кодировании.

Есть у него несколько минусов:
1) Практически невозможно автоматизировать разделение на два слоя - текст и цвет. Возможно я ошибаюсь.
2) Данный кодер немного уступает лизардовскому - пишет что-то в дополнительные слои (совсем чуть-чуть). Ну и наверно коммерческий движок вылизан получше.

К чему всё это я веду.
В последней версии кромсатора есть возможность выбора exclude-зон. При обработке эти зоны пишутся в отдельные маленькие файлы. Если бы кромсатор умел создавать один файл, в котором бы были раскиданы эти рисунки, то хоть чуть-чуть облегчился наш труд.
И верх наглости ) - в постах выше была просьба об автоматическом определении этих exclude-зон. Это реально ??

PS. Говорят, в BookRestorer такая функция есть, надо бы посмотреть...

Ссылки:
OpenSource утилиты для кодирования в DJVU
http://ovh.dl.sourceforge.net/sourceforge/djvu/djvulibre-3.5.17-1-win32.zip

Небольшой пример кодирования
http://rapidshare.com/files/40054314/proof-csep.rar

Пример-оцифрованная вышеуказанным методом книга "Шторы"
81 страница, иллюстрации, 13 Мб, 300 DPI (и текст и иллюстрации)
http://rapidshare.com/files/39849823/karpova_e__logacheva_t.__red.____karpova_e_logacheva_t___shtory__1995__ru__t__c__300dpi__81s_.rar

PPS
Закодировал свои TIFF-ы с помощью djvu_small (Профиль кодирования Clean), файл получился около 3Мб (вместо 12 моих), текст нормально, но иллюстрации получились ужасные ( ! Что делать ??
Автор: are
Дата сообщения: 29.06.2007 21:59
IZVER
что если использовать вместо бесплатной утилиты csepdjvu коммерческую утилиту msepdjvu из пакета Djvu Editor Enterprise 5.1? Может размер файлов станет меньше?
Автор: IZVER
Дата сообщения: 02.07.2007 06:42
Скачаю и попробую
А где взять таблетку ?
Автор: VadimirTT
Дата сообщения: 02.07.2007 08:33
IZVER
Про аавтоматизацию

Цитата:
Кстати, все таки можно использовать и кромсатор для разделения.
Т.е. кромсаем с зонами, затем дублируем задание, в одном из них все листы заменяем чистыми и сливаем их с цветными иллюстрациями, в итого получаем картинки на белом фоне, а в другом месте текст без картинок, а далее по Вашей технологии.

Автор: manfred
Дата сообщения: 03.07.2007 00:13

Цитата:
Закодировал свои TIFF-ы с помощью djvu_small (Профиль кодирования Clean), файл получился около 3Мб (вместо 12 моих), текст нормально, но иллюстрации получились ужасные ( ! Что делать ??

Уменьшить разрешение background в 2-3 раза (use pamscale ...)

Скачай работает в win2k/winXP, ПОПРАВЬ и запусти run_sepdjvu.cmd и будет тебе счастье (может быть

P.S. msepdjvu можно найти в LizardTech Virtual Printer или Lizardtech Document Express Enterprise (см. hxxp://www.djvu-soft.narod.ru/)
Автор: IZVER
Дата сообщения: 03.07.2007 08:28

Цитата:
VadimirTT


Спасибо! Попробую!


Добавлено:

Цитата:
Уменьшить разрешение background в 2-3 раза (use pamscale ...)

Да, это помогает конечно, но качество теряется.
Книги у меня уже на руках нет, а качественный скан хотелось сохранить на века .

Попробовал msepdjvu.exe - те же тиффы закодировал тем же способом.
Только вместо csepdjvu использовал коммерческий msepdjvu.
Разница - в 1 мегабайт и даже меньше. Чисто текстовые страницы msepdjvu сжимает лучше, а страницы с графикой - примерно так же как csepdjvu.
Автор: Arcand
Дата сообщения: 03.07.2007 14:32
IZVER
Цитата:
Закодировал свои TIFF-ы с помощью djvu_small (Профиль кодирования Clean), файл получился около 3Мб (вместо 12 моих), текст нормально, но иллюстрации получились ужасные ( ! Что делать ??
В DEE работой сегментера можно в достаточной степени управлять. Попробуйте найти оптимальный профиль с точки зрения разделения скана на маску и фон а также качества фона (имеется ввиду разрешение и собственно качество фона) с помощью Configuration Manager. Вполне вероятно, что он найдется и не понадобится морочиться с разделением сканов на маску и фон и прочим.
Автор: shch_vg
Дата сообщения: 04.07.2007 10:17
bolega
All
Попался скан с довольно бледной печатью, но что еще хуже с рваными буквами.
Можно его привести в более-менее читаемый вид с помощью СканКромсатора?
Исходный скан тут. (517 кб)
Спасибо.
Автор: Alexx S
Дата сообщения: 04.07.2007 17:03
shch_vg
Это не скан бледный, это отсканировано так криво... И что тут может Кромсатор сделать? Буквы дорисовать?
Автор: shch_vg
Дата сообщения: 04.07.2007 17:45
Alexx S

Цитата:
Это не скан бледный, это отсканировано так криво...

Что значит криво?
Все книги сканируются одинаково, и что можно сделать со сканером, чтобы он начал сканировать по-другому?
Сканировалось стандартно - 300dpi, grey.
Получается, что есть так отпечатанные книги, что стандартным сканером их невозможно обработать?
Автор: Arcand
Дата сообщения: 04.07.2007 18:03
shch_vg
Цитата:
Все книги сканируются одинаково,
А Вы не обращали внимание на настройки в сканерных прогах/драйвере сканера. Там наверняка есть настройки яркости и контраста. В случае этого скана задрана яркость так, что части некоторых букв ушли в туман . Alexx S верно отметил - отсканировано криво. Сканировать в идеале надо в RAW или с настройками по умолчанию (регулировки на нуле).
Автор: Alexx S
Дата сообщения: 04.07.2007 18:21
shch_vg
Фон слишком белый, видимо настройки яркости/контраста у сканера измениялись
Попробуйте отсканировать еще раз, выставив все по умолчанию

Добавлено:
Arcand
Опередил
Я еще хотел спросить - а как выглядит книга, не пропущенная через санер? Так же бледно?
Автор: shch_vg
Дата сообщения: 04.07.2007 20:34
Alexx S

Цитата:
а как выглядит книга, не пропущенная через санер? Так же бледно?

Книгу я не видел, прислал мне этот скан человек, который пару десятков книг уже обработал, но с таким сканом он столкнулся впервые. Я могу лишь передать его слова о книге - "очень слабая, светлая печать, мало краски".
Сам я сканирую vuescan-ом всегда в raw, в чем он сканировал, я не знаю, но я получал от него сканы страниц из других книг, все они были в рамках допустимого.
Arcand

Цитата:
А Вы не обращали внимание на настройки в сканерных прогах/драйвере сканера

Честно говоря, нет. Мне надо было сканировать, я нашел программу и режим сканирования и это мне было достаточно. Возможности этой программы я знаю, наверное, процентов на 5, но отсканировал более 100 книг и ни разу не сталкивался с такой проблемой. Книга, надо сказать, не старая, выпущена в Риге в 2006 г.
Такой вопрос: Если допустить, что очень слабая печать, из-за чего при обычном сканировании образуются промежутки в буквах, то какие настройки могут воспрепятствовать этому?

Автор: Alexx S
Дата сообщения: 04.07.2007 21:52
shch_vg
Все-таки, какой бы качественной ни была бумага, такой белизны на нормальном скане не будет... А вот из-за повышенной яркости - запросто... Пусть попробует отсканировать на настройках по умолчанию, или даже с пониженной яркостью/конртастом, чтобы проступил фон
Автор: Arcand
Дата сообщения: 05.07.2007 05:07
shch_vg
Цитата:
Я могу лишь передать его слова о книге - "очень слабая, светлая печать, мало краски".
Сканирую всегда с настройками по умолчанию. Раньше до ОптикБука сканировал в RAW в VueScan'е (VueScan ОптикБук не поддерживает). Всегда при сканировании в gray был фон (от бумаги) от светло-серого до темного. Наличие фона как правило означает, что отсканировано нормально, без потерь - качество печати тут не причем.
Цитата:
Сам я сканирую vuescan-ом всегда в raw ... Возможности этой программы я знаю, наверное, процентов на 5
При сканировании в RAW все настройки значения не имеют - они при сохранении игнорируются. Я использовал только поворот, чтобы в окне просмотра скан был правильно ориентирован и отключал цветовой баланс (для уменьшения задержек). При включенной коррекции после сканирования наблюдается небольшая задержка - происходит коррекция, результат ее виден в окне просмотра, на RAW это не влияет.

Цитата:
Такой вопрос: Если допустить, что очень слабая печать, из-за чего при обычном сканировании образуются промежутки в буквах, то какие настройки могут воспрепятствовать этому?
При сканировании в RAW у вас максимально возможная информация. Со всеми дефектами книги. Когда качество печати (тоновый баланс) плавает, то я вначале делаю автокоррекцию сканов, потом все остальное. Если какие-то дефекты после всех обработок остаются, значит все - такова судьба.
Надеятся, что серьезные дефекты можно устранить сканированием/обработкой, не следует.

Добавлено:
Возвращаясь к Вашему скану. Посмотрите на сгиб (тени почти нет) и срез книжного блока (он очень светлый). Однозначно чрезмерно завышена яркость, скан безнадежно испорчен.
Автор: shch_vg
Дата сообщения: 05.07.2007 09:20
Alexx S
Arcand
Спасибо за помощь

Получил дополнительную информацию:
Используется для сканирования программа, идущая со сканером, Brother MFL Pro Suite.
Буквы слабо видимы, но целые, после сканирования рваные. Используются установки по умолчанию, яркость и контрастность - 50%.
Из Ваших советов вытекает, что надо понижать контрастность или и то, и другое?
Arcand
Как в vuescan отключить цветовой баланс?

Автор: Alexx S
Дата сообщения: 05.07.2007 09:31
shch_vg
Для начала, надо попробовать другую программу и сканировать через Twain-модуль. не исключено, что все коррекции происходят в этом Brother MFL Pro Suite. При настройках по умолчанию так выбеливать не должно, достаточно на любом другом сканере отсканировать совершенно белый лист бумаги для сравнения.
Автор: Arcand
Дата сообщения: 05.07.2007 10:24
shch_vg
Цитата:
Используются установки по умолчанию, яркость и контрастность - 50%.
Маловероятно, что это установки по умолчанию. Во всех (почти) прогах/драйверах положительные значения означают увеличение, отрицательные - уменьшение. Ноль соответственно без коррекции.
Цитата:
Как в vuescan отключить цветовой баланс?
На закладке Color установите Color balance=None. Если и после этого окно просмотра после сканирования будет обновляться, значит надо другие коррекции отключить (уточните в справке, раздел How VueScan Works).


Добавлено:

Цитата:
Из Ваших советов вытекает, что надо понижать контрастность или и то, и другое?
Из моих советов вообще-то следует, что ничего не надо делать . Все коррекции надо делать в графических прогах - они для того и предназначены. Плюс, если что не так, не надо пересканировать, поправил настройки обработок и вперед.
Автор: shch_vg
Дата сообщения: 05.07.2007 11:55
Arcand

Цитата:
Из моих советов вообще-то следует, что ничего не надо делать

Позволю себе не согласиться с Вами.

Цитата:
Возвращаясь к Вашему скану. Посмотрите на сгиб (тени почти нет) и срез книжного блока (он очень светлый). Однозначно чрезмерно завышена яркость, скан безнадежно испорчен.

Отсюда, по-моему, однозначно следует, что нужно убрать яркость при сканировании.
Или я что-то не так понял?

Автор: Arcand
Дата сообщения: 05.07.2007 12:08
shch_vg
Цитата:
Позволю себе не согласиться с Вами.
Жаль . Сказанное - мое твердое убеждение, подкрепленное практикой и здравым смыслом . Отсканируйте страницу этой книги в сыром виде и выложите скан. Там и продолжим дискуссию по этому поводу, но уже предметно .
Цитата:
Отсюда, по-моему, однозначно следует, что нужно убрать яркость при сканировании.
Не убрать, а не устанавливать . Яркость и контраст должны стоять в нейтральном положении.
Автор: Alexx S
Дата сообщения: 05.07.2007 12:12
shch_vg

Цитата:
Позволю себе не согласиться с Вами

А не с вами ли мы дискутировали по этом поводу в топике по обработке эл. книг?
Автор: shch_vg
Дата сообщения: 05.07.2007 13:03
Arcand
К сожалению, Вы меня не правильно поняли. Я ни в коем случае не спорю с Вами, а под словом убрать я понимал уменьшить значение яркости. Я не могу сам отсканировать эту книгу, т.к. у меня ее нет, этот скан мне прислали, а приславший его сказал, что параметры яркость и контрастность он не трогал, а использовал установки по умолчанию, поэтому я и написал убрать, т.е. уменьшить.
Я потому и не понимал, что происходит, что все время использовал vuescan в raw и никогда не сталкивался с подобным, хотя попадались книги разного качества.
Alexx S
Вряд ли Вы дискутировали со мной, т.к. я в указанном топике не участвовал ни одним сообщением

Автор: Alexx S
Дата сообщения: 05.07.2007 13:53
shch_vg
Значит обознался... В любом случае, пусть попробует другую программу для сканирования, да и в менеджере сканирования можно покопаться, вдруг там какая-нибудь функция по автокоррекции включена...
Автор: ignatav
Дата сообщения: 05.07.2007 15:19
Alexx S
shch_vg
Arcand
Товарисчи! Перестаньте!
Сканируют в соседнем топике, здесь постобработка в СК.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.