Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: bolega
Дата сообщения: 29.01.2007 07:47
darkseed
Выложите 2 страницы скана, и тогда вместе разберемся.
Автор: nnevt
Дата сообщения: 29.01.2007 08:16

Цитата:
pozhaluysta obyasni shag za shagom, kak obrabatovat fotografii!!!

Да, будьте так добры. А то в общем-то четкий алгоритм не складывается. Конечно, в идеале бы - аналог ScanAndShare!, но это - время... Хотя бы только в текстовой форме.
Автор: Alexx S
Дата сообщения: 29.01.2007 15:16
shch_vg

Цитата:
А нельзя куда-нибудь выложить этот результат, да хорошо бы и вместе с .spt ?
Дело в том, что для меня это похоже на шаманство, тем более таких картинок в книге штук 500, не меньше

Знаете, дома все получалось, на работу пришел - результат гораздо хуже...
Вот то, что получилось: http://rapidshare.com/files/13930472/0001.tif.html
Автор: darkseed
Дата сообщения: 29.01.2007 18:44
bolega

Цитата:
Выложите 2 страницы скана, и тогда вместе разберемся.


Izvini, vilozhil 3 razvorota (6 stranits).

http://rapidshare.com/files/13957420/kotov-schachinderudssr.rar
Автор: shch_vg
Дата сообщения: 29.01.2007 18:52
bolega

Цитата:
Нет, именно B/W-зона.

А где ее можно увидеть?
Я вижу только Exclude zone, dither zone, bitonal zone, contrast zone, floodfill zone и picture zone.


Цитата:
В планах - автоматическое определение зон шахматных диаграмм. Даже была шальная мысль сделать подмену изображений фигур и доски. Вручную. Некий редактор диаграмм, т.е. без использования распознавания фигур

За автоматическое определение зон шахматных диаграмм голосую двумя руками, но не уверен, что редактор диаграмм нужен. Все-таки обрабатывая книгу, хочется иметь ее как можно ближе к оригиналу. Пока из порядка 80 книг я встретился только с двумя случаями невозможности обработать диаграммы ( второй случай я как раз описывал выше да и то здесь еще не все опробовано).
А вот возможность параллельной с текстом обработки диаграмм со своими настройками очень нужнa. Сейчас мне иногда приходится дважды обрабатывать книгу с разными настройками в разные выходные директории, а затем копировать диаграммы из одного запущенного экземпляра Кромсатора в другой. Надо сказать, что после такой работы приходится на некоторое время брать отгул в дальнейшей обработке.
Alexx S

Цитата:
Вот то, что получилось

Да, результат не впечатляет. Будем пробовать еще варианты...


Автор: bolega
Дата сообщения: 30.01.2007 12:06
darkseed
Вот что получилось:
_http://rapidshare.com/files/14064986/res.djvu.html (140кБ)
Все понятно. Там иллюстрации довольно хитрые, с виду -серые, а на самом деле растрированные. Поэтому в свойствах всех зон я поставил галку на inverse dithering.
После этого размер djvu упал в 2 раза. Использовал DEE.

Добавлено:
shch_vg

Цитата:
А где ее можно увидеть?

В меню Mark as bitonal или кнопочка с двумя вложенными квадратами, разделенными по диагонали и раскрашенные в ч/б цвета.

Добавлено:
shch_vg
Вот что у меня получилось. Это по-моему лучшее, что можно сделать, но и размер файла великоват получается.
_http://rapidshare.com/files/14070115/0001_4.djvu.html
Автор: shch_vg
Дата сообщения: 30.01.2007 18:57
bolega

Цитата:
shch_vg

Цитата:"типа B/W" имеется ввиду bitonal zone

Нет, именно B/W-зона.


bolega

Цитата:
shch_vg

Цитата:А где ее можно увидеть?

В меню Mark as bitonal или кнопочка с двумя вложенными квадратами, разделенными по диагонали и раскрашенные в ч/б цвета.


Что-то я не понимаю, какому варианту верить, это разве не одно и то же


Цитата:

Вот что у меня получилось. Это по-моему лучшее, что можно сделать, но и размер файла великоват получается.

Нельзя ли узнать, с какими параметрами был получен результат, м.б. придется остановиться на таком варианте


Цитата:
Там иллюстрации довольно хитрые, с виду -серые, а на самом деле растрированные.

А как это можно определить?

Автор: bolega
Дата сообщения: 31.01.2007 07:30
shch_vg

Цитата:
Что-то я не понимаю, какому варианту верить, это разве не одно и то же

Да (усталость сказывается).
Я хотел подчеркнуть, что это не dither-зона.


Цитата:
А как это можно определить?

При большом увеличении сразу видно "газетное" качество.


Цитата:
Нельзя ли узнать, с какими параметрами был получен результат

Опции страницы:
Convert=190
Blur=1, Sharpen=2,
Correct illum = on, Strength=5, Method=combo, adjust histo=on
Опции зоны:
DPI=original, Color=B/W, Protect from bgr cleaner=OFF, Contrast=20
Автор: kimserge
Дата сообщения: 31.01.2007 13:41
bolega
Подскажите, как надо кодировать в джвю тифы с dither-зонами? При попытке это сделать в любом профиле такая ситуация -

[31.01.2007 14:32:54] creating C:\Djvu_Works\0001_1.djvu...
[31.01.2007 14:32:56] Error: [1-10000] Unrecognized error message:
[31.01.2007 14:32:56]
[31.01.2007 14:32:56] Message name: Unknown Error..
[31.01.2007 14:32:57] ERROR: error code 1 in creating C:\Djvu_Works\0001_1.djvu...
[31.01.2007 14:32:58] Job "untitled job1" completed with 1 errors.

Спасибо!
Автор: bolega
Дата сообщения: 31.01.2007 15:23
kimserge
В DEE у меня никогда проблем с кодированием dither-областей не было, даже очень большого размера.
В Solo кажется когда-то что-то подобное было, видимо он не расчитан на большое кол-во кластеров, т.е. групп связанных точек. Впрочем, он и просто при большом кол-ве файлов часто рушился.
Автор: terminat0r
Дата сообщения: 31.01.2007 16:25

Цитата:
kimserge
В DEE у меня никогда проблем с кодированием dither-областей не было, даже очень большого размера.

вообще-то это меня удивляет, так как такие проблемы почти всегда вылазят (вылазили) в дде, когда ему давать чб файл с дитер зоной.
было это конечно давно, когда э.. я эти зоны еще использовал
пришлось от них отказаться так как они у меня увеличивали дежавю файл до неимоверных размеров.
но решалось кажется конвертацией готового тифф файла в серый и кодированием в дде как не чб файл!

Автор: bolega
Дата сообщения: 31.01.2007 16:39
terminat0r

Под DEE я понимаю пакетный Enterprise.


Цитата:
пришлось от них отказаться так как они у меня увеличивали дежавю файл до неимоверных размеров

Я тоже уже их практически не использую, тперь юзаю picture-зоны. Но для малых областей dither до сих пор остается незаменимым инструментом, представьте на странице рисуночек в виде сантиметрового кружочка, залитого сереньким фоном. Использовать ради него gray-формат - значит занизить качество всей страницы, можно конечно и Picture-зону, но тоже смысла нет, т.к. как показывает мой опыт, небольшие dither-области практически не вызывают увеличения djvu. Например, посмотрите как сделан Хайкин.Нейронные сети, 1100 страниц. Размер всего 9M! (без OCR), хотя небольшие dither-области использовались на каждой пятой странице.
Автор: terminat0r
Дата сообщения: 31.01.2007 16:46
bolega

Цитата:
Но для малых областей dither до сих пор остается незаменимым инструментом, представьте на странице рисуночек в виде сантиметрового кружочка, залитого сереньким фоном. Использовать ради него gray-формат - значит занизить качество всей страницы, можно конечно и Picture-зону, но тоже смысла нет, т.к. как показывает мой опыт, небольшие dither-области практически не вызывают увеличения djvu

ага, ну если так, то надо бы это мне запомнить спасибо
Автор: Arcand
Дата сообщения: 31.01.2007 16:49
kimserge
Может дело в том, что эти тифы DEE не понимает. Он в этом отношении капризный (в частности, не любит серые от SK). Попробуйте перекодировать в Ирфане. Его тифы любого вида он обожает .
Автор: kimserge
Дата сообщения: 31.01.2007 18:37
Arcand
Да, действительно, дело, видно, было в тифах. Прогнал через Ирфан и все сдежавюировалось. Здорово.

bolega и все добрые люди
Только вот становится грустно от того, что серые картинки для дежавю подлежат похериванию через дизер-зоны... У меня лежит книга с огромным кол-вом иллюстраций, которую я все не решаюсь доделать.
Вот моя дилемма:
1) хочется ее иметь в джвю,
2) но джвю с пикчер-зонами (по профилю фото) получится минимум мегабайт на 150, ибо каждая страница на 1,5 мб, а после DDE - 1,2 мб... Если кодировать DDE в битонал, то размер будет маленьким, но картинки испортятся, размоются, будут, как в примерах от болеги чуть выше...

Выход вижу в дизер-зонах, качество тоже не ахти, даже, может, хуже, но хоть не размыто..

Тут в топике пробегали намеки на некое супер новое сжатие в пдфе, но кто бы объяснил, как и где его найти...
Автор: Melirius
Дата сообщения: 31.01.2007 20:21
kimserge

Вопрос: в каком разрешении книга отсканирована?
Предлагаю финт ушами:

Создаём профиль такого рода (для 300dpi)
Background Quality: 100

+ Background Floss
Pixel Filter Level: (0-100) 50
Shape Filter Level: (0-100) 100
Threshold Level: (0-100) 20
Inversion Level: (0-100) 0
Foreground Subsample: 12
Backgrοund Subsample: 2
+ Refine Subsample
Mask Upsample: 1
Resolution Multiplier: 2

Text Quality: Most-loss
Foreground Quality: (1-100) 1
Page: Per Dictionary: (integer, default 10) 10000

Upsample: 2

Для 600dpi - то же самое, но Upsample: 1 и Backgrοund Subsample: 4

Почти весь текст (99,9%) уходит куда надо - в foreground, а каритнки - в background. Размер и качество файла более чем приемлемы. Рекомендую.
Автор: kimserge
Дата сообщения: 31.01.2007 20:56
Melirius
300 дпи
А профиль надо создавать для фото или битонала, или на основе какого другого? Попробовал на основе битонал и фото. В 1 случае картинка бинаризировалась, во 2-м - страница стала из 2,7 мб 5,5...
Вот сюда кладу мой файл, не попробуете его сделать по вашему методу?
http://rapidshare.com/files/14288185/0001.tif
Спасибо

UPD
Только что сделал ваши настройки для профиля scanned 300 dpi, в итоге получилось из 2,7 мб - 456 кб. Вот это уже здорово, при большем числе страниц средний размер еще наверное уменьшится...
Скажите, все же, на основе сканнед надо делать профиль?
Автор: Arcand
Дата сообщения: 01.02.2007 13:33
Alexx S
Доделал макросы для Корел и сделал твои сканы. Посмотреть http://abab.front.ru/Alexx_S.djvu .
Если результат устроит, напишу краткую инструкцию для твоего случая. Кратко о процессе:
1. Кромсаете в СканКромсаторе (deskew, обрезка), выходные сканы color 300 дпи (как и исходные).
2. Запускаете макрос MaskScan - создается альфа-канал с маской для цветного текста.
3. Запускаете макрос ShareScan - обработка сканов.
4. В СканКромсаторе выполняете чистку сканов (выходные сканы bw).
5. Запускаете макрос DespeckleScan - чистка цветных сканов (используются чистые bw сканы).
В твоем случае ручной работы, связанной с Корел не будет - автоматика .

kimserge
Цитата:
Только вот становится грустно от того, что серые картинки для дежавю подлежат похериванию через дизер-зоны... У меня лежит книга с огромным кол-вом иллюстраций, которую я все не решаюсь доделать.
Могу поспособствовать. Не скрываю, заинтересован подсадить на Корел как можно больше народа . Если Вы готовы связаться с Корел, напишу скрипты и пр. Вам останется мизер работы. Нужны Ваши сканы, парочка в jpg 95% или 100%.
Для информации, сегодня сделал bw книгу с серыми картинками (250 стр, gray сканы были покромсаны ранее, на выходе gray 300 дпи):
наложение маски на картинки (вручную) около 20 мин; обработка макросом ShareScan 45 мин; чистка автоматом в СканКромсаторе 8 мин; ручная чистка 50 мин (голимый эстетизм); чистка серых сканов с помощью макроса DespeckleScan не засекал - попил кофе, покурил. Посмотреть парочку страниц в дежавю (оригинал не очень) http://abab.front.ru/graysample.djvu
Автор: bolega
Дата сообщения: 01.02.2007 14:31
Arcand
Результат лично мне очень понравился.
Автор: Alexx S
Дата сообщения: 01.02.2007 16:13
Arcand

Цитата:
Доделал макросы для Корел и сделал твои сканы

Спасибо огромное. Результат отличный!
Давай инструкцию
Единственный вопрос - как я понимаю, некоторое заползание цветов друг на друга - это результат кодирования в дежавю?
Автор: Arcand
Дата сообщения: 01.02.2007 16:23
bolega
Alexx S
Спасибо за столь высокую оценку!
На тифах с цветами все нормально. В дежавю, думаю, этот дефект можно побороть, но ценой увеличения размера, возможно существенного. Буду соображать.
Завтра начну писать инструкцию в картинках, на выходных надеюсь выложить со всем добром .
Автор: darkseed
Дата сообщения: 01.02.2007 17:13
bolega

Bolshoe spasibo!

KO VSEM

Kto-nibud uzhe proboval SK 5.8ny na Windows Vista? Rabotaet?!
Автор: kimserge
Дата сообщения: 01.02.2007 18:03
Arcand
Я готов с удовольствием научиться с Корелом работать, если это поможет иллюстрации лучше обрабатывать.
Кладу сюда тифы после Ресторера и Сканкромсатора. К сожалению, исходные jpg выбросил из-за отсутсвия места на компе...
http://rapidshare.com/files/14412886/out.7z
Если нужны именно оригиналы, то начну новую книгу, пришлю.

Вопрос: можно ли сканировать пакетно в Кореле (без клацания по мышке для каждой страницы)? Файнридер достал, а с ирфановским пакетным макросом никак не подружусь (точнее, мой сканер).
Автор: Melirius
Дата сообщения: 01.02.2007 18:51
kimserge

Mea Culpa! Конечно же, исходником должен быть Scanned (600) или (300).
Загружу, попробую.
Автор: Dracula
Дата сообщения: 01.02.2007 19:18
Всем привет!
Обработал ScanKromsator'om книгу и в конце остались рисунки необработанные. Хочу выставить их здесь (част - 5 штук) для Вашей обработки - и потом чтобы Вы сказали как обрабатывали и выложить сюда же готовый вариант. Вот пример:
http://www.badongo.com/file/2140318

Заранее спасибо.
Автор: Melirius
Дата сообщения: 01.02.2007 19:53
Смотрите

http://rapidshare.com/files/14427422/0001a.djvu.html

288Кб

Добавлено:
Только Background Subsample=1, Treshold Level=12 и Text Quality=Medium - эта картинка получена так (из Scanned 300 опции - как в посте выше, кроме упомянутых здесь).

Добавлено:
Dracula

Попробуйте мой профиль - размеры рисунков колеблются от 48 до 72 Кб, всего - 280 Кб на все.
Автор: KlausPeter
Дата сообщения: 02.02.2007 02:14
kimserge
Извините, чем вас не устраивает Файнреадер? Из вашего файла 0050.TIF я, например, получил в Word-е страницу в прибл. 57 кб. Качество ваших сканов отличное.

Dracula
На ваших сканов (0043 - 0095) просвечивается обратная сторона. Положите на нее лист черной бумаги в процессе сканирования. Вы таким образом можете повысить контраст при обработке.
Автор: kimserge
Дата сообщения: 02.02.2007 02:31
KlausPeter
Файнридер сойдет, когда нет ограничений на размер сканов. Но делая все на ноутбуке в 40 гб памяти, я раздражаюсь, когда из файнридеровского пакета надо сначала сохранить в серые jpg (попортив, как я понимаю, серые сканы - ибо все говорят, да и видно глазами, что лучше тифы LZW), а потом уже кромсать и т.д.
Из мелких глюков файнридера - насильная выправка страниц. Это иногда убивает при распознавании (но об этом не здесь..)
Найти бы какой-нибудь простейший пакетный сканировальщик, но пока мои поиски были тщетны...

bolega
Прошу вновь о помощи. Отсканил в сером книгу, сильно намазанную красным маркером. Пока остановился на HighLight, но все равно некоторые буквы закрываются. Что делать? Если бы в цветном сканировал, было бы лучше?
Вот тут две странички http://rapidshare.com/files/14478212/out_2.rar
Gratias ago!

Melirius
Да, это почти то, что нужно. Огромное спасибо. Но все равно великовато, признаться. Для отдельных страниц подойдет, без сомнения, но если в книге почти на каждой странице картинка, то размер выйдет ужасающий. Целую ночь вчера сжималось по Вашей методе 276 страниц с картинками - 113 мб... Это очень много, согласитесь.
Что же делать? Придется, все же, ухудшить качество до 300 дпи, резолюцию не поднимать, картинка размоется, из 2 мб получится 100 кб... Может еще есть варианты?
Автор: ugk_4088
Дата сообщения: 02.02.2007 05:31
Хотел ознокомится с новой версией ScanKromsator Ver 5.81 NY на сайте bolega- а она запоролена. Доступ к ней ограничен?
Автор: bolega
Дата сообщения: 02.02.2007 07:51
ugk_4088
Пароль кажется на 65-й странице данного топика

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.