Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: Arcand
Дата сообщения: 26.01.2008 07:15
Gajver100
Цитата:
Где именно делать эту команду?
Это устаревшая инфа. Поищите в этом топике пост Alexx S, где сказано, как делать разделенные сканы в новом СканКромсаторе.
Цитата:
1. В каком режиме кодируется фон? (Scaned, Photo)
Маска и фон кодируются соответствущим образом - JB2 Format и IW44 wavelet.
Цитата:
2. После кодирования извлек страницу в WinDjView-0.4.3 и страница извеклась полностью,
В DjvuOCR можно извлечь отдельно маску и фон. В плагине можно посмотреть, что находится в маске, что в фоне.

StudentFS
Цитата:
Вобщем из ответа я понял, что либо рисунок на странице не получица, либо текст будет хреновеньким.
Вы не совсем поняли меня. Не могу сказать, что Safe портит текст. Мне показалось, что он слегка зацепляет тонкие бледные перемычки в буквах. Лучше посмотрите все сами.
Автор: ghosty
Дата сообщения: 26.01.2008 08:18
Arcand
Нет, Safe не должен, по идее, портить бледные перемычки. Просто он, наряду со Smart (по-моему), слишком подвержен краевому эффекту. Т.е. если задевает, то скраю блока текста.

Цитата:
Проблема с тем сканом была в том, что были явно обрезаны света - отсюда и снижение качества на выходе.
А в то, что там оригинал совсем никакой был, Вы вообще не готовы верить? Если есть вероятность, что 100% JPEG все же дает артефакты, то лучше его и не использовать, а если использовать, то с осторожностью, правильно?
Автор: Alexx S
Дата сообщения: 26.01.2008 08:39
StudentFS

Цитата:
Имеется в виду что когда есть рисунок с жирной черной кляксой, кромсатор прочищает кляксу белыми квадратиками не понимая, что это артвёрк какогото неизвестного художника.


Я в таких случаях заключаю рисунок в Exclude - зону. Она как раз и нужна для того, чтобы зацитить то, что в ней находится от всяких чисток.
Автор: bolega
Дата сообщения: 26.01.2008 10:27
StudentFS

Цитата:
Вобщем из ответа я понял, что либо рисунок на странице не получица, либо текст будет хреновеньким.

Если у Вас нет сильного фона и теней, то не нужно вообще использовать чистку фона и коррекцию освещенности, их отсутствие никак не скажется на качестве текста.
А рисунки (если они не микроскопические) нужно делать через picture-зоны, а не через dither. Если же все таки делать чистку, то dither зоны можно окружить exclude зоной. Чтобы это сделать есть даже 2 способа. Либо в контекстном меню зоны выбрать спец. команду, по кот. по периметру выбранной зоны сама нарисуется exclude зона, либо просто щелкнуть по кнопке exclude зоны, держа нажатым Ctrl
Автор: monday2000
Дата сообщения: 26.01.2008 12:13
bolega

Цитата:
Учитывая ваше отношение к СК, подозреваю, что это именно вы удалили ссылку на пособие.

О нет, это не я. Я до подлой низости не опускаюсь - это удел kvk, albel и им подобных. Неизвестно, кстати, как вообще эти довольно случайные и совершенно безответственные люди по непонятно каким признакам пролезли в модераторы. Но это уже не важно.

Поскольку в шапке написано:

Цитата:
Исправлено: VadimirTT, 22:47 11-01-2008
то мне ничего не остаётся, кроме как считать, что это дело рук VadimirTT. Если это не так - то VadimirTT просто не повезло.

Цитата:
Учитывая ваше отношение к СК

Я предлагаю Вам следующее: открыть исходники СК и сделать хелп. Причём чем раньше, тем лучше. Иначе всё будет так, как я пообещал (хотя оно всё равно так будет, просто так СК будет легче "падать"). Ошибочно думать, что раз я не сделал альтернативы СК ранее, то это якобы означает, что я вообще не могу её сделать - просто были более неотложные дела - а именно выгребание дерьма из рубордовского скан-топика и придание ему более-менее пристойного вида. Что я полностью и успел сделать, кстати - рубордовский скан-топик выпотрошен мною до дна, все ключевые вопросы оттуда перекочевали на мой сайт - и теперь скан-топик можно хоть закрывать за ненужностью.

Разумеется, я не стану (в ответ на враждебные действия в мой адрес) удалять со своего сайта всё относящееся к СканКромсатору. Такие дешёвые приёмчики мне не к лицу - я же не VadimirTT и не ghosty.

Но я запомню каждого, кто предпринял враждебные действия в мой адрес - и при удобном случае припомню это. Мосты сожжены. Глупо было будить во мне зверя - введением запрета на пост в скан-топике - это лишь ускорит конец "привычного мира технологий DjVu-книгосканирования". Я его теперь буквально разорву на куски - и это реально. Это и будет моим ответом на "запрет на пост" в скан-топике - скан-топик на руборде теперь полностью потеряет хоть какое-то значение и смысл, останется лишь ареной пустой и ничего не дающей болтологии в духе ghosty.

А с "политической" смертью СканКромсатора большинство присутствующих превратятся в пустое место, в ноль без палочки - ибо что они есть без СканКромсатора? Это и есть истинная причина того, почему мне сделали "запрет на пост" в скан-топике - страх модераторов kvk и albel, а в ещё большей мере рядовых рубордовцев, потерять своё влияние и значимость. Но им всем это уже не поможет.

Отныне СканКромсатор (даже помимо Вашего, bolega, желания) превратился в монстра, в чудовище - которое "подпитывает" своим существованием весь этот гнидник на Руборде - и всё это исключительно из-за Вашей, bolega, личной безответственности.
И я теперь просто не могу не уничтожить СК (в "политическом" смысле) по этой причине. Не говоря уже о том, что дальнейший прогресс просто немыслим без создания альтернативы СК.
Автор: Alexx S
Дата сообщения: 26.01.2008 12:56
monday2000

Интресно, а Вы сами-то осознаете, что потеряли связь с действительностью? Такие эмоции, такие заявления - со стороны это выглядит крайне странно.
Автор: Warden
Дата сообщения: 26.01.2008 13:09
Такие эмоции, такие заявления - да тут такие страсти кипят, кто бы мог подумать. Понедельник пишы ище !
Автор: Smokeer
Дата сообщения: 26.01.2008 13:16

Цитата:
Я предлагаю Вам следующее: открыть исходники СК и сделать хелп. Причём чем раньше, тем лучше. Иначе всё будет так, как я пообещал (хотя оно всё равно так будет, просто так СК будет легче "падать"). Ошибочно думать, что раз я не сделал альтернативы СК ранее, то это якобы означает, что я вообще не могу её сделать - просто были более неотложные дела - а именно выгребание дерьма из рубордовского скан-топика и придание ему более-менее пристойного вида. Что я полностью и успел сделать, кстати - рубордовский скан-топик выпотрошен мною до дна, все ключевые вопросы оттуда перекочевали на мой сайт - и теперь скан-топик можно хоть закрывать за ненужностью.


Вот и чудненько, теперь вы напишете нам альтернативу СК, а Болега наконец перестанет делать этот идеологически вредный продукт которому всеравно дни сочтены.
Кстати, откройте, пожалуйста на своём сайте форум ибо когда падёт РуБорд с её деструкторами-модераторами негде будет и спросить-то.

Кстати, неплохо бы чтоб вы написали несколько статей о политике книгосканирования. И его перспективах.
Автор: VadimirTT
Дата сообщения: 26.01.2008 13:33
Я никаких обвинений в свой адрес не отметаю, нехай висят, но я, как мне помнится, добавил ссылку на последнюю версию 1.07 методички.
Автор: Arcand
Дата сообщения: 26.01.2008 14:15
ghosty
Цитата:
А в то, что там оригинал совсем никакой был, Вы вообще не готовы верить?
Так сравнивались два скана одной страницы! При сканировании в одном случае была применена тоновая коррекция, во втором сканировалось в RAW.

Цитата:
Если есть вероятность, что 100% JPEG все же дает артефакты, то лучше его и не использовать, а если использовать, то с осторожностью, правильно?
Так я и говорю, смотрите и решайте сами. Отсканировал достаточное число книг в jpg 100%, среди них были и цветные. Проблем не заметил. Только с цветными есть проблема - грязнятся цвета, что затрудняет обработку (выделение цветов).
Автор: Torino
Дата сообщения: 26.01.2008 14:30
Пока тут люди с большим количеством сообщений рвут друга на части хочу спросить: где же мне достать "Пособие по Кромсатору", которое в шапке удалено, как реклама?

Кстати спасибо Bolega за программу, экономящую массу времени и избавляющую от тупой работы.
Автор: ghosty
Дата сообщения: 26.01.2008 14:35
Torino
Ничего там не удалено, не ропщите (см. подробности)
Просто вначале лучше прочитайте Scan&Share.

Arcand
В чем-то Вы меня убедили, в чем-то, возможно, я Вас. Просто говорим о не совсем очевидных вещах, ИМХО. В том случае, к примеру, я получал в СК результат, очень близкий Вашему.
Очевидно, что нужно быть очень осторожным с настройками при сканировании. Возможно, это был тот самый случай. Но дело еще и в том, что главная задача создания каскада алгоритмов обработки - подобрать некую "золотую середину", подходящую для всех страниц книги. Чтобы уменьшить объем ручной обработки после окончания автоматической...
И если даже мы с Вами получили один и тот же (или наоборот разный) результат в случае одной страницы, не факт, что это будет верно для всей книги. RasterID меня, повторяю, в конечном счете разочаровал, хотя возился с ним много. Надеюсь получить более интересные результаты, пользуясь Корелом, но пока не было таких сложных сканов, чтобы пришлось обращаться к таким продвинутым инструментам.
Автор: Torino
Дата сообщения: 26.01.2008 14:53

Цитата:
Ничего там не удалено, не ропщите (см. подробности)
Просто вначале лучше прочитайте Scan&Share.


Спасибо, читаю ))

Добавлено:
Там описаны общие вещи и первые шаги.
Хотелось бы чего-нибудь более подробного.
Автор: ghosty
Дата сообщения: 26.01.2008 15:16
Torino

Цитата:
Там описаны общие вещи и первые шаги.
Хотелось бы чего-нибудь более подробного.
Вот именно этот первый шаг и нужно сделать. А дальше поможем.
Можно отсутствие подробной инструкции восполнить наличием живых людей, всегда готовых помочь, как Вы считаете?
Автор: Torino
Дата сообщения: 26.01.2008 15:35
Если всегда готовых помочь - то можно ))

Пока вопрос такой - как влияет расположение синих резаков на Process.
Одну страничку я обработал с разным их положением - в обоих случаях рез осуществлялся одинаково. И в обоих случаях была отрезана часть полезного текста (даже по бокам, где не было одиночного текста).
Поля я специально выставил в ноль.
Т.е. вопрос по принципу работы.
Автор: ghosty
Дата сообщения: 26.01.2008 16:26

Цитата:
Одну страничку я обработал с разным их положением - в обоих случаях рез осуществлялся одинаково.
Это не удивительно - блок текста определяется автоматически, и положение резаков влияет на процесс определение опосредованно (объясню позже).

Цитата:
И в обоих случаях была отрезана часть полезного текста (даже по бокам, где не было одиночного текста).
А вот это уже удивляет. Как Вы этого добились? Покажите странички.

Цитата:
Т.е. вопрос по принципу работы.

Он таков (пока вкратце):
Резаки необходимы только для первичной очистки блока текста от всего лишнего мусора (теней, пометок, пятен и т.п.) - всего того, что могло бы помешать автоматическому определению блока текста при обработке.
1) Используете Draft Kromsate для автоматической расстановки резаков;
2) Проверяете положение резаков, если нужно корректируйте их положение, отрезая крупный мусор;
3) Выполняете дальнейшую обработку (основная часть).
Автор: Smokeer
Дата сообщения: 26.01.2008 16:36

Цитата:
Это не удивительно - блок текста определяется автоматически, и положение резаков влияет на процесс определение опосредованно (объясню позже).


Болега уже когда-то объяснял.
Поищите в версии для печати. Там всё чётко написано.


Цитата:
А вот это уже удивляет. Как Вы этого добились? Покажите странички.


настройка чуствительности в оптионсах
Автор: ghosty
Дата сообщения: 26.01.2008 16:43
Smokeer

Цитата:
настройка чуствительности в оптионсах
Это я знаю, но лезть туда очень редко приходится...
Автор: Torino
Дата сообщения: 26.01.2008 17:30
Вот исходник (5,5МБ):


Вот то, что получилось в результате обработки (2МБ):
Автор: VadimirTT
Дата сообщения: 26.01.2008 17:46
Torino
А зачем на выходе картинка в серых тонах?
Автор: Torino
Дата сообщения: 26.01.2008 17:54
Хочу потом дополнительную обработку провести в Book Restorer'e
Автор: ghosty
Дата сообщения: 26.01.2008 19:54
Torino
Сделал для Вас Sub-Task (на скорую руку, не обессудьте). Повторить продемонстрированную Вами ошибку, конечно же, не удалось. Скорее всего, все-таки резаком "полоснули" нечаянно.

http://rapidshare.com/files/86816928/test.rar.html


Цитата:
Хочу потом дополнительную обработку провести в Book Restorer'e
BR Вам в данном случае пригодится только для исправления геом. искажений. А это можно делать и в ЧБ.
Автор: Gajver100
Дата сообщения: 26.01.2008 20:11
Arcand


Цитата:
Gajver100
Цитата: Где именно делать эту команду?
Это устаревшая инфа. Поищите в этом топике пост Alexx S, где сказано, как делать разделенные сканы в новом СканКромсаторе.
Цитата:
1. В каком режиме кодируется фон? (Scaned, Photo)
Маска и фон кодируются соответствущим образом - JB2 Format и IW44 wavelet.
Цитата:
2. После кодирования извлек страницу в WinDjView-0.4.3 и страница извеклась полностью,
В DjvuOCR можно извлечь отдельно маску и фон. В плагине можно посмотреть, что находится в маске, что в фоне.

StudentFS
Цитата:
Вобщем из ответа я понял, что либо рисунок на странице не получица, либо текст будет хреновеньким.
Вы не совсем поняли меня. Не могу сказать, что Safe портит текст. Мне показалось, что он слегка зацепляет тонкие бледные перемычки в буквах. Лучше посмотрите все сами.
Автор: Torino
Дата сообщения: 26.01.2008 21:25

Цитата:
ghosty
Сделал для Вас Sub-Task (на скорую руку, не обессудьте). Повторить продемонстрированную Вами ошибку, конечно же, не удалось. Скорее всего, все-таки резаком "полоснули" нечаянно.


Спасибо за task!
Резаками точно не полосовал. Я размещал их между текстом и краями страницы.
Скорее всего действительно намудрил с "чувствительностью".
Но теперь вопрос не в этом.

Увидел, что вы выделили отдельным файлом полутоновую картинку.
Задумался "зачем"?
Я такие картинки обрамлял зоной "dither" в результате в выходном черно-белом файле более-менее точно отражались полутоновые переходы.

А у вас похоже применяется какая-то новая техника.
Сижу читаю всю ветку сначала ))
Автор: Smokeer
Дата сообщения: 27.01.2008 11:30
ghosty

Цитата:

Цитата: настройка чуствительности в оптионсах

Это я знаю, но лезть туда очень редко приходится...
Автор: StudentFS
Дата сообщения: 28.01.2008 23:57
спасибо за советы
Автор: BooBoo
Дата сообщения: 01.02.2008 13:17
ghosty

Цитата:
Кто бы мне сказал, в какой формат перегонять видео, чтобы оно у всех открывалось...

Как на счёт WMV по идее у всех откроется
и размер можно настроить
Автор: ghosty
Дата сообщения: 01.02.2008 13:26
BooBoo

Цитата:
Как на счёт WMV по идее у всех откроется
Вот к нему я и пришел. Но пока никто не сказал, открывается он или нет...
Smokeer

Цитата:
Я ёё один раз в профиле поставил
А мне значение по умолчанию лишь один раз в жизни править пришлось
Автор: BooBoo
Дата сообщения: 01.02.2008 14:40
ghosty

Цитата:
Но пока никто не сказал, открывается он или нет..

Кто он? не нашёл(
Автор: asdf128
Дата сообщения: 01.02.2008 14:47
специально для линуксяторов: под линух появилась программа gscan2pdf которая (может быть когда-нибудь ) станет такой же крутой как сканКромсатор. Сейчас она может читать со сканера (adf), чистить сканы и распознавать текст с помощью tesseract (пока английский, русский начали прикручивать люди).

Сcылки:
http://gscan2pdf.sourceforge.net/
http://code.google.com/p/tesseract-ocr/
http://groups.google.com/group/tesseract-ocr-russian/

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.