Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: ghosty
Дата сообщения: 22.08.2007 18:47
Alexx S

Цитата:
Именно с Оптибуком возможны проблемы с ОСR?
Нет, для ОСR практически нет разницы. Можно использовать обычные сканеры, можно ОтикБук, можно "фотосканеры". Последние, к примеру, не очень хорошо подходят для создания графических книг, ИМХО.

АОТ: Все-таки Arcand&manfred дело говорят по поводу раздельного кодирования. Это большой шаг вперед. Было бы хорошо, если бы Кромсатор поддерживал такой режим. Потом, может быть, решится вопрос с автоматическим определением координат картинок и технологический цикл будет замкнут
Автор: kontiky
Дата сообщения: 22.08.2007 19:59
ghosty

Цитата:
Если так, то что Вам не нравится?

Не нравится, что идет дубляж опций.

Цитата:
1) ОптикБук сканирует существенно быстрее обычных сканеров, поэтому время сканирования не намного отличается.

А в два раза больше перекладывать книгу/переворачивать страницы? С этим как?

Цитата:
К примеру, я раньше много времени тратил на исправление геометрических искажений

Вот это да. Это для меня еще не решенная проблема Как вы убираете такие искажения? Я пробовал BookReader, но что-то он вообще не убирает искажения cтрок на границе разворота
Автор: Alexx S
Дата сообщения: 22.08.2007 20:06
kontiky

Цитата:
Не нравится, что идет дубляж опций.

Очень аргументированно.... Мне вот не нравится синие резаки, хочу зеленые...

ghosty прав, похоже что вы не до конца разобрались с Кромсатором. Ничем это "дублирование" помешать не може в принципе, сделайте вид что его просто нет...
Автор: kontiky
Дата сообщения: 22.08.2007 20:17
Alexx S

Цитата:
Очень аргументированно.... Мне вот не нравится синие резаки, хочу зеленые...

Ну почему тогда нет опций для двух разворотов, для трех, для всей книги сразу? Понятно, что этот дубляж сложился исторически и, судя по всему так и останется, но говорить что это ах как кул! - немного странно.

Цитата:
похоже что вы не до конца разобрались с Кромсатором.

Что касается этих опций - разобрался.

Цитата:
Ничем это "дублирование" помешать не може в принципе

Может. Пример. Есть плохо отсканеный разворот. Одна страница сильно перекошена, на другой есть большие черные мусорные поля. Когда идет работа разворотами, драфт кромсатор, работающий с горизонтальными и вертикальными (общими для обоих разворотов) резаками, стараясь захватить целиком перекошенную страницу запустит на неперекошенную грязь черных полей. Дальше это пойдет в обработку. При раздельной обработке страниц этого бы не произошло. Предвижу замечание по поводу косых резаков, которыми можно "оставить за кардом" мусор - перекос резаков нужно делать руками, со всеми вытекающими...

Цитата:
сделайте вид что его просто нет...

Собственно чем я сейчас и занимаюсь.

Автор: ghosty
Дата сообщения: 22.08.2007 20:54

Цитата:
Не нравится, что идет дубляж опций.
Каких именно опций, я так и не понял, к сожалению. Вы что предлагаете конкретно?

Цитата:
При раздельной обработке страниц этого бы не произошло.
При раздельной обработке, Вы говорите. Это значит, что развороты были разделены до обработки Кромсатором. Т.е. они были разделены с помощью какой-то другой программы, так, что ли? Ведь критика состоит в том, что Кромсатор с такими случаями справляется плохо. Назовите программу, которая правильно разделит разворот, о котором Вы говорите - косой и с мусором на полях.

kontiky

Цитата:
А в два раза больше перекладывать книгу/переворачивать страницы? С этим как?
Не поверите, но просто великолепно. Для меня самым противным в деле сканирования была необходимость постоянно с силой прижимать книгу к стеклу. Это меня просто выводило из себя. Часто приходилось пересканировать, увеличивая степень нажима. Просто издевательство! С другой стороны, люди часто сканируют библиотечные книги разворотами. Им и невдомек, что потом сотрудникам библиотеки эти книги приходится вновь переплетать - за мизерную зарплату и т.д.


Цитата:
Вот это да. Это для меня еще не решенная проблема Как вы убираете такие искажения?
Речь шла о BookRestorer. Взять можно на странице Monday2000, но хелп с этой же страницы читать с осторожностью...
Автор: kontiky
Дата сообщения: 22.08.2007 21:07
ghosty

Цитата:
Каких именно опций, я так и не понял, к сожалению.

Вы что - серьезно не понимаете? Откройте sk. Таба Pages. Вот тут полно таких пар: Art L-R (для левой и правой страницы); Page h.align - два комбобокса (для левой и правой страницы) и так далее. Так понятнее?

Цитата:
Вы что предлагаете конкретно?

Предлагать что-либо тут смысла особого нет, судя по скорости выхода новых версий sk и объему необходимых переработок программы. Но(!) я бы предпочел, что бы технологически в sk сначала резались страницы, а уже потом шла их обработка. Посмотрите на тот же FR - они делают именно так: сначала разрезка, потом OCR.

Цитата:
Это значит, что развороты были разделены до обработки Кромсатором.

Идеально, что бы это было в самом sk.

Цитата:
Назовите программу, которая правильно разделит разворот, о котором Вы говорите - косой и с мусором на полях.

FineReader, например. Но с FR в этом смысле другие заморочки. Сейчас я наловчился разрезать страницы в sk вручную, но потом приходиться пробегаться по всей книге и контролировать результат. Тут нужна автоматизация (и довольно несложная).

Цитата:
Им и невдомек, что потом сотрудникам библиотеки эти книги приходится вновь переплетать - за мизерную зарплату и т.д.

У меня другая проблема: есть возможность брать книги в магазине перед продажей, но при скане разворотами с нажимом они теряют товарный вид

Цитата:
Речь шла о BookRestorer.

BR я уже пробовал. Результаты неудовлетворительные

Автор: Alexx S
Дата сообщения: 22.08.2007 22:10
kontiky
Честно говоря, я Вас не понимаю, совершенно....


Цитата:
Вы что - серьезно не понимаете? Откройте sk. Таба Pages. Вот тут полно таких пар: Art L-R (для левой и правой страницы); Page h.align - два комбобокса (для левой и правой страницы) и так далее. Так понятнее?


Цитата:
они делают именно так: сначала разрезка, потом OCR.


ЧТО может помешать оставить на вкладке Pages только Split, на вкладке Боокс нулевые поля, а выходное ДПИ и Цветность - оригинал? Будет только разрезка и ничего больше
Автор: kontiky
Дата сообщения: 22.08.2007 22:23
Alexx S

Цитата:
ЧТО может помешать оставить на вкладке Pages только Split, на вкладке Боокс нулевые поля, а выходное ДПИ и Цветность - оригинал? Будет только разрезка и ничего больше

Будет не только разрезка, а будет еще анализ страниц во внутренних зонах синих резаков. А мне нужна только автоматическая разрезка.

Цитата:
Честно говоря, я Вас не понимаю, совершенно...

Ну и бог с ним. Давайте этот флейм прекращать.
Автор: Alexx S
Дата сообщения: 22.08.2007 22:28
kontiky
По всей видимости, лучше действительно поискать другой софт. То какое-то "дублирование опций" не устраивает, то "анализ страниц во внутренних зонах синих резаков"...
Автор: ghosty
Дата сообщения: 22.08.2007 22:46
kontiky

Цитата:
Ну и бог с ним. Давайте этот флейм прекращать.
Не обижайтесь, в Ваших предложениях, кажется, есть рациональное зерно. Но критика была бы интереснее, если бы Вы более детально вникли в принцип работы К-ра.

Ваше предложение я разделил бы на два... предположения
1. Возможно DK выполнялось бы корректнее, если бы в ходе него определялись координаты блока текста (сейчас они определяются уже после deskew, если я не ошибаюсь). В этом случае можно было бы автоматически выставлять косые резаки. Думаю, реализация такого алгоритма связана с многими трудностями, но теоретически это, наверное, возможно.
2. Если следовать логике раздельной обработки сканов (bolega, вы знакомы с этим предложением Arcand&manfred(R)? ), то нам действительно нужен будет такой режим, при котором вначале полностью выполняетя кромсание серых сканов, а затем эти сканы после апсемплинга делятся бы на серые (с изображениями) и ЧБ (с текстом).
Предварительное кромсание без обработки можно сделать и сейчас, но если бы такой режим был принудительным, то можно было бы, наверное, воплотить некоторые хотелки, обсуждаемые ранее. Например, предложение Alexx S о возможности изменения размеров полей на этапе постобработки.

Цитата:
BR я уже пробовал. Результаты неудовлетворительные
Там не просто нужно попробовать, а сесть и разобраться - опций-то достаточно много, на самом деле.
Автор: kontiky
Дата сообщения: 22.08.2007 22:49
Alexx S

Цитата:
По всей видимости, лучше действительно поискать другой софт.

К сожалению, лучше sk пока ничего нет.

Автор: bolega
Дата сообщения: 23.08.2007 07:45
Честно говоря, я не вижу каких-то особых преимуществ при предварительной разрезке скана, кроме избавления от опций для правой половинки. Я предпочитаю, чтобы был оригинальный скан, было задание (однопроходное) по его обработке, чтобы можно было записать их на болванку и в любой момент открыть и запустить по новой.
Если кому-то предпочтительнее разрезка - а почему нет. Не вижу предмета для спора, всегда был за альтернативы.
Разрезка серых сканов имеет на мой взгляд один недостаток: убирание фона выполняется лучше в "естественном" виде, т.е. когда тень имеет синусоидальную форму, т.к. всякие резкие границы заметно ухудшают качество чистки.
Автор: Virginia
Дата сообщения: 23.08.2007 16:10
Вопрос: а есть ли такая опция как сохранение выходного файла с таким же именем как входной?
Иногда после обработки всего задания видишь, что некоторые страницы неплохо бы обработать заново. При этом если обработать только эти страницы, то нумерация выходных файлов для них начнется заново.
Автор: bolega
Дата сообщения: 23.08.2007 16:16
Virginia

Цитата:
При этом если обработать только эти страницы, то нумерация выходных файлов для них начнется заново.

Нет, физическая нумерация файлов остается прежней!!
Просто порядковая нумерация в окне просмотра результата (никак не влияющая на именование реальных выходных файлов) может действительно начаться с единицы. Чтобы этого не было, добавьте в sk.ini-файл в секцию [options] такую строку:
ViewFromFirst=1
Автор: Judge_AK
Дата сообщения: 23.08.2007 18:02
bolega

Цитата:
Чтобы этого не было, добавьте в sk.ini-файл в секцию [options] такую строку:

Если "перекромсывать" несколько файлов одновременно, то не помогает.
Автор: bolega
Дата сообщения: 23.08.2007 18:25
Judge_AK

Цитата:
Если "перекромсывать" несколько файлов одновременно, то не помогает

Именно! И не должно помогать!
Представьте, что выделили 10,43,56,187,345 файлы. Перекромсали их, а на выходе показываются все подряд. Вас же интересуют именно эти файлы. Значит, нужно заранее записать на бумажке номера перекромсанных и в окне просмотра выбирать эти номера из списка. Согласитесь, это ни в какие ворота не лезет. А когда они подряд показываются (ведь именно они Вам в данный момент нужны для проверки), это очень удобно. Ну а если уж хочется все-таки мазохизмом позаниматься то можно закрыть окно просмотра результатов и снова его открыть. И еще раз повторю, вся эта нумерация никакого влияния на реальные имена перекромсанных файлов не имеет, они какими были, такими и остануться, какую бы группу не перекромсали.
Автор: Judge_AK
Дата сообщения: 23.08.2007 21:11
bolega

Цитата:
И еще раз повторю, вся эта нумерация никакого влияния на реальные имена перекромсанных файлов не имеет, они какими были, такими и остануться, какую бы группу не перекромсали.

Да, это я заметил. И смотрю номера файлов в "инф. строке"
Я, например, первые разы переделывал 2-3 выделенных файла подряд, когда доходил до последнего из заново покромсанных, только после второй попытки перехода на след. страницу понимал, что нужно "мазохизмом позаниматься". Сейчас уже "мозг" срабатывает нормально.

Да и ещё из наблюдений. Вроде бы не видел, чтобы об этом сообщали.
При чистке страницы использую двойное нажатие для переключения между Autoclear и Autodespeckle в некоторых случаях после перехода с clear на despeckle и выделение мусора вблизи букв (с их задеванием) убирается и часть буквы. Причем, как правило, эти части одни из "палочек" букв "и", "н", "к". Пока не нашёл закономерности, почему так происходит, но как ни странно - разрывов у букв нет.
Автор: VictorAsp
Дата сообщения: 25.08.2007 21:35
Тормозной вопрос: в постобработке косячные страницы можно их так выделить чтобы исходные файлы оказались selected? о то я как раз и
Цитата:
записать на бумажке номера перекромсанных

Автор: bolega
Дата сообщения: 25.08.2007 21:49
VictorAsp
Можно. F2.
Если режим двух панелей, то F2 - для левой, F3 - для правой.
В принципе, эти горячие клавиши можно изменить в настройках
Автор: VictorAsp
Дата сообщения: 26.08.2007 19:10
bolega спасибо, бум знать!
ALL а hotkey list кто-нибудь составлял?
Автор: bolega
Дата сообщения: 26.08.2007 21:55
VictorAsp

Цитата:
а hotkey list кто-нибудь составлял?

А зачем? Зайдите в опции и там увидите весь список.

==========
Не помню, говорил или нет, но я переписал resample и рендеринг на ассемблере. Скорость обработки... сами в новой версии увидите. Я теперь предпочитаю bicubic, т.к. он выполняется теперь почти мгновенно, впрочем, Lancoz такой же стал.
Надеюсь, ни у кого уже нет компов без поддержки MMX.
Автор: Alexx S
Дата сообщения: 26.08.2007 22:35
bolega

Цитата:
Не помню, говорил или нет

Все дразнитесь, да? Хочется-то как....

Кстати, возвращаюсь к вопросу о Denoise- какие-нибудь подвижки есть? И правильно ли я понимаю, что эти и есть адаптивное размытие? После того, как сделал пару книг в Кореле по методикам Arcand, не могу без него обходиться - буквы получаются гораздо более гладкие...
Автор: ghosty
Дата сообщения: 26.08.2007 22:54
bolega

Цитата:
Не помню, говорил или нет, но я переписал resample и рендеринг на ассемблере.
Вы все-таки сделали это!
Низкий поклон Вам от меня! Это, наверное, самая лучшая новость о СК за всю историю топика...
Автор: Olive77
Дата сообщения: 27.08.2007 14:42
All
в продолжении темы по удалению подчеркиваний в
книгах

попалась тут книга, страшно поюзанная, но чрезвычайно нужная

чем в ней только ни писали.
И маркерами, и ручками, и карандашами

Все, что цветное, можно по изложенной выше методике удалить,
а вот как бороться с карандашом? (пока не пробовал, сама мысль пугает)
Можно ли в СК выбором порогового значения как-то уменьшить объем ручной работы? (некоторые страницы содержат серые рисунки)
Автор: ghosty
Дата сообщения: 28.08.2007 00:55
"Новогодний" СК стабильно зависает при выполнении такого задания (одна страничка для примера приложена):
http://rapidshare.com/files/51710003/Plato_Myth2.rar.html
Выручайте!
Автор: foo
Дата сообщения: 28.08.2007 01:31
bolega

Цитата:
Не помню, говорил или нет, но я переписал resample и рендеринг на ассемблере.

Эх, зря вы время тратите.
Нужно все критические ко времени функции (счет) вытаскивать в отдельную дллину и компилить ее хорошим компилятором (intel). Лучше оптимизировать сишный код. Должно быть быстрее и быстрее , чем ручками да по ассму .
Автор: bolega
Дата сообщения: 28.08.2007 07:28
foo

Цитата:
Эх, зря вы время тратите

Пятый год зря свое время трачу
Ни один компилятор не переведет сам код расчета сплайна в MMX-код. А без параллелизма даже самый расчудесный компилятор не сделает код обработки огромного массива данных настолько быстрее, чтобы это перестало раздражать (напр., для 600dpi одна страница 24bit занимает 40-60 млн байт, да учесть, что на каждый пиксел нужно произвести интерполяцию с окном размеров 4х4)
Автор: bolega
Дата сообщения: 28.08.2007 13:08
ghosty
А Вы случайно пользуетесь не русифицированной ли версией, в которой помимо полезного действия (русификация) зачем-то раздизейблили то, чего ни в коем случае делать не надо было. Потому что очень на то похоже.
В любом текстовом редакторе откройте свой spt-файл и замените везде 2088963183 на 0. 2088963183 - именно столько раз sk выполняет фильтрацию, которая в официальной версии давно визуально отключена, но в коде ее обработка сохранилась.
Автор: ghosty
Дата сообщения: 28.08.2007 13:27
bolega

Цитата:
А Вы случайно пользуетесь не русифицированной ли версией
Обижаете Конечно, официальной английской. Просто подумал, что это поможет отловить возможные ошибки.
Автор: bolega
Дата сообщения: 28.08.2007 14:01
ghosty

Цитата:
Обижаете

Извините. Тогда похоже на то, что я где-то не вычистил упоминание этого мертвого фильтра.
Спасибо!

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.