Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: monday2000
Дата сообщения: 24.09.2008 11:52
Melirius

Цитата:
Вы хоть раз в Grey enchance заглядывали?

Вообще-то заглядывал. Ну и толку-то? Хелпа ведь нет. Может СК это и умеет - но, поскольку об этом ничего не известно (по крайней мере, из ScanAndShare), то это всё равно, как если бы СК это не умел. Но, предположим, СК это умеет (хотя bolega что-то молчит). Всё равно нет исходного кода такого алгоритма - у bolega исходники закрыты.

Цитата:
Что именно из этого не умеет делать SK?

Увы, не знаю. Да и какая разница? Всё равно все ключевые алгоритмы СК прийдётся повторять - чтобы заиметь их в виде открытых исходников. Ужасно глупая (поскольку bolega не хочет раскрыть исходники), но необходимая работа.

Цитата:
Вы отделываетесь общими словами. Пока ни одного конкретного ответа.

Не хочу утонуть во флейме. Идея проста: чем заниматься малоэффективным делом, не лучше ли тратить имеющиеся силы на что-либо более эффективное? Например, написание алгоритмов в открытых исходниках.

Цитата:
Затем меня попросили "эту удобную штуку", как говориться, "опубличить". Что я и сделал не без удовольствия. Хотите - берите, хотите - нет. Я лично сам им пользуюсь, как bolega Kromsator'ом. Буду счастлив, если кто-то тоже найдёт пакет полезным.

Не так просто. Раз уж опубликовали - и именно здесь на Руборде - то тем самым вынудили дать отклик на эту работу. Мы же не воспринимаем всерьёз такие работы например: http://onby.net/2007/11/03/kak_sdelat_djvuknigu.html .
Автор: ghosty
Дата сообщения: 24.09.2008 12:07
monday2000
Топик посвящен решению конкретных проблем, связанных с использованием СК.
При постановке проблемы обязательно демонстрируешь файл, на котором они получены.
Тебе всегда помогут.

В этом случае я поверю, что ты не создаешь проблемы искусственно.

Не хочешь разбираться с алгоритмами, ставь, к примеру, мою "сборку".
Автор: bolega
Дата сообщения: 24.09.2008 12:22
monday2000
Я понял, почему Вы утверждаете, что после merge не удаляются зоны. Если делать именно sep-merge, то так и есть. И это сделано специально. При обычном merge зоны переходят на основной файл, кромсатор взводит в свойстве зоны спец. флаг, и если файлы зон удалены, то это никак не скажется на его поведении и просмотре (т.е. зоны будут видны на вых. странице). Напротив, если удалить файлы зон при SEP-merge, то в итоге они вообще пропадут, их не будет ни в основном вых. файле, ни в файле зон, и если после этого попытаться переоткрыть задание, то SK будет ругаться. Кроме того, ругань будет и при попытке вызова окна просмотра результатов, что, мол, не могу отобразить зоны. И это все логично. Удалив полностью зоны, мы тем самым разрушили задание. Вы кажется сами ратовали за сохранение заданий на случай, если в будушем придумается что-то более лучшее. Потеряв насовсем обработанные, и возможно, почищенные зоны, вы сильно усложните возможную переделку.
Впрочем, я все-таки предусмотрел их удаление (ввел дополнит. опцию в окно merge), чтобы SK не искал их потом и не ругался, он будет как и в случае обычного merge, взводить спец. флаг с свойствах зоны.

Добавлено:

Цитата:
Идея проста: чем заниматься малоэффективным делом, не лучше ли тратить имеющиеся силы на что-либо более эффективное?

Я понимаю, что Вы ратуете за открытые исходники, это Ваше право (и судя по всему, уже стало какой-то обязанностью), но Вам намекают, что несмотря на разумность этой идеи, не стоит превращать каждый топик, где Вы появляетесь, в трибуну каких-то организационно-идеологических идей. Этот топик для этого не предназначен

Добавлено:
И мне абсолютно не понятно Ваше маниакальное навязывание всем того, чего они якобы должны делать
Автор: monday2000
Дата сообщения: 24.09.2008 13:20
bolega

Цитата:
При обычном merge

А что это и зачем это? Мне пока понятен только смысл "sep-merge".

Цитата:
Впрочем, я все-таки предусмотрел их удаление

Не надо удалять, если уж не можете их класть в отдельную папку внутри out, то пусть остаются на месте (т.е. pic.XXXX.tif). А XXXX.sep.tif генерировать в СК не потребуется (если будет ini-файл с координатами зон).

Цитата:
И мне абсолютно не понятно Ваше маниакальное навязывание всем того, чего они якобы должны делать

Мы все тут как лебедь, рак и щука. Почему бы не скоординировать свои силы? Тычемся в стены как слепые кутята. И если "что делать" спорно, то "что делать не надо" очевидно.

Цитата:
Я понимаю, что Вы ратуете за открытые исходники, это Ваше право

Интересно было бы узнать истинную причину, почему Вам эта идея не нравится (в отношении СК). Только ведь не скажете же...

Melirius
Когда я составлял Пособие по Кромсатору, я не смог составить документацию по Grey enchance (bolega отмалчивался, а из QandA_SK.zip ни хрена ни ясно) - может, Вы теперь сможете? Заодно попробовать бы проделать с помощью Grey enchance то, о чём говорится в http://www.djvu-soft.narod.ru/scan/corel_scan.htm .
Автор: Melirius
Дата сообщения: 24.09.2008 13:34
monday2000

Насчёт файла помощи к Grey Enchance: используемые там фильтры достаточно стандартны, и названия имеют не взятые с потолка, а общепринятые. Если Вы не знакомы с ними, то могу посоветовать почитать любую книжку по Photoshop для начинающих.


Цитата:
Цитата:Что именно из этого не умеет делать SK?

Увы, не знаю. Да и какая разница? Всё равно все ключевые алгоритмы СК прийдётся повторять - чтобы заиметь их в виде открытых исходников. Ужасно глупая (поскольку bolega не хочет раскрыть исходники), но необходимая работа.


Ура! Вы признались, что Вы чего-то не знаете!

Повторить SK с открытыми исходниками - дело, безусловно, благородное, и я желаю Вам всяческого успеха в данном начинании. Пока что ScanTailor и в подмётки Kromsator'у не годится, но при интенсивном развитии всякое может случиться.

Однако мне как пользователю абсолютно параллельно, какие у программы исходники - лишь бы платить за её использование не надо было. Кроме того, если ScanTailor разовьётся до желательного для меня уровня, его интерфейс станет по загруженности напоминать SK, что абсолютно неизбежно. Кстати, help'а к ScanTailor я не нашёл, не подскажете, где он обретается, если вообще существует в природе.


Цитата:
Раз уж опубликовали - и именно здесь на Руборде - то тем самым вынудили дать отклик на эту работу.


Как ни странно, но в Вашем отклике я не сомневался - я его предвидел. Все конкретные замечания будут восприняты, осмыслены и по возможности реализованы, остальное - не обессудьте. Пока что я знаю лишь одного человека, который серьёзно тестирует мой пакет, сердечное ему спасибо, остальным он либо не нужен - у них собственная их устраивающая технология, либо критикуют так сказать, "философские основания" пакета, а они пересмотру, увы, не подлежат, ибо меня и того человека, который пользуется пакетом, полностью устраивают.

Автор: monday2000
Дата сообщения: 24.09.2008 13:58
Melirius

Цитата:
Пока что ScanTailor и в подмётки Kromsator'у не годится

СТ вполне может стать по крайней мере копилкой open-source алгоритмов.

Цитата:
Кстати, help'а к ScanTailor я не нашёл, не подскажете, где он обретается, если вообще существует в природе.

Не в бровь, а в глаз. Но открытые исходники перевешивают (ИМХО) этот недостаток.

Цитата:
Пока что я знаю лишь одного человека, который серьёзно тестирует мой пакет

Да он непомерно огромного размера - потому я лично даже и качать не стал. Нельзя ли радикально снизить размер?

Цитата:
Все конкретные замечания будут восприняты

Мои пожелания:
1. Описание Grey enchance.
2. Нельзя ли сделать автономное описание работы Excel/работа с оглавлением?
Автор: bolega
Дата сообщения: 24.09.2008 13:59

Цитата:
Заодно попробовать бы проделать с помощью Grey enchance то, о чём говорится в http://www.djvu-soft.narod.ru/scan/corel_scan.htm .

У меня нет интел.размытия. Если встретите готовые исходники его, дайте знать. Что-нибудь вроде adaptive или smart blur. Я знаю только blur на основе PDE, но это очень медленно. Нужно или что-то попроще, или PDE, но на asme.
Автор: monday2000
Дата сообщения: 24.09.2008 14:31
bolega

Цитата:
Я знаю только blur на основе PDE, но это очень медленно.

Давайте линк на исходники этой штуки - чтобы хоть как-то понять, что искать.

Цитата:
У меня нет интел.размытия.

Опишите, пожалуйста, по пунктам (не сейчас, но хоть на будущей неделе), что можно сделать в СК аналогично http://www.djvu-soft.narod.ru/scan/corel_scan.htm даже не имея в СК интел.размытия (мне это трудно - я не понимаю Grey Enhance).
Автор: bolega
Дата сообщения: 24.09.2008 15:06
Весьма трудно воспроизводить алгоритмы, имеющиеся напр., в corel или photoshop. За вроде бы понятными названиями может скрываться все что угодно. Либо вроде бы знакомый фильтр, но непонятно, что означают параметры. Напр., в corel фильтр maximum и minimum имеют два параметра, радиус и еще какой-то %. Что означает этот %, непонятно, в классической реализации его нет. Может это какой-то вес, а может порог (типа не изменять, если отличие больше %). Что означает радиус, тоже нельзя сказать точно. Может это просто размер окна в пикселах, а может быть это какая-то другая метрика, например, 2 соответствует 1-му пикселю, 3 - 1,5 и т.д.
Автор: Melirius
Дата сообщения: 24.09.2008 15:23
Вот что нашёл:

"Алгоритм размытия Smart Blur [в Photoshop] сначала выделяет границы изображения и разбивает изображение на области-кластеры, внутри которых происходит размытие с фиксированным радиусом, сохраняющее четкие границы между кластерами. Таким образом, для работы алгоритма Smart Blur требуется две константы – порог обнаружения границ и величина размытия. Основным недостатком такого подхода является то, что если деталь изображения недостаточно выражена, чтобы быть квалифицированной как граница, она может быть размыта Smart Blur до полной неразличимости. Понижение же порога обнаружения границ значительно увеличивает сложность алгоритма и приводит к возникновению множества мелких кластеров, что понижает эффективность размытия." (http://proceedings.usu.ru/mag/0043(05_01-2006)/a11.ps)

Ссылаются при этом на книгу

Russ J. C. The Image Processing Handbook (3rd ed.). Boca Raton: CRC Press, 1998.

Добавлено:
Похоже, однако, что всё намного проще. Вроде как Smart Blur - обычный гауссов фильтр, который обрабатывает только пиксели, отличающиеся от данного не более, чем на заданный порог.

Добавлено:
monday2000

До описания Grey Enchance руки пока не доходили, но по заявкам телезрителей сделаю. Если Вас интересует вставка оглавлений отдельно, то её можно выдрать, но придётся либо вручную открывать 2 файла в Excel: один с макросами, другой - текстовый CSV - с оглавлением, либо запускать bat-файл. Если есть желание, можно сделать, но не Вы ли ратовали за максимальное упрощение жизни юзера - ведь в пакете за это всё отвечает одна-единственная кнопка?

Добавлено:

Цитата:
Да он непомерно огромного размера - потому я лично даже и качать не стал. Нельзя ли радикально снизить размер?


Гениально! "Я Пастернака не читал, но осуждаю!" "Аффтар ЖЖот!"

А чего же ж Вы хотели - уже в архивах FineReader (35MiB)+Photoshop (55MiB без help)+Java (16MiB)= более 100 MiB! +55 MiB TotalCommander (обвешанный плагинами для просмотра практически всех мыслимых форматов, работы с буфером обмена, запорченными дисками, записи CD/DVD, просмотра сети, удаления программ, распаковки множества форматов архивов, мониторов: реестра, файлов, автозагрузки, процессов; и наконец, файлы самого пакета) +BookRestorer (10MiB) +SK (5MiB)+много чего по мелочи. Так и набежали те самые 200MiB с хвостиком.

Историческое замечание: напомнить, сколько весил DEE 5.1 в полной версии, который надо было когда-то тягать с собой для установки на новом рабочем месте? 196 MiB! И тогдашняя функциональность не шла ни в какое сравнение с нынешней.
Автор: monday2000
Дата сообщения: 24.09.2008 16:55
Melirius

Цитата:
Если есть желание, можно сделать

Да, пожалуйста. И прошу вложить в комплект макросы и пр. необходимые файлы.

Цитата:
ведь в пакете за это всё отвечает одна-единственная кнопка?

Не ставить же весь Ваш пакет, если кто-то действует по ScanAndShare.

PS Было бы время, можно было бы сделать спец. программку для этого: электронную таблицу на MFC + djvused. Но некогда. И как раз в книжке "Jeff Prosise - Programming Windows with MFC, 2nd Edition" Ч.3 Гл. 10 р. "Scroll Views" есть прямо-таки пример электронной таблицы на MFC (вот даже есть картинка). Никто не заинтересуется?

Добавлено:

Цитата:
А чего же ж Вы хотели

Повторюсь - это не идёт ни в какое сравнение с http://www.djvu-soft.narod.ru/basic.htm - там менее 30 МБ. Зачем такая "механизация" такой ценой? Качать надо лишь то, что нельзя купить на базаре дисковом. Java - в топку вообще - поставить полный Акробат (с базарного диска) - и привет. TotalCommander - ради DjVu Bar? Это можно заменить самодельной программой. Ну и т.д. и т.п. Весь крупный софт надо бы отдельно повыкладывать (Но никто не будет юзать вещи типа Neat Image и PhotoZoom - просто поленятся). CPCTool давно ушёл в историю.
Автор: DmitryKz
Дата сообщения: 24.09.2008 17:07
monday2000
Честно говоря, я не думаю, что исходники (СК или чего бы то ни было другого) Вам действительно нужны. Судя по всему, получив их, Вы сразу скажете остальным приниматься за дело (ну типа, вот они, чего же еще вам нужно), а сами вернетесь к своей "грязной" работе. Кстати, было бы интересно узнать, что она из себя представляет?

Добавлено:

Цитата:
Гениально! "Я Пастернака не читал, но осуждаю!" "Аффтар ЖЖот!"

Да, действительно. Кажется, я начинаю понимать, в чем заключается "грязная" работа monday2000
Автор: Dimock
Дата сообщения: 24.09.2008 22:00
СКАНИРОВАНИЕ, РАСПОЗНАВАНИЕ, РЕДАКТИРОВАНИЕ ТЕКСТОВ И ГРАФИКИ
На сайте есть популярное руководство по сканированию, материалы по работе с графикой. Надо добавить в "шапку".
Автор: Melirius
Дата сообщения: 24.09.2008 22:55
monday2000


Цитата:
Повторюсь - это не идёт ни в какое сравнение с http://www.djvu-soft.narod.ru/basic.htm - там менее 30 МБ. Зачем такая "механизация" такой ценой? Качать надо лишь то, что нельзя купить на базаре дисковом. Java - в топку вообще - поставить полный Акробат (с базарного диска) - и привет. TotalCommander - ради DjVu Bar? Это можно заменить самодельной программой. Ну и т.д. и т.п. Весь крупный софт надо бы отдельно повыкладывать (Но никто не будет юзать вещи типа Neat Image и PhotoZoom - просто поленятся). CPCTool давно ушёл в историю.


Могу сказать Вам по секрету, что именно я был автором того самого CPCtion.

Java, заменяемая Acrobat'ом - это что-то новенькое, не иначе последнее веяние так любимого Вами open-source .

Ага, значит, пользователь системы должен искать либо качать FineReader 8.0 - 35MiB, затем Photoshop CS3, ну дадим послабление - CS - всего-то 200MiB, потом искать на купленных дисках Java - те же 16MiB, затем шукать на просторах интернета и качать из нескольких различных точек: SK, DjVu Editor 6, Foxit Reader, Ваш DjVu small, DjvuOCR (FRFGrab), PDF2Djvu, инструменты для работы с PDF, которые уже пропали с того сайта, где я их брал, djvu_layers_remove и ещё кое-что по мелочи, а затем ставить всё это в заданные папки (и никуда иначе - система работать не будет!). Этим будет заниматься Ваш горячо любимый юзер? Он на это забьёт и забудет о попытке поставить пакет как о страшном сне.

Или мне, как герою Гераклу, предлагается написать простенькую - "этак на тысчонку-другую строк, не больше" - программку, которая будет делать это всё сама? Особенно хорошо будут выглядеть для пользователя обведённые специальной траурной рамочкой из скрещённых черепов и бедренных костей сообщения об отсутствующих по заданным местам в Интернете файлах.

Нет уж! "Всё своё ношу с собой!" И никак иначе.

Добавлено:
Dimock

Это не по профилю данного топика, скорее в "Электронные книги: сканирование, обработка, сборка" нужно.
Автор: monday2000
Дата сообщения: 25.09.2008 08:29
Melirius
Зачем у Вас там вообще работа с PDF? Непонятно. Мы же все работаем с DjVu. См. http://www.djvu-soft.narod.ru/scan/bookscan_pdf.htm .
Весь действительно нужный софт можно скачать с моего сайта - т.к. он малоразмерен.

Цитата:
Этим будет заниматься Ваш горячо любимый юзер? Он на это забьёт и забудет о попытке поставить пакет как о страшном сне.

1. Прочитать ScanAndShare.
2. Зайти сюда http://www.djvu-soft.narod.ru/basic.htm и всё скачать (кстати, там слегка успело устареть - надо подправить чуть.).
3. Раздобыть (на дисках) какой-нибудь Фотошоп и FineReader 8 (согласитесь, более чем реально).
4. Всё - и никакого больше головняка.

DmitryKz

Цитата:
Кстати, было бы интересно узнать, что она из себя представляет?

Очень просто: то, что всем очень нужно, а никто не хочет делать.

Цитата:
Честно говоря, я не думаю, что исходники (СК или чего бы то ни было другого) Вам действительно нужны.

Я вижу задачу так:
1. Создание документированного open-source графического движка (с демкой в виде вьювера).
2. Создание библиотеки консольных алгоритмов сканобработки (к движку).
Эти 2 вещи послужат конструкционными элементами для всех желающих - т.е. любой сможет на их базе сделать любую программу.
Кто и когда это будет делать - пока неясно. Но хотя бы цель уже сформулирована.
Автор: Melirius
Дата сообщения: 25.09.2008 11:14
monday2000


Цитата:
Зачем у Вас там вообще работа с PDF? Непонятно. Мы же все работаем с DjVu.


А Вы знаете, что большинство научных журналов почему-то дают статьи не в DjVu, а в PDF? И что многие безграмотные сканировщики на Западе, преисполненные наилучших намерений, в него же и сканируют? И что векторный PDF, переведённый в DjVu, временами сдувается в объёме до 10 раз?

После этого у Вас поднимается язык убеждать кого-то, что инструменты для работы с PDF не нужны? Впрочем, можете не отвечать, мне Вас не переубедить - это уже доказано, причём не только моим опытом.
Автор: monday2000
Дата сообщения: 25.09.2008 11:58
Melirius

Цитата:
После этого у Вас поднимается язык убеждать кого-то, что инструменты для работы с PDF не нужны?

Во-первых не у меня, а это коллективное мнение, во-вторых - инструменты нужны, но делать в PDF не стОит. Обо всём этом расписано тут: http://www.djvu-soft.narod.ru/scan/bookscan_pdf.htm .
Автор: Melirius
Дата сообщения: 25.09.2008 12:43
monday2000

Ауу, Вы меня слышите? Я не предлагаю делать в PDF, я предлагаю делать из PDF'ов. Замечаете разницу?

А насчёт логики у Вас как? Вы видите, что Ваше
Цитата:
Во-первых
противоречит
Цитата:
во-вторых
, а?

Автор: monday2000
Дата сообщения: 25.09.2008 14:11
Melirius

Цитата:
Я не предлагаю делать в PDF, я предлагаю делать из PDF'ов.

Поскольку PDF не относится напрямую к стандартному процессу DjVu-книгосоздания, то это разумно выделить в некий отдельный комплект (борьба с вредным универсализмом).
Автор: Torino
Дата сообщения: 25.09.2008 14:47
Melirius
bolega

Предвидя вашу реакцию на последние обсуждения, хочу попросить вас не исчезать из этого топика.
Ваши наработки, знания и помощь большинству здесь присутствующих действительно нужна.
Автор: bolega
Дата сообщения: 25.09.2008 15:45
Torino
То была шутка-призыв к благоразумию. Шутка, потому что со стороны наблюдать, как кто-то пытается что-то доказать каменному памятнику, очень забавно
Автор: Melirius
Дата сообщения: 25.09.2008 21:15
monday2000


Цитата:
борьба с вредным универсализмом


Вы круты! Я прозрел! Пошёл срочно выбрасывать Windows как старшно универсальную операционную систему. Шутка сказать, в ней работают и базы данных, и офисные приложения, и просто среды разработки. То ли дело милая сердцу каждого настоящего юзера система Gentoo Linux, в которой можно вручную выбрать нужные компоненты ядра, скомпилировать сугубо под свой тип процессора только нужные тебе части ОС и программы, а затем свысока ронять непосвящённым: "Вы же знаете, GUI - это такая дыра в защите системы, так что я работаю исключительно под командной строкой с низкоуровневым доступом к вычислительным ресурсам видеокарты GeForce 9800 X2..."

Обработка PDF не выделена в отдельный комплект, ибо она занимает менее 15MiB в архиве, "снявши голову - по волосам не плачут".

Добавлено:
Torino

Да, monday2000 у нас - известный "отец русской демократии и особа, приближённая к императору", а также "глас всего книгосканировочного сообщества". К его критике я отношусь как к неизбежному злу ("у природы нет плохой погоды") и пытаюсь найти в ней рациональные зёрна, пока, правда, безуспешно.
Автор: monday2000
Дата сообщения: 26.09.2008 08:45
Melirius
1. Не надо навешивать ярлыки.
2. Хотите тратить усилия впустую - никто Вам этого не запрещает.

Добавлено:
bolega

Цитата:
наблюдать, как кто-то пытается что-то доказать каменному памятнику

Зато на этом примере другие поймут, что к чему - так что польза есть.
Автор: Melirius
Дата сообщения: 27.09.2008 10:58
monday2000

Извините, очевидно, "работа на унитаз" (плюс безапелляционный тон) представляет собой никак не "ярлык", а "истину в последней инстанции", или по крайней мере, "объективное и конструктивное мнение, основанное на личном опыте использования пакета".
Автор: monday2000
Дата сообщения: 30.09.2008 12:02
Новая порция из последнего хелпа:

http://www.djvu-soft.narod.ru/kromsator/sk_5_91_melirius.htm
Автор: monday2000
Дата сообщения: 01.10.2008 13:10
Добавил этот линк в шапку.
Автор: Dzak
Дата сообщения: 02.10.2008 08:50
вот такая вот проблема, причем при тех же условиях обработано 177 страниц pic 1171 а потом с pic зонами ни в какую может у кого соображения есть
Автор: monday2000
Дата сообщения: 02.10.2008 09:07
bolega
В Gimp'е есть несколько видов размытия - может, там найдётся подходящее ("интеллектуальное")?
Автор: skrt
Дата сообщения: 03.10.2008 17:11
bolega

у меня просьба: можно ли сделать, чтобы все процессные окна открывались не посередине рабочего стола (при наличие двух мониторов - неудобно), а посередине внутреннего рабочего пространства программы
Автор: VadimirTT
Дата сообщения: 05.10.2008 19:00
bolega
У меня версия кромсатора 5.91, скачанная с почившего в бозе сайтика, как я понял, Вы с тех пор что-то подчищали, добавляли, исправляли, выкладывали ли Вы обновленную версию? А то, попробовал разобрать кромсатором один пдф и результат получился странноватым, хотя, на первый взгляд, это просто скан загнанный в пдф.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.