Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: Kiljes
Дата сообщения: 20.11.2007 23:44
bolega или кто-нибудь расскажите про Gray enhance: его закладки, какие задачи решают... И про Zone properties (если правой клавишей мыши клацаешь по зоне то она появляется).
Автор: shch_vg
Дата сообщения: 21.11.2007 09:54
bolega

Цитата:
Те расхождения, которые остались, вызваны исключительно тем, что для зоны отключен despeckle, а для скана он включен.

Что-то я совсем ничего не понимаю. Но ведь в моем случае качество обработки диаграммы без зоны с включенным despecle=safe заметно лучше, чем диаграммы, заключенной в зону с отключенным despeckle, хотя должно было быть все наоборот.
Кстати, какой параметр в опциях зоны отключает/включает ее despeckle?
Автор: Alexx S
Дата сообщения: 21.11.2007 10:02
bolega
Странное дело - safe метод коррекции освещенности удалил яркую черную линию..., Normal - нет


Добавлено:
А можно еще несколько предложений?

1. Очень хочется просматривать и редактировать результаты во время оброаботки, потому как ждать, когда обработаются 800 страниц долго, хотелось бы уже начать чистить обработанные
2. Очень не хватает окна с визуальным представлением результата подбора порога бинаризации, как это сделано, к примеру, в Кореле.
Автор: shch_vg
Дата сообщения: 21.11.2007 11:28
Alexx S

Цитата:
1. Очень хочется просматривать и редактировать результаты во время оброаботки, потому как ждать, когда обработаются 800 страниц долго, хотелось бы уже начать чистить обработанные

А кто мешает запустить второй экземпляр Кромсатора? Правда, проблемы могут возникнуть при изменении каких-нибудь настроек во втором экземпляре.
Однако просматривать и чистить можно.
Автор: bolega
Дата сообщения: 21.11.2007 12:13
shch_vg

Цитата:
Что-то я совсем ничего не понимаю. Но ведь в моем случае качество обработки диаграммы без зоны с включенным despecle=safe заметно лучше, чем диаграммы, заключенной в зону с отключенным despeckle, хотя должно было быть все наоборот.

Это все из-за того бага. Сейчас все нормально.

Можете провести еще один эксперимент. В свойствах зоны убрать галку с clear source, т.е. область зоны после ее вырезания не будет зачищаться. В результате диаграмма будет и в зоне, и на скане. После кромсания увидите, что на скане она стала плохого качества. Это казалось бы идет в разрез с Вашим 2-м заданием. Но не удивляйтесь, так и должно быть. На самом деле не очищать зону и вообще не использовать ее - это разные вещи. Дело в том, что сейчас в кромсатор так заложено: если зона почему-то юзером не зачищается, то она как бы превращается для последующих операций в exclude-зону и поэтому на нее не действуют фильтры. Я уже точно не помню, почему я сделал именно так, но это в принципе можно изменить, если кому-то это покажется странным. В любом случае, если делать djvu, то не-зачистка области зоны не играет никакой роли, т.к. при merge это область все-равно накроется зоной.


Цитата:
Кстати, какой параметр в опциях зоны отключает/включает ее despeckle?

despeckle на закладке filters

Alexx S

Цитата:
Странное дело - safe метод коррекции освещенности удалил яркую черную линию..., Normal - нет

safe метод коррекции придумал не я, он проходил тут в топике в исходниках. Такая у него фича Могу только посоветовать на кончиках линии поставить маленькие exclude-зоны.


Цитата:
Очень хочется просматривать и редактировать результаты во время оброаботки

Для этого нужно обработку полностью переводить на многопоточность. Я этого пока не сделал, т.к. нужно очень многое переделывать из-за этого. И еще как-то придумывать блокировку, чтобы юзер не смог изменять параметры того, что в данный момент обрабатывается и в случае page=auto не смог изменять размеры скана, зон и их взаимного расположения, чтобы когда кромсатор приступит к расчету размеров книги, выравнивания размеров и связанному с этим репозиционированием зон, не получилась бы ерунда в итоге.


Добавлено:
shch_vg

Цитата:
А кто мешает запустить второй экземпляр Кромсатора? Правда, проблемы могут возникнуть при изменении каких-нибудь настроек во втором экземпляре.

Да, чистить можно во 2-м экземпляре. Но ни в коем случае не изменять размеры и не трогать зоны. Сохраняться тоже нельзя, и отключить автосохранение. Иначе, если вдруг основное задание вылетит, а файл автосохранения (или осн.файл) перезапишется 2-м экземпляром кромсатора, то потеряется вся информация по уже обработанным зонам, и их придется обрабатывать по новой.
Автор: Alexx S
Дата сообщения: 21.11.2007 12:43
bolega

Цитата:
Для этого нужно обработку полностью переводить на многопоточность. Я этого пока не сделал, т.к. нужно очень многое переделывать из-за этого. И еще как-то придумывать блокировку, чтобы юзер не смог изменять параметры того, что в данный момент обрабатывается и в случае page=auto не смог изменять размеры скана, зон и их взаимного расположения, чтобы когда кромсатор приступит к расчету размеров книги, выравнивания размеров и связанному с этим репозиционированием зон, не получилась бы ерунда в итоге.


Я имел в виду несколько иное - исключительно просмотр и чистку мусора, это ограничение действительно нужно для page=auto. И только с обработанными страницами.
Кстати, это пересекается с тем, что я предлагал раньше - добавление полей по отдельной команде в любое время после обработки. Т.е page=auto делать не сразу, а после чистки по команде юзера, и только в этом случае, давать возможность открывать файлы в редакторе
Автор: bolega
Дата сообщения: 21.11.2007 13:00
Alexx S

Цитата:
.е page=auto делать не сразу, а после чистки по команде юзера


Насчет полей по команде. Поразмыслив, я пришел к выводу, что это тоже самое, что двухпроходной кромсание, причем есть и преимущество. 1-й раз кромсаете с опцией page=none. Чистите, потом из получившихся файлов создаете новое задание (сейчас это стало просто, команда create out-task, зоны останутся, но станут внешними, при особом желании их опять можно менять), в котором уже указываете page=auto.
Теперь представьте ситуацию, когда навешивание полей сделать в 1-м задании по спец команде. Выполнили Вы команду и вдруг видите, что поля Вас не устраивают. Что теперь делать? Файлы то изменились, обратно уже не вернешь. Кромсать все по новой?
А вслучае же двухпроходного задания выходные файлы 1-го задания будут являться входными для 2-го и перезаписываться не будут и можно с легкостью и быстро переобрабатывать их, ведь вскякие фильтры и улучшения уже не нужны.
Автор: kontiky
Дата сообщения: 21.11.2007 13:22
bolega
Есть два замечания по интерфейсу sk:
1. Было бы неплохо выводить в списке последних открытых файлов (File->recent files) не только имена файлов-проектов, но и пути к ним (см. как это сделано в MS World). Сейчам, когда одновременно работаешь над разными книгами с одинаковыми именами файлов-проектов, можно легко запутаться.
2. Я работаю на Win XP SP2 Eng, но локаль у меня в ОС стоит русская. В sk 5.9 часть пунктов локальных меню в такой конфигурации стала русской. До 5.9 ничего подобного не было. Вообще, было бы идеально иметь возможность где-то в опциях переключать язык интерфейса sk, а сами сообщения вынести в текстовые ресурсы, для редактирования пользователям. Вдруг кто-то захочет перевести sk на хинди или какой-нибудь португальский...
Автор: ghosty
Дата сообщения: 21.11.2007 13:32
Alexx S

Цитата:
2. Очень не хватает окна с визуальным представлением результата подбора порога бинаризации, как это сделано, к примеру, в Кореле.

Поддерживаю обеими руками. Бинаризация - это главное, и без предпросмотра не всегда легко...
Цитата:
Поразмыслив, я пришел к выводу, что это тоже самое, что двухпроходной кромсание, причем есть и преимущество.
Так вот я и предлагал двухпроходное кромсание, чтобы поля постфактум добавлять...
Автор: shch_vg
Дата сообщения: 21.11.2007 14:14
bolega

Цитата:
Это все из-за того бага. Сейчас все нормально

Еще раз спрашиваю, т.к. очень нужно. Нельзя ли сбросить текущий вариант программы на Ваш сайт? Вручную делать большую чистку - глаза очень устают.
Автор: Alexx S
Дата сообщения: 21.11.2007 14:18
bolega

Цитата:
Насчет полей по команде. Поразмыслив, я пришел к выводу, что это тоже самое, что двухпроходной кромсание, причем есть и преимущество

Согласен. Когда не было возможности создавать выходное задание это было проблемой


Цитата:
А вслучае же двухпроходного задания выходные файлы 1-го задания будут являться входными для 2-го и перезаписываться не будут и можно с легкостью и быстро переобрабатывать их, ведь вскякие фильтры и улучшения уже не нужны.

Единственное неудобство - если в новом задании что-то делалал, а потом надо поменять поля, то придется делать еще одно... Но это не страшно.

Другое дело - выравнивание. Если я что-то двигал в задании, то в выходном это все сбросится. Да и изначально я просил именно механическое изменение полей, без автовыравнивания. Думаю, несложно будет дополнить опции Automargins опцией "как есть"

И вот еще что - уже довольно давно мучает одна проблема - невозможность сохранить то вертикальное выравнивание текста, что и в книге.
Как ни задаешь - обязательно будут страницы, преимущественно в начале и конце глав, где выравнивание нужно противопложное.
На этапе кромсания это сделать практически невозможно, поскольку отсканировано все может быть до невозможности криво - пойди, разбери как оно в книге выровненно...
Поэтмому я предлагаю одну простую вещь - задание порога, при котором заданное пользователем выравнивание игнонируется и меняется на более подходящее.
Пример:

Дано: книга с нумерацией вверху, начала глав выровненны по нижнему краю.
Выравнивание задаем по верхнему краю, но если в результате верхнее поле больше нижнего в 2 раза (либо другое пороговое значение), то выравнивание - по нижнему краю.
Или, противоположная ситуация - выравнивание по нижнему краю, а текста только полстраницы вверху.
Конечно, эта опция не панацея и возможна ситуация, когда она не поможет, но очень большое количество книг, что я делал удалось бы с успехом обработать в с такой функией.


Автор: bolega
Дата сообщения: 21.11.2007 15:23
shch_vg

Цитата:
Еще раз спрашиваю, т.к. очень нужно. Нельзя ли сбросить текущий вариант программы на Ваш сайт? Вручную делать большую чистку - глаза очень устают

Если я не сбрасываю, значит на это есть причины. как правило - одна. В настоящее время идет изменение опций, в связи с чем формат spt подвергается постоянному изменению (в части хранения новых опций, формат старых опций не изменяется никогда, чтобы sk мог открыть задание, сделанное хоть 5 лет назад). Выкладывать версию, которая создаст задание, которое завтра не сможет открыть очередная версия, я не могу. Подождите день-два, я уже заканчиваю.

Alexx S

Цитата:
На этапе кромсания это сделать практически невозможно, поскольку отсканировано все может быть до невозможности криво - пойди, разбери как оно в книге выровненно...

Вот поэтому я и не сделал автоопределение выравниывания.
Но то, что Вы предлагаете, я не буду делать. Это вносит неопределенность (и без этого ее хватает). Т.е. в опциях стоит Top, а кромсатор будет прижимать книзу. Согласитесь, это нелогично в принципе. Опция на то и задается, чтобы sk ее выполнял. Если же задано будет одно, а sk будет делать по другому, получится анархия и ерунда.
Поэтому все-таки придется что-то думать, чтобы определить выравнивание именно на этапе драфта.
Автор: Alexx S
Дата сообщения: 21.11.2007 15:40
bolega

Цитата:
Т.е. в опциях стоит Top, а кромсатор будет прижимать книзу. Согласитесь, это нелогично в принципе.


ни в коем случае, просто не стал писать что либо называть придется по-другому, либо прятать в спешл...


Цитата:
Поэтому все-таки придется что-то думать, чтобы определить выравнивание именно на этапе драфта.


а в этом случае как будет называться опция? результат-то будет такой же, как и в описанном мною случае. Да и само по себе выравнивание нелогично и обусловлено лишь невозможностью точно определить то, как тескст выровнен в книге. Нам же надо только одно - сделать как в книге.
Автор: ghosty
Дата сообщения: 21.11.2007 15:53
bolega

Цитата:
Опция на то и задается, чтобы sk ее выполнял. Если же задано будет одно, а sk будет делать по другому, получится анархия и ерунда.
Насколько я понял, Alexx S имеет в виду вот что. Несмотря на то, что "A" обозначает "Automatic", никакой автоматики, на самом деле, нет - блок текста всегда выравнивается по верхней границе. Он (как и я в свое время) ратует за автоматизацию. Я думаю, что раз уж речь зашла о двухпроходном кромсании, то эта тема вновь может стать актуальной.
Автор: shch_vg
Дата сообщения: 21.11.2007 17:09
Alexx S
не могли бы Вы уточнить технологию Вашей обработки книги с помощью Кромсатора?
Я ее понял так:
1. Загрузка сканов и прогонка их через Draft Kromsite
2. Минимальная правка опций по результатам драфта (выравнивание сверху или снизу, м.б. правка выделенных на предыдущем этапе жирным сканов) и запуск обработки
3. Последовательный просмотр обработанных страниц с чисткой и возможной переобработкой отдельных страниц.

Если это так, то как избегать возможного значительного увеличения автоматически вычисляемого размера листа за счет грязи, которую можно отсечь резаками, если после драфта просмотреть последовательно все страницы?
Если же просмотр страниц после драфта желателен, то автоматический расчет выравнивания необязателен, его можно сделать в процессе просмотра.
Автор: bolega
Дата сообщения: 21.11.2007 17:37
shch_vg

Цитата:
Если это так, то как избегать возможного значительного увеличения автоматически вычисляемого размера листа за счет грязи


В версии 5.9 я немного изменил алгоритм расчета размеров книги, чтобы особо широкие/высокие страницы (из-за грязи) не влияли на усредненный размер.


Добавлено:
ghosty
Понял
Автор: ghosty
Дата сообщения: 21.11.2007 18:53
bolega

Цитата:
В версии 5.9 я немного изменил алгоритм расчета размеров книги, чтобы особо широкие/высокие страницы (из-за грязи) не влияли на усредненный размер.
Т.е. теперь такие размеры таких страниц совсем не участвуют в вычислении среднего размера, и для них задается собственный размер, так? Это очень хорошо - я, например, иногда забываю вычислить размеры страницы, и раньше приходилось обрабатывать повторно.
Автор: mengzhiyong
Дата сообщения: 21.11.2007 23:59
Eminent Friends and Comrades,

I am an old lurker. Just now started posting. I am old friend of ghosty.

I want to share with you my experiences and information about Pdfcompressor.

I am going to be tracing the program. I need uninstallers to investigate it.
Please help me with the programs for reversing. I have IDA, ollydebug and
softice only.

I need help on unpackers from you. It is very hard for me to read this forum.
I am so sorry I dont understand Russian so please do help me.

Pdfcompressor uses a bad ocr program. It does not use abbyy which is used
by Luratech. It uses Omnipage derivative which is probably the same as textbridge
engine by Xerox.

We can however, use pdfcompressor without its OCR by giving it OCR document
by abbyy because it wont touch other streams such as text, bookmarks,
annotations etc.

I want english version of Scan and Share by honorable Vladimir TT.
ScanAndShare1.06, VadimirTT) - complete course from the scanning to the coding
before the pictures, with the guarantee of qualitative result.pdf

If you have any other technical papers or books that I should read to do this job
of writing image processing programs and also cracking pdcompressor, plz let me
know.

Please help me get started and I will be your hardworking and sincere
comrade in need.

mengzhiyong


Where is a detailed description of algorithms used in scankromsatoru by our eminent academician Bolega ? <---------------------------------------------------------------------------


thanks
Автор: ghosty
Дата сообщения: 22.11.2007 00:51
mengzhiyong, you are welcome!

Цитата:
Where is a detailed description of algorithms used in scankromsatoru by our eminent academician Bolega ?
Only this question is not offtopic here
All the descriptions are in Russian now. Just try to begin using SK. What do you need it for?
Автор: shch_vg
Дата сообщения: 22.11.2007 11:56
bolega

Цитата:
В версии 5.9 я немного изменил алгоритм расчета размеров книги, чтобы особо широкие/высокие страницы (из-за грязи) не влияли на усредненный размер.

А как обстоит дело с маленькой грязью?
В последнее время столкнулся на довольно большом количестве чужих книжек с тем, что совсем небольшие точки грязи (в основном ниже текста) приводят к смещению всего текста на странице, что при просмотре такой книги выглядит некрасиво - страницы прыгают вверх-вниз.
Приходится такие книги декомпилировать и вручную устанавливать резаки, чтобы при обработке отрезать эти точки.
Автор: bolega
Дата сообщения: 22.11.2007 12:49
shch_vg

Цитата:
В последнее время столкнулся на довольно большом количестве чужих книжек с тем

Мы же не знаем, как так у них получилось. Может чувствительность максимальную поставили, может с automargin перемудрили и т.д.
Автор: shch_vg
Дата сообщения: 22.11.2007 13:58
bolega

Цитата:
Мы же не знаем, как так у них получилось. Может чувствительность максимальную поставили, может с automargin перемудрили и т.д.

Так-то оно так, но я в Вашей программе (5.9, до чего мне нравится импорт в ней, особенно из ПДФ) декомпилирую такую книгу, расставляю резаки по максимуму листа в автомате и по дефолту запускаю с автомаржином, выровняв предварительно предположим понизу. В результате получаю пляшущие страницы, при внимательном просмотре действительно можно на сдвинутых страницах заметить небольшие точки (иногда даже почти незаметные на первый взгляд). После обрезания их резаком и повторной обработке текст на такой странице выравнивается нормально.
Вот если бы Ваша программа как-то игнорировала такие отдельные точки...
Автор: bolega
Дата сообщения: 22.11.2007 16:43
shch_vg

Цитата:
После обрезания их резаком и повторной обработке текст на такой странице выравнивается нормально.

Как всегда, осмелюсь попросить пример в виде тифов (или djvu/pdf, из которых Вы импортируете) + настройки кромсания. На самом деле sk игнорирует как правило такие точки, и чтобы разобраться, почему идет не так, мне нужно отрассировать на конкретном примере.
Автор: shch_vg
Дата сообщения: 22.11.2007 17:14
bolega

Цитата:
Как всегда, осмелюсь попросить пример в виде тифов (или djvu/pdf, из которых Вы импортируете) + настройки кромсания.

Эх, на день бы раньше, сегодня потер кучу скачанных книг по теории дебютов. Там практически в каждой наблюдалось такое. Как только столкнусь с подобным ( а м.б. закачаю заново) - выложу.

P.S. Удалось восстановить удаленные файлы, постараюсь вскоре (м.б. завтра?) выложить пример.
Автор: shch_vg
Дата сообщения: 22.11.2007 23:27
bolega
Выложил на рапиду пример:
_http://rapidshare.com/files/71572589/primer.rar (7.2 мб)
Автор: drcode
Дата сообщения: 23.11.2007 05:23
Where do I get english language version of scankromsator manual and program? I do not speak Russian and the Cyrillic alphabets sometimes give me headache. Please understand my ignorance and I apologize that my parents could not send me to a school that taught Russian. Now I need manuals, tuts of the basic programs for scanning, processing and sharing in english. Like scan and share and other tutorials.

Добавлено:
please just give me exact links of each tool, dont send me to big long thread. I cant parse Russian.
Автор: bolega
Дата сообщения: 23.11.2007 07:15
drcode
ScanKromsator has english interface.
There is nor english, nor russian manual. I'm writing it.
Автор: drcode
Дата сообщения: 23.11.2007 07:25
Bolega, when will the manual be finished? Roughly when first draft released? I just want to know if it is days, months or years ?

машинного перевода, пожалуйста, будьте осторожны:

Bolega, когда будет ручной быть готовой? Примерно, когда первый проект освобожден? Я просто хочу знать, если это дней, месяцев или лет?

Я должен поставить машинного перевода более друзей среди некоренного английский выступая русского народа. Оповещения добавляется на вершине, что он может быть ошибочным.
Автор: manfred
Дата сообщения: 23.11.2007 23:18

Цитата:
Если зона непрямоугольная, то тогда это двухстраничный тиф, но тоже абсолютно стандартный.

"А всё-таки IrfanView падает" ©
Вероятно из-за этого тега:
Код: tiffdump bad.tif
...
ICC Profile (34675) UNDEFINED (7) 0<>
bad.tif: Invalid count for tag 34675.
Автор: skrt
Дата сообщения: 24.11.2007 11:10
bolega
заметилл такую вещь (может она уже описывалась)

версия 5.6а сохраненное задание. Открыл, чтобы поменять пару параметров (незначительных), поменял, применил ко всем страницам. Нажал процесс. В итоге все 300 файлов заполнены только двумя страницами, на которой стоял курсор. Второй раз тоже самое. Третий раз я поставил курсор в самое начало (на самый первый файл) и пошло все нормально.
До этого таких вещей никогда не было

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.