Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: melodan
Дата сообщения: 17.11.2010 11:22

Цитата:
попросил сделать в его djvu imager, так получил такой отлуп..

Многие разработчики ПО ленивые по своей сути)))
А по поводу этой команды.. Она мне нужна лишь для реализации методики по созданию трехслойного djvu-файла, передний слой в которых отвечает за окрашивание ч/б текста и графики в цвет. Пока другой альтернативы я еще не нашел. Но в СК работаю уже давно, СТ меня не устраивает.
Вышесказанная команда Export zone's location должна формировать для каждой страницы координаты имеющихся на ней зон. Зоны-то разные бывают.. А в моей проблеме именно зоны, отвечающие за окрашивание ч/б текста в цвет, не выводились в файл. Как вы уже сказали, удаление предыдущих зон не влияет на этот процесс. Так в чем же тогда проблема - будем гадать или посмотрим на код функции?
В функцию нужно добавить выборочность - т.е. сохранять координаты отмаркированных зон, решить мою проблему с удалением зон и перенумерацией оставшихся зон. А то на деле выходит - удалил 100 зон, 100 осталось, добавляешь новую зону, а ей присваивается номер 201..Запускаешь функцию вывода координат зон в файл, а она, видимо, не находит первые сто зон и прекращает свою работу..
Автор: bolega
Дата сообщения: 17.11.2010 12:00
melodan

Цитата:
Многие разработчики ПО ленивые по своей сути

Есть такое.

Цитата:
Так в чем же тогда проблема - будем гадать или посмотрим на код функции?

Еще как посмотрим.

Цитата:
В функцию нужно добавить выборочность

Вот это другое дело: конкретно говорите, какой функционал куда конкретно добавить. А уж о якобы причинных или побочных явлениях (типа переименования) я и сам позабочусь, точнее, сделаю их невлияющими на результат.


Цитата:
Запускаешь функцию вывода координат зон в файл, а она, видимо, не находит
первые сто зон и прекращает свою работу..

Вот это вряд ли. Вообще все пакетные работы с зонами в СК никогда не используют итерацию по их номерам. Итератор движется по страницам (сканам), берет реальные зоны на странице (какой у них при этом номер, ему наплевать, номер всего лишь связывает конкретную зону на скане с выходным файлом зоны, не более) и делает с ними заданное действие.

Кстати, я просил monday2000 как раз об этом, сделать commandline версии своих утилит, чтобы СК сам вызывал их для создания трехслойных djvu. Тогда не нужно было бы всей этой возни с экспортом, созданием sep-файлов, контролем кратности размеров страниц размерам зон и т.д. Все это бы СК делал сам.
Но он не захотел. Ну и фиг с ним. Поэтому я решил ввести функциональность его утилит непосредственно в код СК.
Автор: melodan
Дата сообщения: 17.11.2010 21:28

Цитата:
Но он не захотел. Ну и фиг с ним. Поэтому я решил ввести функциональность его утилит непосредственно в код СК.

А на каком этапе этот процесс реализации? Какими командами-операциями вы это реализовали? В своей версии СК (5.93) я пока подобного не примечал..
А по поводу остальной вашей информации-ответа претензий не имею вы уж посмотрите, что там за трабла.. с зонами..
И еще.. соглашусь с возней. Как правило, после обработки получаются файлы страниц-текста и файлы-картинки. Последние обрабатываются (наводится марафет) различными методами по необходимости. Логичным завершением является djvu-кодирование страниц-текста и вклейка изображений в эти djvu-страницы-текст.. в самой программе СК.
Автор: monday2000
Дата сообщения: 18.11.2010 08:27
bolega

Цитата:
так получил такой отлуп, что всякое желание в дальнейшем взаимодействовать с ним пропало напрочь

Отлуп был по поводу СК в целом - так что не надо передёргивать и "давить на жалость" публики. Я сказал, что не-открывание исходников СК - это не по-товарищески, а по-жлобски. Кстати, "желание взаимодействовать" у меня пропало гораздо раньше, и по вполне нормальным причинам.

Цитата:
Тогда не нужно было бы всей этой возни с экспортом, созданием sep-файлов, контролем кратности размеров страниц размерам зон и т.д. Все это бы СК делал сам.

Так а я как раз этого и не хочу. Самая правильное - это как раз создавать sep-файлы - как сейчас. Я бы назвал это "оригинал-макет" будущей DjVu-книги.

Тогда у пользователя будет свобода выбора - в какой программе собрать в DjVu полученные sep-файлы.

Цитата:
Кстати, я просил monday2000 как раз об этом, сделать commandline версии своих утилит

А что там делать, там делать нечего, самому такие утилиты написать элементарно.

Цитата:
Поэтому я решил ввести функциональность его утилит непосредственно в код СК.

Лучше б Вы занялись авто-распознаванием зон в СК, чем такими совершенно нецелесообразными вещами, никому (кроме Вас лично) абсолютно не нужными. Хотя бы потому, что если уж пользователь осилил СК, то после этого сборка sep-файлов в DjVu покажется ему лёгкой прогулкой.
Автор: melodan
Дата сообщения: 18.11.2010 12:28
Давайте все-таки взаимодействовать и не вредничать! И плохого советовать друг другу не будем
Приоритетными направлениями в развитии СК вижу следующее:
- автораспознавание зон с полутоновыми и цветными изображениями;
- совершенствование методики формирования слоев для djvu-файла при использовании СК;
- формирование полной документации к функциональности СК;
- исправление ошибок, багов.
Автор: Alfizik
Дата сообщения: 24.11.2010 15:03
Наткнулся на довольно толковое и интересное пособие по созданию электронных книг (DjVu и PDF) из сканов за авторством некоего twdragon.

В пособии довольно толково расписаны многие моменты, в частности дана пошаговая инструкция и советы по работе со ScanKromsator-ом версии 5.92.

Вот ссылка на онлайн версию - http://rutracker.org/forum/viewtopic.php?t=2160930
А это на офлайн версию в виде pdf файла - http://rutracker.org/forum/viewtopic.php?t=2556964

Думаю есть большой смысл добавить в шапку ссылку на это пособие.
Автор: L
Дата сообщения: 24.11.2010 15:43
не могу импортировать PDF файл, out of memory, версия последняя. поискал по топику, но там про изображения, не pdf. сам pdf прекрасно читается.
Автор: bolega
Дата сообщения: 24.11.2010 16:57
Alfizik

Цитата:
Вот ссылка на онлайн версию - http://rutracker.org/forum/viewtopic.php?t=2160930


А никто не знает, как можно зарегистрироваться на rutracker? Я несколько раз пробовал, но безуспешно. Про инструкцию эту я слышал, но из-за отсутствия регистрации так и не смог туда пробиться.

L
Версия СК?


Автор: terminat0r
Дата сообщения: 24.11.2010 17:09
bolega
http://ifile.it/lhqpbgt/ebooks-from-scans.pdf
Автор: Astra55
Дата сообщения: 24.11.2010 17:11
bolega

Цитата:
Про инструкцию эту я слышал, но из-за отсутствия регистрации так и не смог туда пробиться

Давно выложена в шапке http://forum.ru-board.com/topic.cgi?forum=93&topic=3172&start=1560#1
Автор: bolega
Дата сообщения: 24.11.2010 20:18
Astra55

Я имел ввиду скорее свое желание написать на том форуме про некоторые неточности инструкции. Они там есть

terminat0r
Спасибо за pdf
Автор: shch_vg
Дата сообщения: 24.11.2010 20:23
bolega
А зачем регистрироваться на rutracker?
Я нажал на ссылку, выложенную Alfizik, и попал сразу на эту инструкцию, причем сверху есть ссылка на оффлайн, также приведенная Alfizik.

P.S. А в чем проблема с регистрацией?
Я все с той же ссылки очень просто зарегистрировался.
Автор: L
Дата сообщения: 24.11.2010 20:32
bolega
и последняя, и предпоследняя. т.е. как v5.93, так и v5.92. обе вылетают. то размера не может зависеть? там 356 двойных страниц.
Автор: bolega
Дата сообщения: 24.11.2010 21:32
shch_vg

Цитата:
А зачем регистрироваться на rutracker?

Чтобы почитать комментарии. Без регистрации все обсуждения начиная со 2-й страницы недоступны


Цитата:
А в чем проблема с регистрацией?

Письмо с подтверждением не приходит

L

Цитата:
то размера не может зависеть?

Нет, от размера не зависит. Можете в ПМ ссылку дать на pdf, если это возможно. Проверю на новой версии, я в ней ного багов исправил

Автор: L
Дата сообщения: 24.11.2010 22:10
ахтыж. как можно удалить сообщение?
Автор: ghosty
Дата сообщения: 24.11.2010 22:27
bolega

Цитата:
Проверю на новой версии, я в ней ного багов исправил
В новой у меня выскочила та же ошибка при попытке обработать разворот без предварительного кромсания (оперативки достаточно).

Продублирую сообщение отсюда:

В СК есть функция удаления "вертикального шума". Она хорошо подошла бы для удаления вертикальных линий на ксерокопиях. Но в полностью автоматическом режиме она работает грубовато: вместе с длинными линиями она повреждает вертикальные линии крупных символов:


Задание с примером обработки:
http://www.onlinedisk.ru/file/556604/

В связи с чем вопрос: можно ли как-то улучшить в этом отношении BC->Method:Vertical/Horizontal? Т.е., например, чтобы можно было задать минимальную длину вертикальной/горизонтальной линии?
Автор: bolega
Дата сообщения: 24.11.2010 22:53
ghosty

Цитата:
В новой у меня выскочила та же ошибка при попытке обработать разворот без предварительного кромсания (оперативки достаточно).

Такое может быть от того, что неправильно задан dpi исходного скана (сильно занижен или вообще неизвестен). Если outdpi=600, то upsample может быть просто нереальным. Проверьте dpi.


Цитата:
можно ли как-то улучшить в этом отношении BC->Method:Vertical/Horizontal? Т.е., например, чтобы можно было задать минимальную длину вертикальной/горизонтальной линии?

Теоретически можно. Исходно алгоритм таким и был. Но в итоге я сделал его независимым от размера, чтобы избавиться от лишнего параметра. Возвращать его обратно я не планирую по понятным соображениям.
Автор: ghosty
Дата сообщения: 24.11.2010 23:01
bolega

Цитата:
Такое может быть от того, что неправильно задан dpi исходного скана (сильно занижен или вообще неизвестен). Если outdpi=600, то upsample может быть просто нереальным. Проверьте dpi.
Нет, dpi был прописан - 180. Но апсемпл до 600 стоял по умолчанию, да.


Цитата:
Возвращать его обратно я не планирую по понятным соображениям.

Если это так сложно, то не надо, наверное. Просто для людей, работающих с ксерокопиями оказалось довольно актуально...
Автор: bolega
Дата сообщения: 24.11.2010 23:13
ghosty

Цитата:
Нет, dpi был прописан - 180

А размеры скана соотносятся с таким dpi?
Просто при обработке единственная операция, которая может дать out of memory - это upsample в запредельное кол-во раз, что в моей практике случалось только для неверно заданного исх. dpi. Например, если в реальности скан имеет 600dpi, а прописано 200, то в результате имеем на само деле upsample до 1800dpi. Более того, в последних версиях при upsample СК если нехватает памяти, пытается выполнить его частями (т.е. разделив скан на 2 части), чтобы сэкономить память.


Цитата:
Просто для людей, работающих с ксерокопиями оказалось довольно актуально...

Я понимаю проблему. Но если я введу новый параметр, придется подбирать его всем и во всех заданиях
Автор: shch_vg
Дата сообщения: 24.11.2010 23:17
bolega

Цитата:
Письмо с подтверждением не приходит

На bk.ru (один из адресов mail.ru) ответ мне пришел сразу же.
Автор: ghosty
Дата сообщения: 24.11.2010 23:24
bolega

Цитата:
А размеры скана соотносятся с таким dpi?

3648x2736


Цитата:
Но если я введу новый параметр, придется подбирать его всем и во всех заданиях
Честно говоря, не понял
Сам BG сейчас используют редко (IllCorr интереснее), а методы BG, отличные от дефолтного - еще реже. Поэтому "всем и во всех" сказано довольно сильно. Я никогда не применял Vertical/Horizontal для страницы целиком (именно из-за этих ограничений) - в основном использовал их только для удаления подчеркиваний.
Но когда на каждой странице линии от ксерокса, то вручную все это не удалишь. А тут такой удачный алгоритм - чуть-чуть подправить и можно автоматически странички очищать
Автор: shch_vg
Дата сообщения: 25.11.2010 01:17
ghosty

Цитата:
3648x2736

Если это книга обычного размера, то это 300dpi.
Автор: Alfizik
Дата сообщения: 25.11.2010 10:52
bolega

Цитата:
Письмо с подтверждением не приходит

Как вариант, при регистрации укажи другой ящик. Если не поможет, могу зарегистрироваться за тебя под ником который ты укажешь, затем я передам тебе пароль, и при первом же заходе в профиле ты поменяешь пароль на свой.


Цитата:
Я имел ввиду скорее свое желание написать на том форуме про некоторые неточности инструкции. Они там есть

Учитывая проблемы с регистраций опубликованы неточности там будут вероятно не скоро, поэтому не могли бы Вы написать тут, что это за неточности. А то хотел воспользоваться инструкциями приведенными там, но теперь опасаюсь.

Astra55

Цитата:
Давно выложена в шапке http://forum.ru-board.com/topic.cgi?forum=93&topic=3172&start=1560#1 [?]

Не очевидно как то, если бы Вы не привели ссылку, с вероятностью 99,9% я бы не нашел тут это пособие (впрочем я и нашел его не тут )) ).
Имхо эффективнее продублировать ссылку в этой шапке, а еще лучше поместить в шапку ссылку которую Вы привели, там я смотрю много еще чего полезного.


Автор: monday2000
Дата сообщения: 25.11.2010 11:48
СканКромсатор v5.92 - не разрезает некоторые страницы. В данном случае первую - но не раз у меня было так, что и последнюю.

Это явный глюк.

Я думал, что СК можно использовать хотя бы для пакетной разрезки страниц (взамен СТ) - но я ошибся...
Автор: L
Дата сообщения: 26.11.2010 13:33
перерыл все настройки, как можно некоторые страницы обрезать, но цвет не менять на оттенки серого или черно-белый? как что не устанавливаю, output всегда градации серого.
Автор: shch_vg
Дата сообщения: 26.11.2010 15:07
L

Цитата:
как что не устанавливаю, output всегда градации серого

А на закладке Files пробовали выбрать значение Original?

Другой возможный вариант Вашей проблемы.
Вы используете СК 5.93, причем не только разрезаете, но и поворачиваете (галочка в поле Deskew на закладке Files). Из-за ошибки в этой версии программы для сохранения цвета нужно поставить галку в поле Art на той же закладке.
Автор: kordon555
Дата сообщения: 26.11.2010 16:27
Вопрос к bolega.
Я предпочитаю работать с вашей программой, чем с СТ. К сожалению, в последнее время я всё больше пользуюсь именно с ST. Она хорошо работает с DjVu Imager. С SK одни проблемы. Не могли бы вы, вместе с monday2000 настроить правильную и лёгкую в работе версию программы. Я обычный пользователь, который не понимает все тонкости дела, поэтому мне кажется, что вы с monday2000, просто не можете найти общий язык. К тому же у меня были проблемы с уже отредактированными разворотами страниц с картинками. Нужно это сделать намного легче, чтоб потом была возможность использовать DjVu Imager.
Автор: bolega
Дата сообщения: 28.11.2010 01:24
kordon555
Спасибо за предпочтение

Цитата:
Не могли бы вы, вместе с monday2000 настроить правильную и лёгкую в работе версию программы

Это уже не актуально. Я ввел его метод подклейки фона (МПФ) непосредственно в СК. Причем реализовал полный цикл создания djvu всей книги по нажатию одной кнопки. При этом СК кодирует все страницы задания в 3 этапа: обложки, ч/б страницы, страницы с зонами. Любой этап можно пропустить. Для страниц с зонами можно использовать МПФ, а можно и не использовать. В любом случае теперь создавать sep-файлы не требуется - СК все делает сам на лету. Для кодирования обложек и ч/б страниц СК использует DEE (т.к. он наиболее продвинутый и наиболее управляемый из командной строки). При кодировании СК либо использует заданные профили из самого DEE, либо его можно сконструировать непосредственно в СК. Для МПФ СК использует DJVULibre. Все настраивается, есть Preview для djvu(чтобы быстро выбрать подходящий профиль DEE или параетры МПФ).
Любой из первых двух этапов юзер может в принципе выполнить и не в DEE, а в другой программе, а результат просто подсунуть СК. Это допускается.
Вот такие пироги
Автор: shch_vg
Дата сообщения: 28.11.2010 02:58
bolega
А нельзя ли что-то сделать, чтобы облегчить одно из основных действий в Вашей программе - очистку обработанных сканов от грязи?
Сейчас все приходится делать одной мышью: вычищать грязь на видимой части страницы, затем переводить мышь на полосу прокрутки и переходить на следующую видимую часть этой страницы. Когда это приходится делать на многих книгах с сотнями страниц, то начинает очень напрягать, тем более, что зачастую чистку приходится делать с большим увеличением изображения, так что на страницу приходится 5-6 прокруток вниз, а затем столько же вверх по соседней колонке.
Кроме того при таком переходе с одной видимой части на другую зачастую не удается заметить грязь, находящуюся на границе частей. Хорошо бы сделать определенный нахлест (м.б. задаваемый в опциях, т.к. он будет изменяться в зависимости от разрешения монитора) соседних частей. Кстати, этот момент ранее указывался не только мной. Сейчас получается, что стараешься, очищаешь, затем компилируешь и при просмотре снова видишь грязь. А просматривать еще раз после такой тщательной обработки уже просто нет терпения .
Автор: kordon555
Дата сообщения: 28.11.2010 17:50

Цитата:
Это уже не актуально. Я ввел его метод подклейки фона (МПФ) непосредственно в СК. Причем реализовал полный цикл создания djvu всей книги по нажатию одной кнопки. При этом СК кодирует все страницы задания в 3 этапа: обложки, ч/б страницы, страницы с зонами. Любой этап можно пропустить. Для страниц с зонами можно использовать МПФ, а можно и не использовать. В любом случае теперь создавать sep-файлы не требуется - СК все делает сам на лету. Для кодирования обложек и ч/б страниц СК использует DEE (т.к. он наиболее продвинутый и наиболее управляемый из командной строки). При кодировании СК либо использует заданные профили из самого DEE, либо его можно сконструировать непосредственно в СК. Для МПФ СК использует DJVULibre. Все настраивается, есть Preview для djvu(чтобы быстро выбрать подходящий профиль DEE или параетры МПФ).
Любой из первых двух этапов юзер может в принципе выполнить и не в DEE, а в другой программе, а результат просто подсунуть СК. Это допускается.
Вот такие пироги


В первый раз об этом слышу. А где скачать эту версию? Я пользуюсь версией 5,93 и не видел там такого.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.