Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 2)

Автор: ghosty
Дата сообщения: 18.02.2009 15:22
bolega

Цитата:
Отмечу, что в последней версии алгоритм определения контура заметно улучшен, и поэтому необходимость в использовании малинового резака весьма мала.

А вот с этим как бороться?



Я к тому, что не переобрабатывать же теперь целый раздел, к которому относится данный заголовок с апострофом. И выставить верхнюю границу блока текста для всего раздела вручную не удается.
Попробовал для одной страницы выставить text vertical sensitivity на максимум - все равно апостроф отфильтровывается

UPD: Додумался выставить text horiz. sensitivity на максимум и получил желаемый результат. Оказывается, я все время до сих пор путал горизонталь с вертикалью. Был уверен, что горизонтальная чувствительность - как бы чувствительность по оси Х, вертикальная - по оси Y... С другой стороны, page v. align - это именно по оси Y - какая-то несостыковка, похоже.
Но все равно, раз уж делать метод "без финализации", необходимо, наверное, сделать любые координаты/границы пересчитываемыми "на лету" - т.е. задал я чувствительность выше, границы пересчитались в соответствии с этими новыми параметрами (без повторной обработки).


Вообще, метод "без финализации" очень хорош (особенно в том виде, в котором я его ранее описывал ). Только, наверное, сейчас писать о багах не имеет смысла, т.к. Вы, наверное, сами все видите и знаете. А вот возможный путь развития этого метода можно было бы еще как-нибудь обсудить...
Автор: moishe1
Дата сообщения: 18.02.2009 16:01
pavel_nik_563

Цитата:
После первого прохода в Result View нужно просмотреть что-бы в текстовую область попала только полезная информация, при необходимости передвинуть границы области. При втором проходе в Result View промотреть получившиеся страницы, и очистить их от мусора при необходимости.
А разве в Result View можно двигать? А если вернуться назад - Result View пропадает. Какой же выход? Не записывать же на бумажке, где и что подвинуть!
Автор: ghosty
Дата сообщения: 18.02.2009 16:19
В конечном счете получился у меня облом сегодня. "Управлял" просмотром с помощью диал. окна Book Properties. Там выставлял параметры выравнивания - устанавливаю "В", нажимаю кнопку "Next". В результате после финализации оказалось, что все эти настройки не запомнились. Надо было нажимать "Preview", затем "Apply". bolega, сделайте, пожалуйста, чтобы при установке параметров эти две кнопки нажимались автоматически - т.е. было бы видно сразу, что получается, а параметр сохранялся бы при переходе на след. страницу.
Автор: bolega
Дата сообщения: 18.02.2009 16:26
ghosty

Цитата:
А вот с этим как бороться?

А нужно ли? Так ли уж это важно. Ведь обрезания-то не будет. Если оставить как есть, то выравнивание по верху будет выполняться по сути по базовой линии, а не по закорючкам, что более правильно, т.к. иначе создастся впечатление, что строка слегка опущена.


Цитата:
т.е. задал я чувствительность выше, границы пересчитались в соответствии с этими новыми параметрами (без повторной обработки).

Чувствительность влияет на все сканы, поэтому пересчитывать нужно все файлы (это ведь в свою очередь повлияет и на расчет размера книги), боюсь, на лету не получится. Причем в действительности это влияет не только на контур, но и на последующую обрезку исходного скана, что означает, что нужно делать практически все сначала. Можно пойти другим путем: ввести еще одну чувствительность, для VR, и использовать ее только там, как некий юстировочный параметр.

moishe1

Цитата:
А если вернуться назад - Result View пропадает

В каком смысле пропадает?? Нажмите кнопку с лупой, чтобы снова туда попасть


Добавлено:
ghosty

Цитата:
Надо было нажимать "Preview", затем "Apply".

Достаточно нажать только Apply. Но сделаю, как просите, т.к. я и сам уже на этом обжегся.
Автор: ghosty
Дата сообщения: 18.02.2009 16:35
bolega

Цитата:
А нужно ли? Так ли уж это важно. Ведь обрезания-то не будет. Если оставить как есть, то выравнивание по верху будет выполняться по сути по базовой линии, а не по закорючкам, что более правильно, т.к. иначе создастся впечатление, что строка слегка опущена.
Ах, что же это я! Правильно, ведь еще поле будет прибавляться. А я уж переобработать книжку успел... Вот ведь переклинило...
Автор: shch_vg
Дата сообщения: 18.02.2009 16:54
bolega
Из трех предложенных Вами типовых вариантов со вторым я сталкивался ранее, и его обрабатывала (т.е. предлагала объединить) предыдущая версия Вашей программы.
Я сейчас столкнулся с первым вариантом.
По Вашему описанию получается, что я должен в автомате обработать все страницы, а затем сделать слияние всех страниц с картинками и запустить результат в компиляцию djvu. Простые pdf (без таких picture-зон) я просто разбирал Вашей программой на тифы и запускал их на компиляцию. Здесь же если на большую книгу всего несколько страниц с зонами, то все равно приходится обрабатывать все страницы (хотя большинство не требует никакой обработки). Я хотел узнать, нет ли возможности по какой-то команде сделать объединение только страниц с зонами с одновременным созданием серого либо цветного тифа, включающего в себя основной и зонный тифы, и удалением отдельного зонного тифа? Тогда результат этого действия можно сразу отправлять на компиляцию.
В связи с этим еще такой вопрос: нельзя ли сделать, чтобы при импорте такого pdf уже в нумерации файлов выходной директории можно было понять, какой тиф - зона, а не высматривать в списке тифов в программе отсутствующие номера?
Автор: bolega
Дата сообщения: 18.02.2009 17:33
shch_vg

Цитата:
Здесь же если на большую книгу всего несколько страниц с зонами, то все равно приходится обрабатывать все страницы

Если отключены все опции (нажать 4-ю кнопку под левой панелью), то обработка происходит очень быстро (1-2 минуты), т.к. сводится к простому копированию файлов. И нумерация получается сквозная, без пропусков. Останется только merge сделать. Поэтому проблемы тут никакой не вижу. Я противник какого-либо серьезного изменения исходных файлов задания, по моему мнению (и опыту) все изменения должны производиться только с выходными файлами. Всякое бывает, мало ли. И если испортить исх. файлы, то ... сами понимаете.


Цитата:
В связи с этим еще такой вопрос: нельзя ли сделать, чтобы при импорте такого pdf уже в нумерации файлов выходной директории можно было понять, какой тиф - зона, а не высматривать в списке тифов в программе отсутствующие номера?

Могу сделать. Сейчас так, потому что решение о том, что зона, а что нет, СК принимает уже после извлечения, т.е. когда файлы уже поименованы. Но изменить это в принципе не сложно.
Автор: pavel_nik_563
Дата сообщения: 18.02.2009 17:34
moishe1

Цитата:
А разве в Result View можно двигать? А если вернуться назад - Result View пропадает

В Result View, после первого прохода, можно передвигать границы текстовой области (та что по умолчанию подсвечивается желтым), нужно подойти к краю текстовой области (пунктирная линия по периметру текстовой области) нажав и удерживая левую кнопку миши предвинуть границы. Страницы листаются кнопками "Q" и "W", закрыв окно "Result View" попасть туда можно (как уже сказал bolega) нажав в основном окне программы кнопку с лупой.
Автор: bolega
Дата сообщения: 19.02.2009 08:28
Gazoved

Цитата:
а вот далее начинается самое интеречное, хотим перевести в b/w часть надписей рисунка

Как Вы переводите? Что-то я не понял проблемы.
Автор: shch_vg
Дата сообщения: 19.02.2009 14:34
bolega
Возможно ли при импорте DJVU, содержащем наряду с ч/б и серые или цветные страницы, сделать автоматически picture-зоны?
А если бы это сделать как опция по выбору на первом окне импорта...
Автор: bolega
Дата сообщения: 19.02.2009 15:12
shch_vg

Цитата:
Возможно ли при импорте DJVU, содержащем наряду с ч/б и серые или цветные страницы, сделать автоматически picture-зоны?

Тифы из djvu ничем не отличаются от обычных сканированных тифов. Если в pdf есть поддержка "зон", то в djvu ее нет. Поэтому все сводится к стандартной (и чрезвычайно непростой) проблеме распознавания иллюстраций на скане. В СТ задействован метод U235. Вроде бы неплохие результаты показывает. Arcand как-то выкладывал эту же методику для Corel. Возможно, со временем, я метод U235 в СК тоже введу.
Автор: denver 22
Дата сообщения: 20.02.2009 20:53

Цитата:
Вроде бы неплохие результаты показывает.

Согласен. Если внедрите в SK, то было бы замечательно отображать результат выделения после Draft, чтобы пользователю предварительно увидеть его и при необходимости скорректировать.
Автор: Gazoved
Дата сообщения: 20.02.2009 22:57
bolega

Цитата:
Как Вы переводите? Что-то я не понял проблемы.

В окне Result view и после того, как Picture zone были совмещены с текстом, выделяю кусочек рисунка, например, с текстом, нажимаю правой кнопкой мыши по выделению, далее Speial...->Convert to b/w
Так вот после закрытия окна Result view или после возвращения к файлам, которые были уже просмотрены - не работает эта фнкция, приходилось еще раз кромсать, финализировать, совмещать и только после этого - обрабатывать
Автор: moishe1
Дата сообщения: 22.02.2009 21:39
pavel_nik_563

В точности следую ролику (№2). Посмотрите, что получается. Не пойму, что с этим делать?

http://rapidshare.com/files/201288298/Pg.JPG.html

ПС

В результате никаких полей нет вообще
Автор: bolega
Дата сообщения: 22.02.2009 23:32
moishe1
Из скриншота видно, что контур проходит не по тексту, а вне его, что говорит о том, что у Вас все-таки отключен Automargins. В этом вся проблема. Плюс размеры книги явно занижены (поля уходят вглубь контура). Не забывайте пересчитывать размеры книги после изменения значения полей!
Автор: moishe1
Дата сообщения: 23.02.2009 00:04
bolega

Цитата:
Из скриншота видно, что контур проходит не по тексту, а вне его, что говорит о том, что у Вас все-таки отключен Automargins. В этом вся проблема. Плюс размеры книги явно занижены (поля уходят вглубь контура). Не забывайте пересчитывать размеры книги после изменения значения полей!



Вы правы, Automargins действительно оставался отключенным, я не заметил. Теперь поля есть!

Разрешите такой вопрос : что такое Use average width и что лучше : отключать его или оставить?

Автор: stepfano
Дата сообщения: 23.02.2009 15:29
вопрос по СК V-5.92 beta. Загружаю обраб. сканы 24 колор, снимаю на всех вкладках галки, на вкладке - фаилы ставлю формат: тифф без компрессии в градациях серого, выделяю пикчерз зоны (в них меняю только цветность с серого(по умолчаниию) на оригинал, остальные галки не трогую). Жму процесс, затем Zones -> Picture zone -> Merge zones... ставим флажок Create separate files for non-b/w zones. В папке Out получаем следующее: из сканов без пикчерз зон получаются 256 цветов в градациях серого, а из сканов с пикчеррз зонами, зоны получаются в цвете как и надо а остальное содержимое сканов 256 цветов колор а надо тоже в градациях серого. Куда копать?
Автор: MIHMIH007
Дата сообщения: 23.02.2009 17:59
Подскажите плз работал работал... тут бац что то произошло что в данной задаче стала кнопка СОНТРЛ автоматом зажата.... то есть при выделении любой галочки прога спрашивала меня постоянно ставить ли для всех страниц данную опцию..... при перемещении резаков стало применяться перемещение на два резака сразу как при зажатой клавише КОНТЛ..... может я какую то быструю клавишу нажал что включилось автоматическое зажимание клавиши контрл?
Спасибо
Автор: Smokeer
Дата сообщения: 23.02.2009 18:03
может проблемы с клавиатурой?
Автор: Torino
Дата сообщения: 23.02.2009 19:57
bolega
У вас не было мыслей сделать draft kromsate - фоновым процессом? Или параллельным потоком.
Пока расставляются черновые резаки - пользователь идет вслед за DK и корректирует результат.
Автор: Gazoved
Дата сообщения: 23.02.2009 21:07
MIHMIH007

Цитата:
может я какую то быструю клавишу нажал

Вы работали на ноуте или на персоналке?
Попробуйте нажать Ctrl и подержать до 10 сек
Баг не программный, это должно отражаться скорее всего и в самой операционной системе
Автор: bolega
Дата сообщения: 24.02.2009 10:21
stepfano
Точно, баг. Спасибо

Gazoved

Цитата:
Так вот после закрытия окна Result view или после возвращения к файлам, которые были уже просмотрены - не работает эта фнкция, приходилось еще раз кромсать, финализировать, совмещать и только после этого - обрабатывать

Так и не смог воспроизвести. У меня все работает. Может сделаете субтаск из одного файла (File->Create sub-task), чтобы можно было воспроизвести?

Добавлено:
Torino

Цитата:
У вас не было мыслей сделать draft kromsate - фоновым процессом? Или параллельным потоком.

Была такая мысль. Но до нее пока не добрался
Автор: pavel_nik_563
Дата сообщения: 24.02.2009 19:03
moishe1

Цитата:
Разрешите такой вопрос : что такое Use average width и что лучше : отключать его или оставить

На прошлой страничке я уже писал об этом:

Цитата:
Возможен вариант когда страницы в книге имеют разную ширину, а в настройках стоит галочка возле Use average width, тогда текст на некоторых страницах "наползет" на поля (поскольку размер считается по среднему значению текстового блока), если эту галочку убрать тогда размер страницы будет считаться по максимальному значению, а не среднему и текст в этом случае уже не будет наползать на поля, но на некоторых страницах поля будут слишком широкие.

P.S. Если навести курсор на данный чекбокс (как и на многие другие), через секунду появится подсказка на русском
Автор: moishe1
Дата сообщения: 25.02.2009 23:23
pavel_nik_563

Цитата:
После первого прохода в Result View нужно просмотреть что-бы в текстовую область попала только полезная информация, при необходимости передвинуть границы области. При втором проходе в Result View промотреть получившиеся страницы, и очистить их от мусора при необходимости.


А можно ли менять размер ластика? И что такое чистка mouse-up? Еще странная вещь - когда я меняю output format на PDF, все что я чистил снова возвращается. Вообще для формата ПДФ Result View не существует.
Автор: bolega
Дата сообщения: 26.02.2009 09:04
moishe1

Цитата:
А можно ли менять размер ластика?

Нет.

Цитата:
И что такое чистка mouse-up?

Выделяете, в момент отпускания кнопки мышки происходит либо despeckle, либо чистка заданным цветом (в пределах выделенной области). Я например, ластик вообще не использую. Гораздо удобнее чистить mouse-up despeckle, т.к. не нужно точно прицеливаться на спекл, если в выделение попадет часть буквы, то она не сотрется, т.к. despeckle действует только на мелкие частицы. Для 600dpi рекомендую для ручной чистки задать размер despeckle=20. Единственное, что нужно следить, чтобы в выделение не попадали знаки препинания. Если спекл большой или имеет сложную форму, то удалить его можно быстро, щелкнув на любой его точке мышкой, держа при этом нажатыми Ctrl+Shift.


Цитата:
Вообще для формата ПДФ Result View не существует

Это естесственно. В данном случае Result View - это Acrobat
Если нужен pdf, то его надо делать в два этапа. На 1-м этапе создается обычное задание (вых. формат=tif), обрабатывается, чистится (merge зон не делается!). Затем, когда все готово, создается новое задание по команде File->Create out task. В новом задании нужно только задать out format=pdf и имя pdf. Запустить обработку, по которой pdf и создастся. Здесь главное то, что задание для pdf SK создаст сам, Вам ничего уже настраивать не нужно.
Автор: moishe1
Дата сообщения: 26.02.2009 20:07
bolega
Натолкнулся на проблему с разворотами. Мне нужно чтобы правая сторона была первой, а левая - следующей за ней. Пока не нашел, как это сделать (если есть такая опция).
Автор: pavel_nik_563
Дата сообщения: 26.02.2009 21:03
moishe1

Цитата:
Натолкнулся на проблему с разворотами. Мне нужно чтобы правая сторона была первой, а левая - следующей за ней.

Что-то я не пойму в чем фишка... Это вообше как?
Автор: moishe1
Дата сообщения: 26.02.2009 21:07

Цитата:
Если нужен pdf, то его надо делать в два этапа. На 1-м этапе создается обычное задание (вых. формат=tif), обрабатывается, чистится (merge зон не делается!). Затем, когда все готово, создается новое задание по команде File->Create out task. В новом задании нужно только задать out format=pdf и имя pdf. Запустить обработку, по которой pdf и создастся. Здесь главное то, что задание для pdf SK создаст сам, Вам ничего уже настраивать не нужно.


Попробовал Create out task - все настройки исчезли, полей в ПДФ нет...

Добавлено:
pavel_nik_563
Цитата:
Что-то я не пойму в чем фишка... Это вообше как?

В некоторых нерусских языках страницы идут справа налево.


Автор: pavel_nik_563
Дата сообщения: 26.02.2009 21:58
moishe1
Понятно... Лично я не знаю есть ли данная фишка в СК, но можно после обработки тифы переименовать в Тотал Коммандере через "групповое переименование", но это конечно не очень удобно...
Автор: shch_vg
Дата сообщения: 27.02.2009 00:37
bolega
Скачал книгу "Пожарский. Шахматный учебник на практике" в известном Вам топике, СканКромсатором импортировал djvu и запустил Draft Kromsate, оставляя в окне его все по умолчанию.
Получил странный результат:
левый, верхний и нижний резаки установлены правильно, зато правый у очень большого количества страниц режет диаграммы справа, приходится править вручную.
На последних 8 страницах полный облом - неверно установились почти все резаки.
А резать-то их удобно, т.к. все они имеют жирную прямоугольную рамку с текстом внутри.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

Предыдущая тема: MoleskinSoft Clone Remover


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.