Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: shch_vg
Дата сообщения: 02.08.2009 20:13
qazazel
К сожалению, Вы не написали версию используемого Вами Кромсатора, но начиная, по-моему, с sk58NY в меню в Service появился выбор Rotate&save...
В Вашем случае я бы не стал вручную помечать 320 файлов, а, выбрав все требующие поворота файлы (которые по Вашей терминологии стали красного цвета), перешел бы в окно Rotate/Flip and save source files (Service->Rotate&save...) и выбрал бы в списке Rotate значение Selected.
Автор: qazazel
Дата сообщения: 02.08.2009 20:23
Понял, спасибо. Решил самостоятельно ускорить процесс обработки, поэтому решил повернуть файлы после кромсания ... и чудо можно в опциях при расстановке резаков выбрать поворот четных или нечетных страниц, что я и сделал. Спасибо за ваш вариант.
Автор: chesskom
Дата сообщения: 03.08.2009 04:47
(...)


Автор: shch_vg
Дата сообщения: 03.08.2009 13:03
chesskom

Цитата:
SK ==>> PDF 33 мб
можно сделать лучше ==>> PDF 6.7 мб

С помощью СК?
Автор: chesskom
Дата сообщения: 03.08.2009 13:24
(...)


Автор: qazazel
Дата сообщения: 03.08.2009 13:32
Еще вопрос? Почему после кромсания страницы имеют разный размер? Как их сделать одинаковыми?
Автор: Arcand
Дата сообщения: 03.08.2009 14:03
bolega
ИМХО СканКромсатор в одном отношении работает не должным образои. Понадобилось просто разрезать сканы - сбросил все опции и установил резак для разрезки. На выходе со второй стр. нормально, зато первая (левая) половинка представляет из себя весь скан.
Автор: shch_vg
Дата сообщения: 03.08.2009 18:23
chesskom
Спасибо, помогло!

qazazel

Цитата:
Как их сделать одинаковыми?

На вкладке Book в полях Page width и Page height значение Auto, а величины полей на странице задаются в H.Gap value и H.Gap value
+
на каждой странице на вкладке Page левее и правее Automargins всюду галочки (при Draft kromsate проставляются автоматически).
Автор: ghosty
Дата сообщения: 03.08.2009 18:59
qazazel

Цитата:
Еще вопрос? Почему после кромсания страницы имеют разный размер? Как их сделать одинаковыми?

Два способа: 1) рассчитать фиксированный размер страницы до обработки, обработав 10-15 пробных страниц - см. здесь п. 1.3.2.
2) обрабатывать без финализации и определить размер страницы уже после обработки - см. в шапке "Изменения в новой версии (5.92)..."

Sensile

Цитата:
Не очень поняла многоступенчатый процесс от monday2000. Как раз рядовому книгосканировщику он совершенно непонятен.

С инструкциями действительно есть проблема (отвечаю в том числе и тем, кто пишет мне в ПМ по этому поводу). Конкретно она состоит в том, что у каждого пользователя своя специфика работы, у каждого - разный материал, требующий разного подхода к обработке. Представления об удобстве работы у каждого также разные.
С другой стороны, если человеку случается обрабатывать 2-3 книги в год, ему абсолютно не хотелось бы, да и не стОит заморачиваться разными деталями. Нужна простейшая инструкция - нажал кнопку, получил результат.

Эти проблемы в имеющихся инструкциях не учитывались - почти всегда предлагался жестко заданный алгоритм, отражающий опыт конкретного человека. Я попытался решить эту проблему, вычленив тот минимум операций, без которых обработка немыслима. А все то, что раньше приходилось настраивать вручную, я вложил в профили (спасибо bolega за то, что прислушался в свое время и реализовал их - очень удобно).
Понятно теперь, что профили также в какой-то степени отражают именно мой опыт, хотя они и были составлены в том числе по рекомендациям автора и отзывам других пользователей. Поэтому еще раз призываю других участников делиться своими профилями и вносить исправления в существующие.


Цитата:
P.S. Кстати, интересно узнать, что понимается под "рядовым книгосканировщиком"?
Термин (далее РК) был впервые введен именно monday2000, и относится исключительно к нему самому, а также к некоей группе людей, существующей по большей части в его воображении (та инструкция, видимо, также понятна исключительно РКам). Поэтому я впредь буду обращаться к нему (к ним) на вы
К Вам же это понятие никакого отношения не имеет
Автор: shch_vg
Дата сообщения: 04.08.2009 11:36
bolega
Вопрос снят!
Автор: djdtyfhu
Дата сообщения: 04.08.2009 13:27
Что можно сделать со следюущим файлом

Семпл страницы (TIFF 12 МБ в архиве RAR)

Особенно интересует внутренняя сторона страницы, которая не плотно была прижата к сканеру, и поэтому получилась размытой.
Автор: Melirius
Дата сообщения: 06.08.2009 12:45
bolega

http://ifile.it/f7i36z2

На этом файле на левой половине разворота ни один метод deskew автоматом не выравнивает правильно, что очень странно, ибо чистый текст.
Автор: shch_vg
Дата сообщения: 06.08.2009 16:08
Melirius
В 5.93 сделал Draft kromsite со Split, затем сразу Process!, после чего и левая, и правая страницы выравнены нормально.
Автор: Melirius
Дата сообщения: 06.08.2009 17:21
shch_vg

Цитата:
Melirius
В 5.93 сделал Draft kromsite со Split, затем сразу Process!, после чего и левая, и правая страницы выравнены нормально.


Странно, у меня тоже 5.93, но угол слева пришлось определять и задавать вручную, на автомате SK недоворачивал, наклон примерно в градус оставался.

Проверил - глюк исчез, мама родная, что творится?
Автор: shch_vg
Дата сообщения: 06.08.2009 18:34
Melirius

Цитата:
Проверил - глюк исчез, мама родная, что творится?

М.б. это какая-то накопительная ошибка, которая после рестарта программы исчезает.
У меня сейчас тоже бывает, что делаю некоторое время циклические действия со сканами (загружаю в СК, затем объединяю их в ПДФ и т.д.) и получаю ошибку "Выход за границы ...". После рестарта все работает нормально.
Автор: bolega
Дата сообщения: 06.08.2009 19:31
djdtyfhu

Цитата:
Что можно сделать со следюущим файлом
Особенно интересует внутренняя сторона страницы, которая не плотно была прижата к сканеру, и поэтому получилась размытой

Вот что надо сделать:
http://ifolder.ru/13432257
Автор: shch_vg
Дата сообщения: 07.08.2009 11:39
bolega

Цитата:
Вот что надо сделать

Несколько вопросов по Вашему примеру.
1. Я стараюсь в свойствах не ч/б picture-зон всегда ставить DPI=600. На ч/б фото я замечал разницу при обработке при DPI=600 и DPI=Original. Для цветных зон это неважно?
Здесь же дополнительный вопрос: установка здесь DPI=Default означает 600?
2. По Вашему совету для таких зон включаю Inverse dithering и выключаю Bgr cleaner.
Получается, что для цветных зон это можно не делать?

И последнее. Не могли бы Вы дать краткое описание, что Вы хотели достигнуть каждым изменением дефолтных значений в задании. Думаю, это было бы поучительно не только для меня.
Автор: monday2000
Дата сообщения: 07.08.2009 16:46
bolega

В связи с разработкой новой методики http://www.djvu-soft.narod.ru/scan/sel_mask_color.htm нельзя ли добавить в СК такую фичу:

Дополнительный синтаксис экспорта координат Picture-зон в формате, как описано в пункте PS в конце http://www.djvu-soft.narod.ru/scan/sel_mask_color.htm + экспорт цвета раскраски для Picture-зон (Paint - Background).

То есть, чтобы экспортировались (в txt-файл) не только координаты - но ещё и цвет Picture-зоны.
Автор: chesskom
Дата сообщения: 07.08.2009 19:24
When final version SK?
Автор: djdtyfhu
Дата сообщения: 09.08.2009 19:15
bolega

Как-то упустил появление нового типа зон - Unsharp. Пытался делать с помощью Contrast zone.
Автор: shch_vg
Дата сообщения: 09.08.2009 22:31
bolega
Возможно об этом уже писали, но сегодня столкнулся со следующим.
В 5.93 нужно было повернуть цветную обложку с помощью Deskew. Установил косые резаки, но как при Color = Original, так и при всех цветных получался вариант в двух цветах - черном и белом, хотя в информации о выходном файле Colors = 16777216.
В 5.92 результат получился нормальным, но Deskew не сработал должным образом.

P.S. Заодно еще такая интереная вешь.
Если загружать в Сканкромсатор (наверное, любой версии), допустим сканы a1.tif, a2.tif, b1.tif, b2.tif, то они расположатся в окне файлов в таком порядке: a1.tif, b1.tif, a2.tif, b2.tif. Если же буквенные префиксы в именах файлов разной длины, то сортировка сначала по тексту.
Автор: Torino
Дата сообщения: 09.08.2009 23:04

Цитата:
озможно об этом уже писали, но сегодня столкнулся со следующим.
В 5.93 нужно было повернуть цветную обложку с помощью Deskew. Установил косые резаки, но как при Color = Original, так и при всех цветных получался вариант в двух цветах - черном и белом, хотя в информации о выходном файле Colors = 16777216.
В 5.92 результат получился нормальным, но Deskew не сработал должным образом.


http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=340#17


Цитата:
P.S. Заодно еще такая интереная вешь.
Если загружать в Сканкромсатор (наверное, любой версии), допустим сканы a1.tif, a2.tif, b1.tif, b2.tif, то они расположатся в окне файлов в таком порядке: a1.tif, b1.tif, a2.tif, b2.tif. Если же буквенные префиксы в именах файлов разной длины, то сортировка сначала по тексту.


Это при smart-sort?
Можно попробовать использовать by-name.
Автор: bolega
Дата сообщения: 09.08.2009 23:54
monday2000
OK, сделаю. Только учтите, что в СК два типа раскраски: текста и фона. Вывод в формате RGB устроит? Какой синтаксис?

shch_vg

Цитата:
Возможно об этом уже писали, но сегодня столкнулся со следующим

Да, это баг. Уже исправил.


Цитата:
Заодно еще такая интереная вешь

В диалоге выбра файлов можно указать тип сортировки: by name или smart (последняя вычленяет из имени цифровую составляющую и сортирует по ней). Сортировку также можно поменять уже после открытия.

============
Новая версия проходит тестирование. Отсканировал пару десятков книг и на них проверяю.
Автор: shch_vg
Дата сообщения: 10.08.2009 02:08
bolega

Цитата:
by name или smart (последняя вычленяет из имени цифровую составляющую и сортирует по ней).

А почему она не срабатывает, если префиксы разной длины?
Автор: monday2000
Дата сообщения: 10.08.2009 09:16
bolega

Цитата:
Только учтите, что в СК два типа раскраски: текста и фона.

Ну да на экспорт это без разницы - главное, чтобы у зоны был цвет. Можно, например, "раскраску текста" экспортировать - вроде как ближе по смыслу.

Цитата:
Вывод в формате RGB устроит?

Вполне.

Цитата:
Какой синтаксис?

Прошу примерно такой:

Если одна Picture-зона на странице:

0001.tif#000FF:274,1863,1224,608

Если больше одной:

0001.tif#000FF:274,1863,1224,608#АА000:123,843,244,2

Picture-зоны размером во всю страницу целиком - без координат:

0001.tif#000FF#АА000:123,843,244,2

Путь - достаточно относительного (абсолютный не нужен). Это будет как подсказка - внутри будущего DjVu страницы будут называться также, как и исходные файлы, только с расширением djvu: 0001.djvu, 0002.djvu, ... А если кодируемые файлы имеют имена 1.tif, 2.tif, 3.tif, ... - то получится 1.djvu, 2.djvu, 3.djvu, ...

Только смысл координат не такой, как сейчас, а слегка иной - как описано в п. "P.S." в конце http://www.djvu-soft.narod.ru/scan/sel_mask_color.htm .

Оформить можно как доп. пункт меню Zones -> Picture zone.

P.S. Метод официально утверждён Леоном Боту - так что данный синтаксис уже не поменяется.
Автор: bolega
Дата сообщения: 10.08.2009 11:29
monday2000

Цитата:
Если одна Picture-зона на странице:
0001.tif#000FF:274,1863,1224,608

Что значит #000FF:
И где тут цвет?
Я имел ввиду синтаксис цвета, а не зон. Последнее у меня уже отработано и таким и останется. Конвертировать к формату Боту особых проблем не составит.

Автор: monday2000
Дата сообщения: 10.08.2009 12:05
bolega

Цитата:
Что значит #000FF:
И где тут цвет?

Извиняюсь, опечатка. Не 000FF, а 0000FF. # - просто как разделительный символ.

Цитата:
Последнее у меня уже отработано и таким и останется.

Каким? Т.е. Вы не будете делать дополнительный пункт в меню - а лишь добавите в экспортируемую информацию цвета зон? В принципе, достаточно.

Добавлено:
При таком варианте неплохо бы ещё где-то рядышком выводить размеры страницы - удобно для пересчёта координат зон (иначе мне нужно будет из DjVu-файла эти размеры вытаскивать).
Автор: bolega
Дата сообщения: 10.08.2009 14:05
monday2000

Цитата:
а лишь добавите в экспортируемую информацию цвета зон?

Да. Мой формат огласитесь более понятный чем у Боту. У него вместо нижней координаты расстояние до края страницы - полный изврат. Выпендреж чистой воды.
Выводить буду оба цвета - иногда они заданы оба.

Цитата:
неплохо бы ещё где-то рядышком выводить размеры страницы

Я уже об этом тоже подумал

Плохо, что Боту не поддерживает непрямоугольных зон (мог бы через маску). Не люблю честно говоря разработчиков, которые сами себя ограничивают в функциональности, либо намеренно сводят ее к минимуму, заботясь о "чайниках" (как бы чего не недопоняли")
Автор: ghosty
Дата сообщения: 10.08.2009 18:35
bolega
Уже сообщал как-то об этом глюке - в режиме RV если после смены масштаба включить ластик, то масштаб возвращается к тому, который был прежде... Неожиданно
И еще один старый глюк - если в основном режиме вызвать окно Grey Enhance, а затем перейти в RV, то это окно перекроет окно RV, и закрыть его будет невозможно.

Да и маленькая просьбица: в статусной строке RV есть место для <номера страницы>/<общего кол-ва страниц> - просто чтобы знать, сколько еще мучиться с книгой осталось

Добавлено:
Сначала использовал Picture Zones, но затем поменял их на Contrast Zones. Несмотря на это файлы зон сохранились в папке. Т.е. в случае, если человек использовал как те, так и другие и в некоторых случаях менял одни на другие, то может получиться путаница...
Автор: bolega
Дата сообщения: 10.08.2009 21:32
ghosty

Цитата:
Уже сообщал как-то об этом глюке

Я тоже сообщал, что это не глюк
Именно так меня и просили сделать, кажется Arcand.
Сделаю как опцию.


Цитата:
И еще один старый глюк - если в основном режиме вызвать окно Grey Enhance, а затем перейти в RV, то это окно перекроет окно RV, и закрыть его будет невозможно

У Вас всегда так происходит? У меня это случается, но очень редко, когда много раз переключаешься на другие приложения. Мне даже кажется, что это какая-то глюкавая фича Windows. Например, то же самое происходит в Excel, если вызвать диалог поиска строки, потом переключитья на другое приложение, затем снова вернуться в Excel.


Цитата:
Сначала использовал Picture Zones, но затем поменял их на Contrast Zones. Несмотря на это файлы зон сохранились в папке

Такое поведение останется. Менять не буду. Бывает, что меняешь тип зоны случайно, по ошибке. И что, терять из-за этого уже обработанную и почищенную зону? А так ее можно просто переименовать и таким образом восстановить.
Вообще, на этот случай я предусмотрел команду Service->Delete unused files. Команда удаляет все неиспользуемые в задании файлы, находящиеся в исходной и выходной папках. Я ею всегда пользуюсь по окончании обработки. Очень удобно, т.к. бывают ненужные (неудачные)сканы, так же как и ненужные зоны. Перед удалением СК дает возможность просмотреть их. Удаляются файлы в корзину windows.

Предлагаю на время ввести мораторий на пожелания. А то я так никогда новую версию не закончу.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.