Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор (Часть 3)

Автор: Dimock
Дата сообщения: 23.05.2009 15:00
Bolega

Еще пара вопросов...
1. Чем отличается Save task от Create out-task?
2. После импорта словаря “Авиатехнические термины” в PDF в папке Tempsk появились страницы словаря в формате bmp. Это нужно для того чтобы про-грамма обрабатывала словарь по страницам в удобном для нее формате?
3. После Draft cromsate или после Process программа создала в папке Tempsk папку с именем словаря, где теперь лежат tiff-ы словаря. Там же есть и папка out. Здесь программа сохранит результат, т.е. словарь в формате PDF?

Добавлено:
У меня и входной, и выходной PDF-файлы защищены от копирования. Как можно снять защиту?
P. S. А я наивно думал, что файл после обработки изменится
Автор: bolega
Дата сообщения: 23.05.2009 16:31
Dimock
1. Save task сохраняет текущее задание. Create out-task создает новое задание, в котором исходными файлами являются выходные файлы (из папки out) текущего задания. Здесь задание только создается, копирования файлов не производится.

2. bmp - это временные файлы, нужные для создания pdf. Если бы Вы не прервали обработку, СК бы их сам удалил.

3.
Цитата:
После Draft cromsate или после Process программа создала в папке Tempsk папку с именем словаря

Ни то, ни другое. Эта папка создается при импорте pdf. Файлы, что там лежат - это импортированные страницы из pdf. И раз там они лежат, значит, защита от копирования не является препятстием для СК Что значит

Цитата:
выходной PDF-файлы защищены от копирования

я не понял. СК не создает защищенных pdf.
Автор: Dimock
Дата сообщения: 23.05.2009 18:05
bolega
Защита от копирования - это значит, что я не могу скопировать оттуда текст, а без этого этот словарь мне на фиг не нужен. Зачем мне 100 Мб замерзшего мяса.
Автор: VadimirTT
Дата сообщения: 24.05.2009 00:18
Dimock
Кромсатор обрабатывает графические файли и выдает на выходе их же, и в pdf загоняет графику и никакого текста для выделения мышкой или поиска естесственно там не будет. Что бы эту возможность активировать , нужны дополнительные телодвижения, как это сделать для djvu описано в пособии ScanAndShare из шапки, и нет никаких препятствий сделать текстовой слой и в пдф.
Автор: Dimock
Дата сообщения: 24.05.2009 12:46
VadimirTT
А где написано, как это сделать в PDF? Вам ведь тоже нужен этот словарь
Автор: VadimirTT
Дата сообщения: 24.05.2009 13:39
Dimock
я все больше djvu клепаю, кстати, почему бы Вам заодно и djvu вариант не сделать, делов то на 10 минут, но то что в pdf это сделать не сложно это наверняка, может кто откликнеться и посоветует куда стукнуться (здесь это оффтоп)
Автор: bolega
Дата сообщения: 28.05.2009 11:36
Помогите перевести на правильный английский такое сообщение СК:
"Страница файла возможно имеет "лоскутную" структуру. Выполнять объединение фрагментов для текущей и последующих страниц?"

Автор: ghosty
Дата сообщения: 28.05.2009 12:55
bolega
Если речь идет об объединении фрагментов на всех страницах без разбора, то, наверное, так:
One or more pages have 'fragmented' structure. Do you want to merge fragments on those pages?

Но лучше объяснить пользователю (в том числе и мне ), что значит "лоскутная" структура.
Автор: bolega
Дата сообщения: 28.05.2009 13:10
ghosty

Цитата:
что значит "лоскутная" структура.

Этот вопрос задается при импорте некоторых pdf. Такие pdf имеют необычное свойство: изображение там не цельное, а нарезано на горизонтальные полоски. До 5-20 полосок на страницу. Делают такое чудо некоторые МФУ.
Возможно, многие сталкивались с такими pdf. При прсомотре в Acrobat в режиме fit страницы как-будто испещрены тонкими горизонтальными черными линиями. Линии пропадают только при большом увеличении. На самом деле никаких линий нет, это результат неточной стыковки полос при малых увеличениях. Приоисходит это от того, что в pdf все координаты измеряются в дюймах, а не пикселях, поэтому при малых увеличениях идут большие ошибки округления при переводе акробатом координат в дюймах в пиксели на экране. Из-за этого начало отображения одной полоски не совпадает с концом предыдущей, и образуется черный провал в один-два пиксела.

Перевод мне понравился. Вроде бы понятен применитьно к тому, что я описал

Добавлено:
Version 5.93
Whats new

- Унифицированы диалоги импорта pdf и djvu. Добавлена возможность импорта произвольного набора страниц. Например 2-10,15-20,66-. Если после последнего тире не стоит номер, то он считается равным последнему номеру страницы в файле

- Улучшен импорт pdf

- Добавлен фильтр Smart blur (окошко Gray enhance)

- В опции picture-зон добавлен фильтр Smart blur

- При создании pdf можно использовать jpg2000-сжатие. СК использует хоть и demo, но полностью работоспособную версию кодека Kakadu. Кодек можно скачать по адресу http://www.kakadusoftware.com/Executables/Win32.zip
Из архива потребуются только два файла:
kdu_compress.exe – поместить в любое место на диске, путь к файлу прописать в настройках СК: File->Options->Apps->JPG2000 codec
kdu_v61R.dll – поместить в папку windows\system32

- Улучшен draft kromsate (автоматическая расстановка резаков)

- Добавлен новый метод бинаризации Auto. Работает хорошо в большинстве случаев. При Auto после обработки СК отображает вычисленное им значение порога. При необходимости можно переключиться на метод Custom, и подкорректировать порог, используя вычисленное значение при Auto как базис.

- Новый метод выравнивания освещенности Soft. Метод мягкий, не портит иллюстраций, но не такой чистящий, как Normal. Рекомендуется использовать метод Normal со значением Strrength=5 для страниц без иллюстраций и метод Soft для страниц с картинками. Метод Normal прекрасно удаляет локальные неровности, в том числе и избавляет от содержимого, просвечивающего с обратной стороны листа. Метод Soft такими свойствами не обладает.
Убран метод Aggressive. В ближайшей версии также будут убраны методы Combo и Smart, и возможно, Safe. При открытии заданий, в которых использовались упомянутые методы, они будут автоматически заменены на Normal, т.к. их действие практически идентично.

- В File->Options->Processing новая опция Crop page content at finalization stage. При включенной опции на стадии финализации контур страниц обрезается по текущим размерам с небольшим запасом. Запас задается в поле safe gap (в относительных единицах). КРАЙНЕ НЕ РЕКОМЕНДУЕТСЯ включать опцию Crop page!!! Это может привести хоть и к незначительным, но обрезаниям части букв!

- Новый метод despeckle – Safe50. Это вариация метода safe. Такой же безопасный как и safe, но чистит несколько лучше. Рекомендую для плохо-пропечатанных сканов, а также в при наличии букв с тонкими перемычками и разрывами всегда использовать метод Safe50. Метод можно задать как глобально для всей книги (на закладке опций Options), так и выборочно для отдельных страниц (Special на закладке опций Page).

- Все типы зон можно вращать мышкой. Для этого необходимо нажать Shift и подвести указатель мышки к любой вершине зоны. Как только форма указателя сменится на закругленную стрелку, нужно нажать клавишу мышки и движением производить вращение. Вращение происходит вокруг точки – геометрического центра зоны. Вращать можно как прямоугольные, так и непрямоугольные зоны, как в обычном режиме, так и в режиме редактирования вершин.
Таким образом, при отпущенном Shift, при указателе вблизи вершины, мышка изменяет положение вершины зоны (размер зоны), при нажатом Shift – поворачивает зону.

=======
Доделаю одну вещь (совместимость с Win2000) и выложу для тестирования
Автор: Olive77
Дата сообщения: 28.05.2009 14:57
bolega

Цитата:
Version 5.93
Whats new

Список весьма впечатляет.

Вот бы еще, для нас лентяев, имплиментацию автоматического выделения картинок. :rolled eyes:
А то стоит на очереди одна книженция. 700 страниц, и почти на каждой по 1, 2 картинки.
Автор: Dimock
Дата сообщения: 28.05.2009 21:50
VadimirTT
Как бы там ни было, я не буду конвертировать словарь в Дежавю.
Этот формат неудобен тем, что там нет функции поиска. Зачем мне такой словарь нужен?
Автор: VadimirTT
Дата сообщения: 28.05.2009 22:08
Dimock
поиск есть!
вообще то я предложил заодно и в djvu, а не вместо, раз уж есть обработанные сканы, там делов то, всего ничего
Автор: Dimock
Дата сообщения: 28.05.2009 22:28
VadimirTT
Наверно, потому что у меня стоит DjVuReader 2.0.0.26 (22 января 2005). Сайт - opendjvu.webhost.ru уже не работает.
А с авиационным словарем я запарился. Там защита от копирования текста стоит изначально, и на выходе она никуда не делась. Надо поискать ответы на эту тему.
Автор: ghosty
Дата сообщения: 28.05.2009 22:52
bolega
СПАСИБО, что находите время и силы для развития СК!


Dimock
Как это нету поиска - мы столько трудились, чтобы обеспечить поиск именно по DJVU, чтобы можно было делать полноценные словари с полноценным поиском - как по индексу, так и по тексту - и Вы теперь хотите от всего этого отказаться? Есть замечательный WinDjView, в котором есть поддержка DJVU-словарей, причем поисковой индекс встраивается непосредственно в файл DJVU, есть DjvuDic (оболочка для плагина). Изучайте
В PDF такого нет...
Автор: Dimock
Дата сообщения: 29.05.2009 10:11
М. б., это уже обсуждалось: Не могу выровнить "прыгающие буквы" - http://slil.ru/27705417
Автор: Dimock
Дата сообщения: 29.05.2009 12:15
В процессе Draft cromsate (резаки Left, Right, Internals) появилась такая ошибка -
Access violation at address 007B2776 in module 'sk.exe'. Read of address 047DFFE0.
Автор: VadimirTT
Дата сообщения: 29.05.2009 23:38
Dimock
посмотрите _http://ifile.it/i716fke
Автор: Dimock
Дата сообщения: 30.05.2009 12:28
VadimirTT
У меня этот словарь тоже до буквы К, кажется, обрабатывается, но в оригинале-то все буквы представлены! Будем дальше думать.
Автор: Dimock
Дата сообщения: 31.05.2009 15:23
Сейчас делаю бесплатный англо-русский разговорник под Лингво из старых файлов tiff (я уже начал как-то над ним работу, но потом забросил). Обработал в СканКромсаторе, осталось распознать и экспортировать его в Файнридере. Но вдруг он перестал работать, наверно, опять из-за вирусов. С остальными версиями то же самое. Прошу помочь, кто может. Пишите в ПМ, вышлю ссылки на куски словаря. Всего чуть больше 300 страниц. Надо будет распознать и экспортировать в Ворд PDF-файл.
Общественность Руборда будет Вам благодарна.
Автор: Gajver100
Дата сообщения: 31.05.2009 23:57
НАРОД! ПОМОГИТЕ ХРИСТА РАДИ!

Нужно обработать в СК три файла (квитанции), два скана с цветными линиями красного цвета. Нужно чтобы поля сохранились как в оригинале. Очень нужно, помогите люди добрые...

http://slil.ru/27712655

С уважением, Василий.
Автор: AndroS
Дата сообщения: 01.06.2009 05:28
Gajver100

По-моему, 3 файла проще в любом редакторе (типа фотошопе) руками сделать...
Автор: Dimock
Дата сообщения: 01.06.2009 19:40
bolega
Не плохо было бы сделать в КромСаторе экспорт в Word
В одной книге, обработанной СК, на страницах, которые состоят из одной целой страницы и половинки другой, не работает internal margin. Почему?
Автор: Torino
Дата сообщения: 02.06.2009 15:45
Существует ли в СК возможность установив опции обработки для одного файла, затем скопировать их на остальные файлы задания?
Автор: bolega
Дата сообщения: 02.06.2009 16:19
Dimock

Цитата:
не работает internal margin.

Что значит "не работает"? Не понятно, о чем именно речь идет.

Torino

Цитата:
Существует ли в СК возможность установив опции обработки для одного файла, затем скопировать их на остальные файлы задания?

Явно всех сразу - нет.
По отдельности - можно. У каждой опции в контекстном меню есть команда Apply to all marked.
Исключение - все опции закладки Quality, включая все Grey enhance. Эти опции клонируются все разом, если команду Apply to all marked вызвать из меню опции Enhance image (закладка quality).
Есть и неявный способ копирования всех опций:
File->Profiles. Нажать там Fill from current и затем Apply. Но такой способ не учитывает развороты, т.е. если скан разворот, то всем его правым половинкам присвоятся текущие опции левой половинки.
Все эти способы не копируют положения резаков.
Если же и резаки должны стоять везде одинаково, то тогда все намного проще. В этом случае скопировать можно действительно все опции.
Автор: ghosty
Дата сообщения: 02.06.2009 16:29
Torino
Конечно. Попробуйте щелкать мышью на опциях, зажав Ctrl или Alt. К примеру, чтобы скопировать все настройки в закладкке Quality, необходимо снять галочку Enhance Image, затем зажать Ctrl и вновь установить галочку, затем выбрать в появившемся меню нужный пункт.
А вот как и зачем использовать Options Clipboard, до сих пор не знаю
Автор: bolega
Дата сообщения: 02.06.2009 16:56
ghosty

Цитата:
необходимо снять галочку Enhance Image, затем зажать Ctrl и вновь установить галочку

Проще все таки через контекстное меню


Цитата:
Options Clipboard

Это тоже для копирования опций. Позволяет копировать заданный набор опций, т.е. не одну, не все, а несколько выбранных. Кроме того, наборы сохраняются в файле задания и их можно использовать в следующих сеансах
Автор: ghosty
Дата сообщения: 02.06.2009 17:09
bolega

Цитата:
Это тоже для копирования опций.

Просто не совсем очевидно, как их туда копировать - к примеру в Background Cleaner если Clean Exclude Zones активировано, то оно почему-то не записывается в клипборд, если не активировано, то наоборот записывается...
Автор: Torino
Дата сообщения: 02.06.2009 22:37

Цитата:
Это тоже для копирования опций. Позволяет копировать заданный набор опций, т.е. не одну, не все, а несколько выбранных. Кроме того, наборы сохраняются в файле задания и их можно использовать в следующих сеансах

Вот это надо было, спасибо!
Про ctrl и alt я в курсе
Автор: nuOK
Дата сообщения: 04.06.2009 23:01
Разворот книги в сером 7,7 Мб размеры чуть меньше А4. расставил маркеры.
Настройки обычные - выходной файл в 600 dpi.
Запускаю кромсатор 5.92- "Недостаточно памяти для обработки команды"
5.91 - " Out of memory".
Кто подскажет, что делать?
Автор: bolega
Дата сообщения: 04.06.2009 23:38
nuOK
Какое dpi показывает кромсатор?. Похоже, что dpi сканов неверно (сильно занижено)

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102

Предыдущая тема: мнение о Maxthon


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.