Ru-Board.club
← Вернуться в раздел «Программы»

» ScanKromsator СканКромсатор

Автор: Arcand
Дата сообщения: 05.07.2007 19:01
ignatav
А какая разницца - сканирование, обработка и СК этта одно и то же.
ЗЫ: исправил, было неприлично
Автор: shch_vg
Дата сообщения: 09.07.2007 12:37
Только что закончилось обсуждение рваных букв после обработки Кромсатором, как я снова столкнулся с похожей проблемой. Обрабатываю страницу с фотографиями в 300дпи грей, имеющими подписи. Визуально буквы все в исходном скане сплошные, без разрывов. В Кромсаторе на закладках Convert и Quality все по дефолту, despecle отключен. На закладке Files DPI=600, Color=B/W. На выходе буквы в подписях разорванные, имеющийся фон исчез.
Что приводит к такому результату, и что надо сделать, чтобы избежать разрывов в буквах. Пробовал по-разному менять разные параметры в указанных закладках, но т.к. делал это методом тыка, то ничего путного не добился.
Буду благодарен за любую помощь в решении этой проблемы.
Исходный скан тут. (179 кб)
Автор: Alexx S
Дата сообщения: 09.07.2007 12:52
shch_vg
Мне кажется, опять что-то с настройками сканирования не так

Красиво уже не будет... Попробовал: http://rapidshare.com/files/41879834/0001.zip.html
Автор: kadik
Дата сообщения: 09.07.2007 13:04
Alexx S
А это где ты сделал?
Автор: Alexx S
Дата сообщения: 09.07.2007 13:13
kadik
Как где? В Кромсаторе

Сonvert: User=190

Correct Illumination: Normal; Strength=1, Iterations=1; Adgust histogram=on, Protect pure colors=on
Автор: shch_vg
Дата сообщения: 09.07.2007 13:13
Alexx S
К сожалению, в ближайшее время прорваться на рапиду не представляется возможным, поэтому ознакомиться с Вашим вариантом смогу только вечером .
Мне бы не красиво, а пристойно
Изначально эта страница сканировалась 150 дпи в цвете 24-бит. Я переводил ее Кромсатором сначала в 300 грей.
Автор: Alexx S
Дата сообщения: 09.07.2007 13:26
shch_vg
Могу еще куда-нибудь залить...

Добавлено:
Кстати, переводить не надо было, надо сразу указывать 600дпи, BW. Мне кажется, так лучше будет
Автор: U235
Дата сообщения: 09.07.2007 13:32
shch_vg

Цитата:
Что приводит к такому результату, и что надо сделать, чтобы избежать разрывов в буквах.

Вот и причина:

Цитата:
Изначально эта страница сканировалась 150 дпи


Автор: shch_vg
Дата сообщения: 09.07.2007 13:57
Alexx S
Хорошо бы на ifolder.ru.
Если же в Кромсаторе надо установить только то, что Вы написали выше, то можно и не выкладывать, т.к. я его посмотрел. Кстати схожего результата я добился без Illumination и Сonvert, а только с помощью включения Backgroud cleaner и задания Sensitivity=55. Правда буквы чуть похуже.
Попробую Ваш совет сразу 600дпи, BW, правда в свойствах picture-зоны нет ни учетверения дпи, ни выбора 600дпи.
U235
Причина понятна, но т.к. исходно скан снова не мой, а был сделан для вставки в книгу как цветной в 150, то я спрашивал, что сделать в Кромсаторе! (а то здесь за сканирование ругают )


Автор: Arcand
Дата сообщения: 09.07.2007 14:47

Цитата:
Вот и причина:

Цитата:Изначально эта страница сканировалась 150 дпи

Вторая по значимости причина - очень похоже, что сканировалось в jpg невысокого качества.


Добавлено:

Цитата:
Кстати, переводить не надо было, надо сразу указывать 600дпи,
Я читал совет, что в случае значительного ресемплинга, его лучше разбить на несколько раз.

До кучи мой вариант обработки

Кстати, отсканировано ИМХО нормально, дефекты только из-за низкого разрешения и качества jpg.
Автор: shch_vg
Дата сообщения: 09.07.2007 15:24
Arcand
Спасибо за Ваш вариант, у него более ровные буквы.
Не могли бы привести Ваши настройки Кромсатора?
Автор: Arcand
Дата сообщения: 09.07.2007 15:35
shch_vg
Приношу глубокие извинения, сделал в Корел из любопытства.
Автор: Alexx S
Дата сообщения: 09.07.2007 15:51
Arcand

Цитата:
Приношу глубокие извинения, сделал в Корел из любопытства.

ну, тут вы с Кромсатором норздря в ноздрю идете... Однозначного преимущества не вижу
Автор: Arcand
Дата сообщения: 09.07.2007 16:09
Alexx S
Для "однозначного преимущества" какой-либо стороны нужны "умные" обработки на базе OCR.
Автор: Varyag2
Дата сообщения: 10.07.2007 18:57
Уважаемые специалисты! Подскажите, пожалуйста, можно ли с помощью сканкромсатора привести размеры обработанных страниц к одинаковому размеру, если исходные файлы имеют разное разрешение? Попался пдф, в котором часть страниц с разрешением 150 дпи, а часть 300 дпи.
Нужно ли перед обработкой кромсатором таких разномастных страниц выполнять им коррекцию дпи?
На закладке "Book" устанавливал "Units"=10*мм, не помогло. Затем сделал коррекцию дпи для всех страниц пакета прогнал кромсатором ещё раз, и опять ничего толкового.

С уважением.
Автор: afandi
Дата сообщения: 10.07.2007 23:01
Народ может кто ни будь скинет линк на скачку кромсата в личку
Автор: kadik
Дата сообщения: 10.07.2007 23:15
afandi

Цитата:
Народ может кто ни будь скинет линк на скачку кромсата в личку

А в шапке что, информация не действительна?
Автор: shch_vg
Дата сообщения: 11.07.2007 16:24
Varyag2
Загрузите в Кромсатор все страницы, выберите все страницы с 150 дпи, на закладке
Воок задайте параметры Fixed, равные размеру страницы в 300 дпи.
На закладке Files задайте параметр Output prefix=*, а параметр DPI=300 и запустите обработку выбранных страниц. После этого все страницы будут в 300 дпи.
Автор: Varyag2
Дата сообщения: 11.07.2007 20:46
Большое спасибо, shch_vg!
Разобрался (сам начудил (коррекция дпи всё и попортила) и запутался).
Заново вытащил тифы из пдф'а, и всё сработало как надо.
Может быть Вы подскажете, как из пдф'а извлечь изображения (страницы) с минимальной потерей качества?

Автор: shch_vg
Дата сообщения: 11.07.2007 21:42
Varyag2

Цитата:
Может быть Вы подскажете, как из пдф'а извлечь изображения (страницы) с минимальной потерей качества?

Что такое "с минимальной потерей качества" я не знаю. Лично я вытаскиваю с помощью программы PDF Extract TIFF v2.0, а можно сразу в Кромсатор, правда последний это не поддерживает, нужен 5.6А, да я и не уверен, возьмет ли он пдф-ки, сделанные в последних Акробатах.
Автор: Varyag2
Дата сообщения: 12.07.2007 07:02

Цитата:
Что такое "с минимальной потерей качества" я не знаю. Лично я вытаскиваю с помощью программы PDF Extract TIFF v2.0, а можно сразу в Кромсатор, правда последний это не поддерживает, нужен 5.6А, да я и не уверен, возьмет ли он пдф-ки, сделанные в последних Акробатах.


Однвжды на мехматовском фруме в разделе "создание электронных книг"
мне попалось вот такое сообщение:

"В Acrobat Pro есть меню batch processing (BP), там нужно создать свою последовательность, включив в нее только export image. Там же указывается формат тифа для разных типов картинок (для цветных, для ч/б, для серых). Эта последовательность навсегда останется в Вашем акробате, так что ее можно будет вызывать когда угодно. Какой файл потрошить, - она сама будет предлагать диалог выбора файла.
Только не используйте для потрошения команды меню File (save as, export), т.к. они, в отличие от BP, не извлекают картинки, а рендерят их, причем как правило с ухудшением качества".

У меня на компе стоит Acrobat Pro, но я не смог найти в нём меню batch processing (BP), вот почему я и задал такой вопрос.

Автор: ugk_4088
Дата сообщения: 12.07.2007 07:24
У меня стоит Adobe Acrobat 7.0 Professional команда Batch Processing находится в меню Advanced.

Добавлено:

Цитата:
2) При просмотре результатов и чистке приходится использовать, в основном, только режимы Fit width и Fit page. Хотелось бы оперативно переключаться между ними одной (и той же!) кнопкой (наверное, можно использовать имеющуюся "Fit image") и "горячей клавишей" (ну это уж сам пользователь благодаря Вам может настроить). Конечно же, установленный по этой кнопке режим должен сохраняться при листании - сейчас Fit image надо применять для каждой новой страницы.

Поставил на горячую клавишу команду Fit image, но при просмотре результатов она не работает. А ведь она чаще всего используется при редактировании. Можно ли еще как то изменить шаг при использовании команды подвинуть изображение? Хотелось бы чтобы это было в настойках программы.
Автор: Varyag2
Дата сообщения: 12.07.2007 09:18

Цитата:
У меня стоит Adobe Acrobat 7.0 Professional команда Batch Processing находится в меню Advanced.


У меня 8.0.
В Advanced есть Document processing, а в нём этот самый BP.
Но как правильно его запустить?
Слишком много всяких настроек, от которых голова кругом:

batch processing (Acrobat8.0) mht 230 kb.
Может быть кто-нибудь поможет подобрать наиболее оптимальную конфигурацию для PB и научит как его запустить?
Автор: djdtyfhu
Дата сообщения: 14.07.2007 18:36
Varyag2

Цитата:
Может быть Вы подскажете, как из пдф'а извлечь изображения (страницы) с минимальной потерей качества?


Для этих целей использую FineReader:
1. Загружаю PDF в FineReader
2. Потом в меню Файл-Сохранить результаты-Сохранить изображения выбираю формат, качество и сохраняю.
Автор: kadik
Дата сообщения: 14.07.2007 18:48
djdtyfhu

Цитата:
Varyag2

Цитата:Может быть Вы подскажете, как из пдф'а извлечь изображения (страницы) с минимальной потерей качества?


Для этих целей использую FineReader:
1. Загружаю PDF в FineReader
2. Потом в меню Файл-Сохранить результаты-Сохранить изображения выбираю формат, качество и сохраняю.


Анологично.
Парился правда с качеством.
Автор: Varyag2
Дата сообщения: 14.07.2007 20:24

Цитата:
Для этих целей использую FineReader:
1. Загружаю PDF в FineReader
2. Потом в меню Файл-Сохранить результаты-Сохранить изображения выбираю формат, качество и сохраняю.


Сколько уже говорено переговорено про файнридер, который при своём автоматическом выравнивании страниц их корёжит, а Вы опять про него.

перекошенное изображение jpeg gray 300 dpi 16 kb
оно же автоматически выровненное файнридером jpeg gray 300 dpi 16 kb
На выровненной файнридером картинке отчётливо видно, как он покорёжил буквы, а это очень негативно сказывается на объёме файла кодированного в дежавю (алгоритм дежавю кодировщика заточен под поиск одинаковых по начертанию символов и чем больше будет таких уродцев, тем больше будет объём дежавю файла).
Автор: Lykas
Дата сообщения: 14.07.2007 22:54

Цитата:
Может быть Вы подскажете, как из пдф'а извлечь изображения (страницы) с минимальной потерей качества?
Попробуйте открыть PDF кромсатором. В его(SK) temp-папке, в папке с исходным названием будут лежать все страницы в формате BMP c исходными размерами. Правда, 24-битовый, так что места займет хорошо. Я так понял, что выцепляет со страницы всю графику. Если PDF-OCR, то этот способ не поможет.
Автор: djdtyfhu
Дата сообщения: 15.07.2007 07:54
Varyag2

Цитата:
Сколько уже говорено переговорено про файнридер, который при своём автоматическом выравнивании страниц их корёжит, а Вы опять про него

А что он разве и при простом добавлении файлов в свой проект этим дурным делом занимается?. Если так, то все отказываюсь от такого метода сохранения изображений из файлов PDF.

P.S. Правда я так делают только для распознавания оглавлений и последующей вставки в уже готовый PDF.
Автор: Varyag2
Дата сообщения: 15.07.2007 09:15

Цитата:
А что он разве и при простом добавлении файлов в свой проект этим дурным делом занимается?. Если так, то все отказываюсь от такого метода сохранения изображений из файлов PDF.


Именно так: при любом добавлении изображений в пакет файнридер их автоматически выравнивает. Эта процедура в файне зашита намертво и отключить её нельзя.
Обрашался к девелоперам с AABBYY Finereader, они обещали в новой девятой версии файна либо починить "кривое" выравнивание, либо дать возможность юзверю самому отключать его.
Автор: shch_vg
Дата сообщения: 16.07.2007 13:45
bolega
Делаю копирование одного фрагмента страницы на другое место.
Перемещением трудно попасть точно на нужное место. Было бы удобно, если бы при крестообразном курсоре на перемещаемом фрагменте с помощью стрелок вверх, вниз, влево и вправо попиксельно можно было бы смещать фрагмент в нужном направлении.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: MSN Search Toolbar with Windows Desktop Search


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.