Ru-Board.club
← Вернуться в раздел «Программы»

» нужна программа для очистки фона в PDF

Автор: vladimir1974
Дата сообщения: 07.11.2006 21:42
Доброго времени суток.
Досталось мне пару книг в формате PDF все с серым фоном (явно без любви сканировали)
Читать очень тяжело, а тут понадобилось еще и пару глав распечатать
Может есть какой либо способ, почистить фон....
Автор: Cheery
Дата сообщения: 07.11.2006 21:44
vladimir1974

Цитата:
Может есть какой либо способ, почистить фон....

в adobe acrobat есть такая фича.
Автор: vladimir1974
Дата сообщения: 07.11.2006 22:11
в reader-е я ее чего то не нашел, или эта фича только во writer-е есть?
Автор: Cheery
Дата сообщения: 07.11.2006 22:11
vladimir1974

Цитата:
в reader-е я ее чего то не нашел, или эта фича только во writer-е есть?

я упоминал reader? я сказал, что в полном пакете.
Автор: vladimir1974
Дата сообщения: 07.11.2006 22:30

Цитата:
я упоминал reader? я сказал, что в полном пакете.


полный пакет, ине уже даже страшно стало... Ладно если других способов нет, пойду искать полный пакет....

Но все равно Большое спасибо
Автор: vladimir1974
Дата сообщения: 08.11.2006 18:18
я конечно извеняюсь, но сейчас поставил, adobe acrobat 7 но что то никак не получается убрать фон.
Может подскажешь в двух словах как это делается? или даш ссылку где это описывается (только плз не документацию на 500 стр. )
Автор: Cheery
Дата сообщения: 08.11.2006 19:14
vladimir1974
у меня уже 8 версия. что то вроде Document->Optimize Scanned PDF
Автор: Zakkazak
Дата сообщения: 08.11.2006 22:48
vladimir1974

Выбери команду Tools>Advanced Editing>TouchUp Object Tool
Затем перетакиванием выделяешь строки и нажимаешь Delete.

Цитата:
у меня уже 8 версия. что то вроде Document->Optimize Scanned PDF

В седьмой версии этой фичи нет, так что придётса по строкам, даже иногда по словам, такова специфика отсканированных доков. Цельных фонов для каждой страницы у них не бывает, по крайней мере у моих.

З.Ы. Лучше задай вопрос в ветке для Акробата и его плагов. Плаги возможно помогут автоматизировать удаление
Автор: Cheery
Дата сообщения: 08.11.2006 22:49
Zakkazak

Цитата:
В седьмой версии этой фичи нет, так что придётса по строкам, даже иногда по словам, такова специфика отсканированных доков. Цельных фонов для каждой страницы у них не бывает, по крайней мере у моих.

есть и в 7.. сам чистил, просто не могу сказать, как она называется точно.
Автор: vladimir1974
Дата сообщения: 09.11.2006 11:15
Zakkazak
что то мне не хочется верить, что это невозможно. Но 500 стр в одной книге и 800 в другой по странично делать не охота (легче поиздеваться над глазами и так почитать)

Cheery
Может вспомнишь плз. Честно глаза жалко (и катриджа тоже )

P.S. Cheery
обращаюсь к тебе как к модератору, несочти за невежество и нежелание подчиняться правилам, но думаю будет логично повторить мой вопрос в ветке по акробату.
Автор: Astra55
Дата сообщения: 13.11.2006 20:33
Короче так: поскольку в контейнере pdf находится все та же банальная растровая графика - если хорошо, то tif, если хреново (в большинстве случаев), то jpg, методы для нормальных pdf файлов не прокатят. И какое отношение вся эта ботва имеет к pdf, кроме расширения? Отсюда вывод - извлечь любым доступным способом графические файлы и обработать их самыми обычными методами. Что там делал Cheery, пусть останется на его совести, поскольку в любом Акробате нет инструментов для редактирования растровой графики. Если же паче чаяния Cheery захочет опровергнуть вышесказанное, то я буду только рад и с удовольствием поучусь этому чуду . Dixi.
Автор: dneprcomp
Дата сообщения: 14.11.2006 04:28
vladimir1974
Я конечно не Cheery, но 7-я версия у меня стоит.
Меню Tools-Print Production-PDF Optimizer
А уж что он там оptimizer и на сколько пробуйте сами
Автор: Cheery
Дата сообщения: 14.11.2006 04:42
Astra55

Цитата:
Если же паче чаяния Cheery захочет опровергнуть вышесказанное, то я буду только рад и с удовольствием поучусь этому чуду

демагогию развели, млин..
вот, в PDF optimizer
http://www.adobe.com/education/instruction/acrobat/pdfs/optimizer_tip.pdf

Цитата:
Scanned Page Settings
These settings work best with PDF documents that have been created from image
files using the Create PDF From… command.
This checkbox enables the other filters. It will override any image settings.
Deskew is set to automatically straighten scans that might have been rotated
slightly. This can also be set to the off position.
Background removal is used to remove specks of dust or shadows to help
sharpen the image.
Edge shadow removal helps remove edges that appear around text in color
or grayscale scans.
Despeckle helps to clean up images and text (similar to Background
removal).
Descreen helps remove small patterns that may exist from scans of printed
documents such as newspaper or magazine pictures.

Halo removal cleans up artifacts that occur around certain type characters.
Автор: Astra55
Дата сообщения: 14.11.2006 05:59
Ага, оно, конечно, оптимизирует и даже фон удаляет. Вопрос только в том, что от текста в этом случае остается. Если такое устраивает - да ради Бога, я не против. Только в любом растровом редакторе можно сделать нормальный вид, а не изъеденные буквы и серые пятна на страницах.
Автор: Cheery
Дата сообщения: 14.11.2006 06:11
Astra55

Цитата:
Только в любом растровом редакторе можно сделать нормальный вид, а не изъеденные буквы и серые пятна на страницах.

с 300 страницами вручную?
Автор: Astra55
Дата сообщения: 14.11.2006 08:23
Кто говорил про "вручную"? Для этой операции есть масса софта, он все сделает на автомате, но и не в один щелчок мышкой. Главная мысль моего сообщения - из серого или цветного текстового jpg без серьезной обработки черно-белый текст вытащить невозможно. Артефакты его сожрут настолько, что лучше оставить серым, хоть буквы нормально будут читаться. Поэтому операция по зачистке в Акробате смысла не имеет.
Автор: Gavkaet
Дата сообщения: 14.11.2006 10:04
Файнридером надо распознать...я б так попробовал
Автор: dneprcomp
Дата сообщения: 14.11.2006 10:50
vladimir1974 Astra55
Photoshop прекрасно очищает страницы с помощью фильтра Postorize.
Вполне вероятно, что такой же или подобный фильтр встроен в Acrobat. Да и сам Photoshop должен экспортировать pdf. Затем можно применить фильтр.

Автор: Astra55
Дата сообщения: 14.11.2006 15:09
Давайте не на уровне "вероятно", а либо "да", либо "нет". Нет и никогда не было в Акробате средств для редактирования растровых изображений, он не под них заточен в принципе. Что каcается ФотоШопа, то после открытия в нем скана pdf, он станет обычным растром и дальнейшая работа ничем не будет отличаться от того, что было сказано мной в самом первом посте. С одним нюансом - jpg после ФайнРидера потребует ресэмплинга и других операций, что опять таки не делается в пару щелчков мышкой, а результат будет получен не за несколько минут. Но будет, кто с этим спорит?
Автор: dneprcomp
Дата сообщения: 14.11.2006 18:54
Astra55

Цитата:
Давайте не на уровне "вероятно", а либо "да", либо "нет".

Давайте.
Откуда известно, что делает Acrobat при обращении к PDF Optimizer ? И чего он не делает?
Я исхожу из того, что программы делал один производитель. Соответственно, и функционал может быть одинаков. Adobe недоделки не производит. И если предлогает функционал, то рабочий.
А за 'да' или 'нет' к производителю. Или делать опыты.

Добавлено:
vladimir1974
Ну как, что-то очистилось в Acrobat?
Автор: Astra55
Дата сообщения: 15.11.2006 08:09
Если давайте, то открываем вкладку оптимизатора, и не находим там никаких органов управления с превьюшкой, без которых сделать ничего не получится. Хотя любой растровый графический редактор и многие вьюеры (тот же Ирфан) сделают подобную операцию влегкую. Кстати, мне пришлось после оптимизатора прогнать через Reduce file size, иначе размер "очищенного" pdf увеличивался в два с лишним раза. Может какой пункт не отметил, но примечательно, что есть два независимых пункта: Reduce file size - очень хорошая опция, и PDF Optimizer, с несколько иными функциями.
И еще раз повторяю - Акробат предназначен для вектора, каковым является pdf. Да, он может импортировать растровую графику, менять размеры рисунка, возить его по странице и и.д. Но сам рисунок фиксируется в момент импорта и с ним уже ничего не сделаешь. Сам девелопер для этого предназначает другие инструменты - свой же ФотоШоп и другие редакторы, часть из которых была куплена в последнее время, типа Корела и Макромедии.
Автор: dneprcomp
Дата сообщения: 15.11.2006 08:43
Astra55

Цитата:
Сам девелопер для этого предназначает другие инструменты - свой же ФотоШоп и другие редакторы
Почему бы просто не прочитать сообщение Cheery
на предыдущей странице
Цитата:
Background removal is used to remove specks of dust or shadows to help sharpen the image.
http://www.adobe.com/education/instruction/acrobat/pdfs/optimizer_tip.pdf
и после этого отправиться что-то доказывать людям из Adobe? Как видно они сами не понимают для чего предназначен Acrobat
PS. Как хорошо и для каких файлов все это работает совершенно другая история. Главное что такая встроенная функциональность в Акробате существует.
Автор: Astra55
Дата сообщения: 15.11.2006 12:22
Чтобы убрать фон, нужно всего лишь менять яркость, контраст и гамму, найти их оптимальные значения, которые сканировщик-дебил поленился выставить при сканировании и загнал всю эту грязь в pdf контейнер, а доблестный FR, поскольку не получил команды от того же дебила, сжал все со страшной силой в jpg. В Акробате НЕТ инструментов для подбора яркости, контраста и гаммы сканированных изображений. Я хорошо знаю английский и понимаю что такое "specks of dust or shadows", к сабжу оно имеет слабое отношение, поскольку тупо уберет все, что только можно, оставив изъеденные jpg буквы. Никому ничего не буду больше доказывать, имеющий глаза, да увидит.
Автор: dneprcomp
Дата сообщения: 15.11.2006 19:59
Astra55
Так с тобой никто о качестве и не спорит.
Автор: konik
Дата сообщения: 16.11.2006 00:20

Цитата:
Короче так: поскольку в контейнере pdf находится все та же банальная растровая графика - если хорошо, то tif, если хреново (в большинстве случаев), то jpg, методы для нормальных pdf файлов не прокатят. И какое отношение вся эта ботва имеет к pdf, кроме расширения?
- так разговор о картинках (нераспознанных) в контейнере пдф? Тогда действительно экспорт в док при помощи стороннего софта или встроенного в акробат плуга, мало толку даст. Но если там распознанный текст, только поверх серого фона, тогда вполне могли бы.

Цитата:
Главная мысль моего сообщения - из серого или цветного текстового jpg без серьезной обработки черно-белый текст вытащить невозможно. Артефакты его сожрут настолько, что лучше оставить серым, хоть буквы нормально будут читаться. Поэтому операция по зачистке в Акробате смысла не имеет.

А сканкромсатор? Вроде б исключительон под автообработку текстов (в том числе лево отсканенных) заточен.
Автор: vladimir1974
Дата сообщения: 17.11.2006 00:36
Я сильно извеняюсь, что такая интересная дискуссия проходит мимо меня, но честно, так получилось что не было времени.
Сегодня посмотрел, увидел различные предложени...
Попробовал на скорую руку, то что предложил dneprcomp но пока безрезультатно.
С помощью FineReader тоже не получилось, вернее последний виснит.
Потом если я могу из pdf файла текст копировать, значит как я понимаю это не картинка, а обработаный текст, просто комуто было лень довести работу до ума...
Или я не прав?
Завтра попытаюсь найти время, что бы продолжить эксперементы...

Страницы: 1

Предыдущая тема: Эмулятор ключа HASP4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.