Ru-Board.club
← Вернуться в раздел «Программы»

» Редактирование PDF файлов

Автор: unreal666
Дата сообщения: 16.12.2014 20:22
ComboFZ
http://rghost.ru/59714080
Автор: ComboFZ
Дата сообщения: 17.12.2014 01:30
unreal666
1. Оригинальный PDF открыть в Acrobat 11 (10-ка и ниже не пойдут), сохранить как PDF-A.
После, если нужно, с помощью модуля Preflight перевести PDF-A в обычный PDF.

2. Оригинальный PDF открыть в PixelPlanet PDFEditor Pro 2.0, создать рядом новый документ и копипастить текст из оригинала в новый документ.
Для многостраничных PDF, естественно, такой способ отпадает (если только чрез макрос).

http://sendfile.su/1062904
Автор: unreal666
Дата сообщения: 17.12.2014 03:30
ComboFZ
сенкс. 1-ый вариант прокатил, только файл стал немного больше.

Тогда еще вопрос.
Есть какой-нибудь плагин для акробата или прога, которые в нормальном (табличный или типа того) виде показывают инфу обо всех объектах/слоях и т.п. на странице (а желательно даже во всем документе) со всеми их хар-ками типа вид объекта, размер в байтах, вид сжатия, цветовое пространство и т.п. (для соответствующих типов объектов конечно свои хар-ки) ?
Автор: bookserg
Дата сообщения: 17.12.2014 08:55
ComboFZ

Цитата:
1. Оригинальный PDF открыть в Acrobat 11 (10-ка и ниже не пойдут), сохранить как PDF-A.
После, если нужно, с помощью модуля Preflight перевести PDF-A в обычный PDF.

У меня подобный вариант не прокатил...
Может что посоветуете, http://rghost.ru/59727358
Автор: DnSoft
Дата сообщения: 17.12.2014 12:04
unreal666
Цитата:
Проблема. Подобное уже проскакивало.
Есть файлик с кривыми шрифтами. Т.е. видится одно, а копируются другие символы. Большая часть из них - кириллические, но в некоторых шрифтах - и другие символы тоже косячные.

Проверил ваш файл bad-font-original.
Acrobat показывает текст нормально, но копировании текста получается "мусор".
Serif PagePlus X7 определяет, что используется Times New Roman Bold. Показывает и копирует текст в другие программы нормально.



Автор: feuerloescher
Дата сообщения: 20.12.2014 22:40

Цитата:
Можно (но неудобно) средствами самого Акробата:

Еще Print Production > Output Preview > Object Inspector
http://helpx.adobe.com/acrobat/using/previewing-output-acrobat-pro.html#view_information_about_the_content_of_a_pdf_document
Автор: ComboFZ
Дата сообщения: 21.12.2014 02:46
bookserg

Цитата:
У меня подобный вариант не прокатил...   Может что посоветуете, http://rghost.ru/59727358

Тяжелый случай.

feuerloescher

Цитата:
Еще Print Production > Output Preview > Object Inspector


Удобный инструмент, и не только по картинкам. Не знал. Спасибо.

Для Акробат XI Rus:
Инструменты > Допечатная подготовка > Просмотр цветоделения > Просмотр: Инспектор объектов
Автор: unreal666
Дата сообщения: 22.12.2014 12:34
А все-таки интересно.
Как после использования "Переопределение выбранных символов" в проге Infix сделать так, что полученный текст также нормально копировался/искался в других прогах?
Или эта фигня только для внутреннего пользования Infix?
Автор: oshizelly
Дата сообщения: 30.12.2014 02:22
В связи с документами PDF часто спрашивают, как, исправить испорченный документ. У меня сейчас экзотическая обратная задача: надо испортить документ PDF, но только часть, чтобы некоторые страницы (в начале или в конце или, возможно, в середине документа) оказались полностью нечитаемыми, но остальные страницы отображались бы нормально. (Долго объяснять, для чего именно это нужно, прошу поверить на слово, что не для баловства).

Я пробовал сделать так: взял обычный файл с документом PDF, открыл его в текстовом редакторе Notepad и заменил сигнатуру и несколько последующих строк кода в начале документа на произвольный набор символов. После этого попытался в Acrobat Professional объединить такой преднамеренно испорченный файл присоединить к другому, коректному документу. Получил закономерный отлуп: Acrobat отказался вставлять такой документ, сказал, что, мол, структура испорчена и т.п. Логично...

А как ещё решить задачу, чтобы структура не была испорченна?? Конечно, можно испортить документ-источник перед его "распечаткой" на виртуальный принтер, но это не очень удачное решение в моём случае. Есть ли другие варианты?

Заранее спасибо!
Автор: unreal666
Дата сообщения: 30.12.2014 03:33
oshizelly
1. Непонятно, что имеется в виду под нечитаемостью текста.
2. "чтобы структура не была испорченна". Что такое "структура"? Расположение блоков на странице?
Автор: oshizelly
Дата сообщения: 30.12.2014 13:32
unreal666 03:33 30-12-2014
Цитата:
1. Непонятно, что имеется в виду под нечитаемостью текста.

Вот, представим себе такую ситуацию. Скажем, адресат открывает документ, состоящий из 2-х страниц, и начинает его просматривать. После прочтения 1-й страницы он пытается перейти на 2-ю страницу - и получает сообщение об ошибке, что невозможно открыть страницу. Или другой вариант: он переходит к следующей странице и видит большой чёрный квадрат. Или много мелких прозрачных ромбиков. Или машинный код. Да что угодно, вариантов много.
Короче, нужно, чтобы получатель документа увидел, что из-за технического сбоя (вероятно, при создании документа) часть оригинального текста оказалась недоступна. Ясно, что здесь был какой-то текст - но какой именно, это установить совершенно невозможно без повторного обращения к отправителю.


Цитата:
2. "чтобы структура не была испорченна". Что такое "структура"? Расположение блоков на странице?

Нет, не совсем. Сделайте так, как я описал в предыдущем посте: берём любой обычный PDF-файл, открываем его в любом текстовом или HEX-редакторе (например, штатном Notepad) и удаляем сигнатуру и несколько последующих строк кода в начале документа. После этого пробуем открыть изменённый файл в любом PDF-пложении, например, Acrobat Professional. Вот тут нам сразу всё и объяснят про структуру файла.
Автор: unreal666
Дата сообщения: 31.12.2014 08:38
oshizelly
понятно. Ну так создай отдельно одностраничный pdf с пустым листом с черным квадратом. И потом просто замени нужные страницы этим одностраничным pdf.
Автор: oshizelly
Дата сообщения: 31.12.2014 09:52
unreal666 08:38 31-12-2014
Цитата:
Ну так создай отдельно одностраничный pdf с пустым листом с черным квадратом. И потом просто замени нужные страницы этим одностраничным pdf.

Была и у меня такая мысль. Но не совсем понятно, как это сделать технически. Просто скопировать из графического редактора? Думаю, это будет выглядеть слишком искусственно, то есть, даже не очень продвинутый юзер сразу поймёт, что это сделано нарочно.

А нужно, как я уже объяснил, чтобы это выглядело именно как случайный технический сбой при создании/сохранении документа. Лучше всего, наверное, было бы так, как я описал: после прочтения 1-й страницы адресат пытается перейти на 2-ю страницу - и получает сообщение об ошибке, что невозможно открыть страницу. Мне такие сбойные документы, кажется, встречались, но вопрос в том, можно ли такого результата добиться намеренно.
Автор: ixet
Дата сообщения: 08.01.2015 11:44
Требовалось недавно извлечь в Excel структурированный текст из pdf. На каждой странице типовая таблица с четкими столбцами, но они сформированы обычными текстовыми блоками. Перебрал все более-менее подходящие программы из шапки - все они при извлечении нарушали структуру таблиц, сдвигая текст в начало строки.
Помогла утилита PDF-Tools из пакета PDF-XChange Pro. При следующих настройках преобразования (сохранить как простой текст, добавлять одинарные пробелы) структура полностью сохраняется! А дальше txt загрузить в Excel и формулами или макросом данные раскидать по столбцам.
Думаю, эту информацию надо добавить в шапку.
Автор: DimitarSerg
Дата сообщения: 20.01.2015 23:58
Понадобилось поудалять некоторые страницы в пдф (копирайты) и пожать пдфки, отлично справился с задачей опенсорсный
http://sourceforge.net/projects/pdfjumbler/
(им удалял страницы + при сохранении чутка сжимает), потом прошёлся Advanced PDF Compressor 2012, рез-ты достаточно таки отличные:
31 пдф файл разных размеров, было 333 стало 182мб при том же качестве
Автор: silveradmin
Дата сообщения: 23.01.2015 00:50
после перехода в режим написания текстовых заметок в Infix, чаасть данных как квадратики чекбоксов - просто пропали. Подскажите, где искать причину или это особенность редактирования Infix с подобной потерей части данных?
Автор: bozsss
Дата сообщения: 11.02.2015 10:23
доброго времени суток!
у меня такой вопрос, как можно конвертировать файл PDF в файл HTM, только не так чтобы он распознавал, а чтобы лист картинкой сохранялся? надеюсь понятно выразился )))
Автор: ComboFZ
Дата сообщения: 12.02.2015 13:47
bozsss

Надо так понимать, чтобы текст нельзя было скопипастить?

В документе PDF переводишь текст в кривые ("курвление шрифтов").
Акробатовскими плагинами:
Enfocus PitStop Rus > Глобальные изменения > Шрифт > Преобразовать в кривые
IntelliPDF CURVES

или отдельным софтом:

PStill > More Options > Text Output Options > поставить галку в чекбоксе Alwaus convert text to graphics
Callas PDFToolbox > Fonts > Font to outlines

Виртуальные принтеры так же умеют курвить шрифты.

Дальше, полученный PDF со скурвленными шрифтами скармливаешь любому редактору или конвертеру, который умеет переводить PDF в HTML:
Acrobat
AnyBizSoft
(он же Wondershare) PDF Converter
Dawningsoft PDF2Htm
PDF Converter Elite
PdfGrabber Pro
SolidPDF Tools
Автор: bredonosec
Дата сообщения: 13.02.2015 18:03
ComboFZ
так всё равно ж любой окр распознает на счет раз...
Но мысль интересна. А какой получается размер дока? Больше, чем с текстом? Намного?
Автор: ComboFZ
Дата сообщения: 14.02.2015 02:14
bredonosec

Цитата:
...какой получается размер дока? Больше, чем с текстом? Намного?

В разы больше и качество страдает.
Автор: fergis12309
Дата сообщения: 18.02.2015 20:24
Подскажите пожалуйста в файле pdf есть какой то слой в виде водяных знаков или фона с текстом "www.nado.in", можно как то его удалить или распечатать файл без него?
http://m.turbobit.net/lif2fani4qmw.html
Автор: Mavrikii
Дата сообщения: 18.02.2015 20:36
fergis12309
ручками в любом pdf редакторе этот текст-ссылка удаляется (но муторно, так как много страниц)
Автор: RIKARDOYYY
Дата сообщения: 18.02.2015 20:54
fergis12309
Так подойдет? Ну а навигацию можете сделать сами, по своему разумению.
http://rghost.ru/private/8ZSlwXft9/0b45508ce1e4c1582d827b31e02c03b0

Mavrikii
Зачем же ручками, ежели есть струмент?
Автор: Mavrikii
Дата сообщения: 18.02.2015 20:56
RIKARDOYYY

Цитата:
Зачем же ручками, ежели есть струмент?

зависит от уровня владения струментом ))
родной не считает это водяным знаком..

можно, наверно, на js написать скрипт для поиска и удаления, но если разовая работа, то может проще руками.
Автор: RIKARDOYYY
Дата сообщения: 18.02.2015 21:01
Mavrikii
Infix PDF Editor 6 делает это. То есть и ищет и удаляет. Наверное, не во всех случаях может быть полезен, но, здесь - вполне нормально.
Автор: fergis12309
Дата сообщения: 18.02.2015 21:04
RIKARDOYYY
Спасибо за файл и совет!
Автор: galina2000
Дата сообщения: 19.02.2015 06:27
Подскажите пожалуйста, как можно пакетно удалить последнюю страницу в каждом из pdf-файлов?
Автор: sergio147
Дата сообщения: 19.02.2015 11:49

Цитата:
Подскажите пожалуйста, как можно пакетно удалить последнюю страницу в каждом из pdf-файлов?


A-PDF Page Master


Batch process -> Delete page(s)
Автор: galina2000
Дата сообщения: 19.02.2015 13:33

Цитата:
A-PDF Page Master


Как на вкладке Batch process выставить удаление 1 страницы с конца каждого документа? Документы все разные, в одном 2, а в другом и несколько сотен страниц, а нужно удалить только одну последнюю страницу с рекламой, которая весит больше всего остального документа.
Автор: sergio147
Дата сообщения: 19.02.2015 15:10
galina2000,

там же ж всё написано - ставьте -1 (минус один)




Добавлено:

Цитата:
а нужно удалить только одну последнюю страницу с рекламой, которая весит больше всего остального документа.


насчёт уменьшения веса - я бы не надеялся.

Но попробуйте, потом расскажете

Страницы: 1234567891011121314151617181920212223242526272829303132333435

Предыдущая тема: SSH-клиент на Java


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.