Ru-Board.club
← Вернуться в раздел «Программы»

» Редактирование PDF файлов

Автор: luxor
Дата сообщения: 13.05.2016 09:11
unreal666

Вы мне предлагаете ещё поставить Acrobat Pro? Я правильно понимаю?
А из того, что я перечислил ничего не сгодится?
Автор: ipmanyak
Дата сообщения: 13.05.2016 09:20
нарыл на просторах инета бесплатный PDF редактор http://pdfedit.cz/en/index.html
Может кому пригодится, сам не юзал.

Код: PDFedit is a free open source pdf editor and a library for manipulating PDF documents, released under terms of GNU GPL version 2. It includes PDF manipulating library based on xpdf, GUI, set of command line tools and a pdf editor.
Автор: unreal666
Дата сообщения: 14.05.2016 03:35
luxor
как вариант еще просмотрщик PDF-XChange Viewer. У него тоже самое есть.

ЗЫ.
Может подобное даже в Acrobar Reader есть - фиг его знает, его у меня нет.
Автор: Narak_zempo
Дата сообщения: 28.05.2016 12:10
Подскажите, как обрезать страницы в Akrobat? То есть не кадрировать, а именно обрезать - с удалением всего, что находится на обрезаемой области, и инфы о предыдущем размере страниц.
Автор: chatt
Дата сообщения: 28.05.2016 18:48
Как вытащить из распознанного файнридером PDF тесктовый слой, чтобы его вставить в картиночный pdf ? (Нужно, чтобы избежать потери качества при пересжатии)
Тут можно сделать текстовый слой скрытым? http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=1480#8
Автор: corrector
Дата сообщения: 28.05.2016 20:27

Цитата:
Подскажите, как обрезать страницы в Akrobat? То есть не кадрировать, а именно обрезать - с удалением всего, что находится на обрезаемой области, и инфы о предыдущем размере страниц.

Narak_zempo
Я делаю так:
а) Кадрирую (в Adobe Acrobat);
б) Результат перегоняю в ps (через Сохранить как другой... => Другое => PostScript);
в) С помощью Adobe Acrobat Distiller перегоняю ps-файл обратно в pdf.
В результате получается файл с обрезанными полями с полной утратой всего, что оставалось на обрезанных полях.
Прмечание: чтобы не затереть исходный файл, нужно промежуточный файл (после шага а, либо после шага б) переименовать.

Добавлено:
chatt

Цитата:
Как вытащить из распознанного файнридером PDF тесктовый слой, чтобы его вставить в картиночный pdf ? (Нужно, чтобы избежать потери качества при пересжатии)


Здесь(мое предложение Petrik_Pjatochkin'у) и следующие посты.
Автор: Narak_zempo
Дата сообщения: 28.05.2016 21:09
Спасибо, получилось
Автор: chatt
Дата сообщения: 28.05.2016 21:40
После наложения в PDF-XChange текстовый слой виден?
Средствами Сallas pdfToolbox тоже можно накладывать один пдф на другой, но оба слоя видимые, со смещением, читать невозможно.

Добавлено:
Не нашел, как в PDF-XChange наложить один на другой. Объясните, пожалуйста.
Есть картиночный пдф и есть текстовый. Нужно постранично наложить, но чтоб текстовый не был виден.
Автор: corrector
Дата сообщения: 29.05.2016 01:23
chatt
Это делает не PDF-XChange Viewer, а PDF Tools (Перекрывающий pdf в главной панели) из комплекта PDF-XChange Editor.
Автор: chatt
Дата сообщения: 29.05.2016 09:44
Спасибо, понял.
Но у меня не получилось наложить картиночный поверх текстового (извлеченного из пдф ФР12)
Текстовый слой все равно виден. А он не идеален.
Автор: corrector
Дата сообщения: 29.05.2016 11:03
В PDF Tools делаю так:
Иду в "Перекрывающий PDF" => Добавить => выбираю файл с текстовым слоем => Далее => "Файл перекрытия" => выбираю файл с графикой => не забыываю поставить галочку в "Поместить файл перекрытия на передний план" => Далее => выставляю параметры в панели "Параметры PDF" (это параметры для файла склейки) => Далее => указываю папку назначения (папка, куда будет помещен результат склейки; обычно удобно просто выставить галочку "Разместить в исходной папке") и выбираю имя для файла склейки => наконец, кнопка "Процесс". Все - нажимаю "Завершить" (и возвращаюсь в главное окно программы).
Иду в исходную папку, открываю файл склейки, любуюсь...
Автор: chatt
Дата сообщения: 29.05.2016 11:14
Я делаю все идентично, галочки не забываю. Но не получается так, как надо
Вопрос лишь в том, что из pdf (текст под изображением), сделанного ФР12 Сallas извлекает отдельно текстовый pdf, в котором текст отображается. А если из pdf, который сохраненен ФР9 - то текст скрытый и проблем с наложением вообще нет.

В Вашем txt.pdf текст скрытый или нет?
У меня текст виден (ФР12).

Кроме PDF Tools, пробовал pdftk, да и тот же Сallas pdfToolbox может наложить pdf друг на друга, но это работает адекватно только если в txt.pdf текст скрытый (ФР9).
Как его таковым сделать?
Автор: corrector
Дата сообщения: 29.05.2016 13:39
У FR12 текстовый слой - видимый. Управлять видимостью слоя умеет Adobe Acrobat, но подробно расписать не могу - не приходилось использовать (ищите в Справке АА). Я распознаю больше с помощью FR8 и такой проблемы там не всплывает. Может быть, управлять видимостью умеет и Сallas pdfToolbox (у него в Switchboard есть раздел Layers - покопайтесь там), не пробовал.
Добавлено
Долго искал рекомендации Astra55 по манипуляциям со слоями в Adobe Acrobat (связанными с внедрением текстового слоя в pdf ). Наконец-то нашел:
вот она - Инструкция от Astra55. Может быть, она Вам поможет и облегчит жизнь.
Автор: ComboFZ
Дата сообщения: 31.05.2016 21:31
corrector

Цитата:
Долго искал рекомендации Astra55...

На предыдущей странице chatt давал ссылку на этот пост.

Вариант А не рабочий для Акробат, т.к. слой текста добавляется только к активной страничке в окне, здесь в теме об этом уже говорилось: Ссылка

chatt

Цитата:
У меня текст виден (ФР12)


Выложите примеры оригинальных картинок и примеры, что в итоге у вас получается после вставки OCR-текста от FineReader в оригинальный растр. Иначе бессмысленно что-то вам советовать.
Похоже, что оригинальный растр у вас в виде маски изображения, поэтому OCR-текст просвечивает через него. Такое бывает после конвертирования DjVu в PDF с помощью утилиты DjVuToy.


Цитата:
это работает адекватно только если в txt.pdf текст скрытый (ФР9).   Как его таковым сделать?

Лучше всех с этим справляется плагин Pitstop Pro через свой Action (Список действий). Он просто отключает векторную заливку шрифта со всего документа или его части, при этом поиск по OCR-тексту и копипаст работают.

Вообще, не рекомендую отключать шрифтовую заливку, т.к. некоторые PDF-вьюверы глючно показывают такие PDF-ки. Лучше сделать белую векторную заливку между OCR-текстом и оригинальным растром (картинками).
Автор: corrector
Дата сообщения: 01.06.2016 16:53

Цитата:
corrector

Цитата:
Долго искал рекомендации Astra55...

На предыдущей странице chatt давал ссылку на этот пост.

Да, зарапортовался...
Когда одновременно правишь сканы в 2-х ScanTeilor'ах, OCR в FineReader'e и одним глазом посматриваешь в эту тему, иногда мозг кратковременно отключается и некоторые действия происходят на автопилоте. Надо отвлечься...
Автор: tramparamparam02
Дата сообщения: 20.06.2016 16:25
Внезапно оказалось, что Acrobat Pro не позволяет скопировать в буфер обмена несколько выделенных или все комментарии из документа. Можно открывать и копировать комментарии по одному, но если документ большой и комментов много, то это работа на несколько часов

Также Acrobat Pro не умеет экспортировать комментарии в какой-нибудь стандартный формат (простой текст, RTF, HTML, MS Word и т.п.).

Хотя казалось бы, обе фичи весьма востребованы и вряд ли технически сложны для реализации.

Подскажите, позволяет ли это сделать какой-нибудь из остальных редакторов или просмотрщиков PDF-файлов?
Спасибо!
Автор: ComboFZ
Дата сообщения: 20.06.2016 20:58
tramparamparam02
C комментариями, в том числе их экспортом/импортом, умеют работать:
Nitro Pro Enterprise 10
Nuance PDF Converter Pro 7
PDF-XChange Editor 6


Насколько они соответствуют вашим высоким требованиям проверяйте сами.
Автор: tramparamparam02
Дата сообщения: 20.06.2016 21:28
ComboFZ 20:58 20-06-2016
Цитата:
C комментариями, в том числе их экспортом/импортом, умеют работать...
Насколько они соответствуют вашим высоким требованиям проверяйте сами.

Насколько мне известно, с комментариями умеют работать - так или иначе - все программы, имеющие отношение к PDF. Я сам могу к вашему списку ещё десяток добавить. Вот только нет возможности ставить каждую из этих прог ставить и проверять, имеет ли она запрошенный функционал или нет. Поэтому я наивно рассчитывал, что другие участники форума поделятся со мной своим опытом. На то он вроде бы и форум.


Цитата:
вашим высоким требованиям

Желание хоть как-нибудь в каком-нибудь формате любым способом вытащить текст комментариев из документа PDF - это разве высокие требования?
Автор: ComboFZ
Дата сообщения: 20.06.2016 21:44
tramparamparam02

С экспортом/импортом комментариев со всего документа PDF умеют работать (включая кириллицу) три вышеназванные программы (об Акробате уже говорили). Остальные PDF-программы этому не обучены или сильно уступают им при работе с комментариями (исключая клоны на одном движке). Если вы к этому списку что-то добавите - я заранее говорю спасибо.
Файлы экспорта/импорта комментариев у вышеназванных программ с расширениями *.xfdf, *.fdf..., но это текстовые файлы (со сложной структурой внутри).

Здесь ещё, если интересно:
http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&start=880#17
http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&start=880#19

добавлено
Foxit PhantomPDF 6 в этот список можно включить

Автор: tramparamparam02
Дата сообщения: 21.06.2016 00:28
ComboFZ 21:44 20-06-2016
Цитата:
Файлы экспорта/импорта комментариев у вышеназванных программ с расширениями *.xfdf, *.fdf..., но это текстовые файлы (со сложной структурой внутри).

Так это как раз тот формат, в который умеет экспортировать и сам Adobe Acrobat. Я это уже попробовал прежде, чем спрашивать здесь, и потом посмотрел выходной файл .FDF в текстовом вьюере. "Сложная структура" - это вы слишком мягко сформулировали. На самом деле с этим текстом в файле .FDF работать невозможно, да он для этого и не предназначен: насколько я понял, единственное предназначение формата .FDF - экспортировать данные из документа и затем импортировать в другой документ. Выковыривать оттуда текст комментариев - та ещё задачка.


Цитата:
Здесь ещё, если интересно:
http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&start=880#19 [?]

Очень уж сложно, требует установки, как минимум, двух отдельных утилит - PitStop Pro 12 и AnyBizSoft (он же Wondershare) PDF Converter.
Автор: Koyotero
Дата сообщения: 21.06.2016 01:19
tramparamparam02
В PDF-XChange Editor для подобных вещей есть команда Сводка комментариев, пользуйтесь ею. Вот копирования нескольких выделенных комментариев в буфер обмена не встречал.
Автор: tramparamparam02
Дата сообщения: 21.06.2016 21:41
Koyotero 01:19 21-06-2016
Цитата:
В PDF-XChange Editor для подобных вещей есть команда Сводка комментариев, пользуйтесь ею

Спасибо, нашёл такую команду в PDF-XChange Editor. Кстати, в PDF-XChange Viewer (ныне снятом с производства) эта функция тоже имеется: Comments => Summarize Comments. Причём в качестве формата выходного файла можно выбрать аж три варианта, не считая, естественно, PDF: неформатированный простой текст (с поддержкой выбора нужной кодировки), экспорт с сохранением форматирования в RTF или HTML

Хотя всё-таки странно, что столь очевидная и востребованная функция имеется только в одной проге из многочисленных редакторов/вьюеров PDF
Автор: ComboFZ
Дата сообщения: 26.06.2016 13:46
Есть ещё акробатовский плагин Evermap AutoRedact для работы с комментариями.
С кириллицей могут вылезть косяки.
Автор: tramparamparam02
Дата сообщения: 26.06.2016 21:58
ComboFZ 13:46 26-06-2016
Цитата:
Есть ещё акробатовский плагин Evermap AutoRedact для работы с комментариями.

То есть, опять-таки надо ставить отдельную прогу для такой, казалось бы, элементарной операции как копирование/экспорт комментариев Неужели моё желание и впрямь такое извращённое экзотическое?
Автор: weqyz
Дата сообщения: 28.06.2016 11:40
Не знает ли кто-нибудь: существует ли возможность при печати в PDF-файл большой страницы, открытой в браузере, запретить перенос кусков изображений на другую страницу, т.е. вписывать изображения целиком в страницу (если изображение не влезает на текущую страницу - переносить целиком на следующую ВМЕСТЕ с огибающим его текстом)

Автор: brath
Дата сообщения: 28.06.2016 20:22

Цитата:
Не знает ли кто-нибудь: существует ли возможность при печати в PDF-файл большой страницы, открытой в браузере, запретить перенос кусков изображений на другую страницу, т.е. вписывать изображения целиком в страницу (если изображение не влезает на текущую страницу - переносить целиком на следующую ВМЕСТЕ с огибающим его текстом)


Adobe Acrobatd DC

и расширение для него для Chrome:

https://chrome.google.com/webstore/detail/adobe-acrobat/efaidnbmnnnibpcajpcglclefindmkaj

есть авто-масштабирование для "впихивания" невпихуевомого по ширине и авторазворот из "портрета" в "панораму".
Автор: weqyz
Дата сообщения: 29.06.2016 08:26
brath


Цитата:
и расширение для него для Chrome


Спасибо за ответ.

К великому сожалению для меня это неприемлемо.
Дело в том, что у меня открыто неимоверно большое количество вкладок одновременно, а это значит, что любое расширение будет отжирать память многократно.
Я поэтому и обратился в эту тему, а не в тему для расширений.
Думал, что обойдусь одним, однократно установленным в системе PDF-принтером.

Ну что ж, оказывается за многие годы развития PDF так ничего и не развили, как был убогий формат, так им и остался...

Автор: chatt
Дата сообщения: 30.06.2016 11:10
Как сделать весь текст прозрачным? Питстоп есть, но не нашел как.


Нужно, чтобы потом совместить прозрачный распознанный текст с изображениями страниц. (Акробату не под силу, делает только постранично, использую callas pdftoolbox)

ComboFZ

Цитата:
Вообще, не рекомендую отключать шрифтовую заливку, т.к. некоторые PDF-вьюверы глючно показывают такие PDF-ки. Лучше сделать белую векторную заливку между OCR-текстом и оригинальным растром (картинками).

Опишите процедуру по пунктам, пожалуйста.
Автор: ComboFZ
Дата сообщения: 01.07.2016 14:56
chatt

1. Подкладываете белую векторную заливку под готовые сканы (графику):

http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=1900#9

Foxit PhantomPDF Rus > Правка > Фон (Edit > Background)
Акробат X Rus > Инструменты > Страницы > Фон
PDF-XChange Pro (Editor) 5.5 Rus > Документ > Фон > Добавить

Акробатовскими плагинами:
aPulse > PDF Tools > Redaction > Select Region
Enfocus PitStop > Action List > Add Enfocus Background > Add >> Add background...
Evermap AutoPagex Plug-in > Add White Margins
Evermap AutoPagex Plug-in > Tools > Cover Areas Tool
Impozal Plug-in > Masking Tape
ISIToolBox 6.2 > Image PDF Tools > iRedact > Select Area: Inside
Mapsoft Plugin > MaskIt...

2. Накладываете сканы (графику) с фоновой векторной заливкой на OCR-текст с помощью PDF-XChange PDF-Tools 4.
Автор: chatt
Дата сообщения: 01.07.2016 22:49
ComboFZ
Cпасибо, получилось после вставки белого фона под сканы в акробате.

Есть интересная ссылка о импорте слоев на все страницы, но экшены не умею делать.
https://answers.acrobatusers.com/import-as-layers-only-applying-on-the-first-page-of-a-pdf-q255533.aspx

Если у кого получится, выложите готовый экшн.

Страницы: 1234567891011121314151617181920212223242526272829303132333435

Предыдущая тема: SSH-клиент на Java


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.