Ru-Board.club
← Вернуться в раздел «Программы»

» Редактирование PDF файлов

Автор: SSS16
Дата сообщения: 10.04.2016 02:07
Добрый день, Есть файл-таблица в ПДФ, которую не удается экспортировать обычным способом в ворд или эксель.
Дело в том, что в файл хитрым способом закодирован. Обычным способом текст копируется нормально, но при экспорте буквы множатся в 4-5 раз, то есть в оригинале как бы текст в тексте, наложенный друг на друга. Как это сделано непонятно. Кроме того внутри есть изображение, но его можно удалить тем же адобом. Интересно, что если файл открыть с помощью ВОРД, то текст не размножается, но форма таблицы "едит". Оригинальный файл - https://www.sendspace.com/file/aifcf9
Тут скриншоты и т.п. https://www.sendspace.com/filegroup/Dc7Z%2Bi08A00QC0KOvNMYBsOMFebTww%2BGB3IZEjMl0Sukh5IrFUk0XQ8B9qPNiTlAyLLTR8kcpwYXHCxPOwCq4Q
Пробовал всякие обработчики, не помогает, правда немного обнадежил PDF2XL (качал фри версию), он неплохо обработал первые 3 страницы таблицы и формат текста, но слова делает слитными. Есть у кого-нибудь идеи в чем может быть проблема?
Автор: ComboFZ
Дата сообщения: 10.04.2016 04:12
SSS16
В Акробате, в Области навигации > Содержимое удалите лишнюю группу XObject на каждой странице:


Исправленный pdf:
http://sendfile.su/1223249
Автор: SSS16
Дата сообщения: 10.04.2016 23:22
ComboFZ, большое спасибо
Автор: Niiks2
Дата сообщения: 18.04.2016 21:52
Есть ли какая простая, бесплатная программа, с помощью которой можно просто удалить из многостраничного документа отдельные страницы
Автор: vek3262
Дата сообщения: 18.04.2016 22:29
Niiks2
1. Скачать и установить любую из программ-принтеров для конвертации документов а pdf формат. Эти программы устанавливают виртуальный принтер в вашу систему. Любой документ который вы на этот принтер отправляете преобразуется в формат pdf.
2. Отправить на созданный одной из этих программ принтер ваш pdf, в котором вы хотите удалить страницу. При этом в настройках печати указать номера страниц которые должны остаться. Не указывайте те страницы которые вы хотите удалить. Страницы которые хотите напечатать укажите через запятую.
3. Откройте pdf документ созданный этим способом. Все вы удалили ненужные вам страницы.
Еще есть бесплатные онлайн сервисы https://smallpdf.com/ru/split-pdf
Автор: Niiks2
Дата сообщения: 18.04.2016 23:05

Цитата:
Niiks2
1. Скачать и установить любую из программ-принтеров для конвертации документов а pdf формат.

Например, какую?
Автор: vek3262
Дата сообщения: 18.04.2016 23:21
Niiks2
https://www.google.com/?gws_rd=ssl#q=pdf+Printer+Driver
Автор: feuerloescher
Дата сообщения: 19.04.2016 08:23
Лучше так https://en.wikipedia.org/wiki/List_of_PDF_software#Creators_4
Автор: Niiks2
Дата сообщения: 19.04.2016 19:46
vek3262, feuerloescher, спасибо
Есть pdf многостраничный
http://sendfile.su/1226087
Но нельзя его распечатать....
Это можно как-то ''вылечить''
Автор: Ivan 3259 r1
Дата сообщения: 19.04.2016 20:31
Niiks2
Ваш LEK_043.pdf без защиты и водяных знаков
http://www98.zippyshare.com/v/sfkGweE1/file.html
Автор: vek3262
Дата сообщения: 19.04.2016 20:33
Niiks2

Цитата:
Это можно как-то ''вылечить''
[more] [/more]
Пароль снят: http://sendfile.su/1226100
Автор: Niiks2
Дата сообщения: 19.04.2016 21:01

Цитата:
Niiks2
Ваш LEK_043.pdf без защиты и водяных знаков
http://www98.zippyshare.com/v/sfkGweE1/file.html


Цитата:
Цитата:
Это можно как-то ''вылечить''
Подробнее...
Пароль снят: http://sendfile.su/1226100

Ivan 3259 r1, vek3262, спасибо, други
Извините за наглость, а как вы это делаете...?
Автор: vek3262
Дата сообщения: 19.04.2016 21:10
Niiks2

Цитата:
Извините за наглость, а как вы это делаете...?

На скрине видно же, снят пароль с помощью https://smallpdf.com/ru/
"Снять защиту с PDF. Простое средство снятия защиты с PDF онлайн"
Автор: Niiks2
Дата сообщения: 19.04.2016 21:27

Цитата:
На скрине видно же, снят пароль с помощью https://smallpdf.com/ru/
"Снять защиту с PDF. Простое средство снятия защиты с PDF онлайн"

vek3262, понятно. А водяные знаки как ?
Автор: Ivan 3259 r1
Дата сообщения: 19.04.2016 21:53
Niiks2

Цитата:
А водяные знаки как ?

http://forum.ru-board.com/topic.cgi?forum=35&topic=21324&start=2200#3
или надежнее
http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&start=940#7
Автор: vek3262
Дата сообщения: 19.04.2016 22:20
Niiks2
Без водяных знаков: http://sendfile.su/1226123
[more] [/more]
Автор: luxor
Дата сообщения: 21.04.2016 12:39
Подскажите, чем можно быстро и просто редактировать по яркости и контрасту растровые файлы по 1-3-5 стр. ?
Спасибо.
Автор: SSS16
Дата сообщения: 21.04.2016 13:06
Добрый день. Снова попался "закодированный" файл.
Оригинал в формате WORD https://www.sendspace.com/file/9n0sv2
Экспортированный файл в формате PDF https://www.sendspace.com/file/pfjdv9
Ковырялся в "Области навигации/Содержимое", ничего не получается. Куча контейнеров, может и тут есть решение по переносу данной таблицы в удоборедактируемый вариант?
Автор: ComboFZ
Дата сообщения: 23.04.2016 07:33
luxor

Цитата:
чем можно быстро и просто редактировать по яркости и контрасту растровые файлы по 1-3-5 стр. ?

Экшн'ом в PitStop 12:
http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&start=780#16
Автор: kruza
Дата сообщения: 28.04.2016 19:59
Народ, помогите, плиз. Имеется интересная для меня книжица в формате PDF. Но: на каждой странице есть логотип. Который книгу, мягко говоря, не украшает. Пробовала убрать эту бяку с помощью триальных версий PDF Watermark Remover и PDF Logo Remover - почему-то они удаляют вообще все содержимое страницы. Подкиньте идею, пожалуйста.
Вот образец страницы:
https://yadi.sk/d/p7jvjmVfrNKxh
Автор: unreal666
Дата сообщения: 28.04.2016 20:48
kruza
сомневаюсь, что чем то это можно удалить, т.к. вся страница - это одна картинка (скан книги/журнала), частью которой и является этот "водяной знак".
Автор: kruza
Дата сообщения: 28.04.2016 21:25
Опачки ((( Самое интересное, что данный watermark - это URL сайта + ник модератора, который данную книгу на данном сайте выложил. Знала бы английский получше, спросила бы у tomajwii, как он умудрился эту фигню внедрить в документ (а главное - зачем?)
Автор: unreal666
Дата сообщения: 29.04.2016 03:35
а чего его внедрять? Просто перед пиханием сканов в pdf, он скорее всего эти сканы-картинки просто прогнал через какую-нибудь прогу, пакетно добавляющую любой текст в картинки.
Автор: unreal666
Дата сообщения: 10.05.2016 09:42
опять попался pdf, в котором кириллица выглядит нормально, но копируется крякозябрами.
Вариант с pdf -> pdf/a -> pdf (в акробате 11) не помог.
Вот сам файл - http://www.stolyarov.info/files/anti_c_v03.pdf .
Судя по тегам, сделан он прогой pdfTeX v1.40.3.

Можно ли его исправить и как?

P.S.
Судя по инфе автора с данного сайта, это сделано намерено (не подключен какой-то пакет в latex), чтобы электронные версии книг не были заведомо лучше, чем бумажные (электр. версии - бесплатные).
Автор: Ivan 3259 r1
Дата сообщения: 11.05.2016 18:57
unreal666
Цитата:
Можно ли его исправить и как?

ABBYY FineReader последний (репак от elchupacabra)
Вот поправленный файл
http://www110.zippyshare.com/v/LAYYazyZ/file.html
Автор: unreal666
Дата сообщения: 12.05.2016 02:24
Ivan 3259 r1
Не. OCR не катит. Нужно именно как-то подменить "кривой" шрифт на нормальный. Как я понял, автор спецом не подключил в latex какой-то пакет, связанный с кириллицей.
А OCR не катит потому-то он, в первую очередь, ломает текст исходных кодов.
Автор: Mavrikii
Дата сообщения: 12.05.2016 02:46

Цитата:
Судя по тегам, сделан он прогой pdfTeX v1.40.3.

да там просто type 3 шрифты используются

Цитата:
Type 3 font (also known as PostScript Type 3 or PS3, T3 or Adobe Type 3) consists of glyphs defined using the full PostScript language, rather than just a subset. Because of this, a Type 3 font can do some things that Type 1 fonts cannot do, such as specify shading, color, and fill patterns. However, it does not support hinting. Adobe Type Manager did not support Type 3 fonts, and they are not supported as native WYSIWYG fonts on any version of Mac OS or Windows.

http://tex.stackexchange.com/questions/15092/replace-type-3-with-type-1-fonts-in-a-pdf

ps: частично текст после копирования можно восстановить путем перекодировки из 1252 в 1251, но не полностью, так как он не соответствует напрямую аналогичному type 1 шрифту.
Автор: Ivan 3259 r1
Дата сообщения: 12.05.2016 05:27
unreal666
Цитата:
в первую очередь, ломает текст исходных кодов.

Для примера, покажите разницу в вашем и исправленном документе, я визуально не вижу отличий.
Автор: luxor
Дата сообщения: 12.05.2016 21:10
Подскажите.
Часто нужно создавать документы в несколько страниц .
Как сделать, чтоб потом, при открытии их в Acrobat Readerе, файлы всегда открывались с панелью искизов - миниатюр. А то некоторые "деятели" видят только одну страницу, т.к. не хватает ума прокрутить вниз.

Пользуюсь: InfixPDF.Editor; SolidPDF.Tools; FineReader; NitroPDF, но нигде не нашёл, чтоб сохранялись итоговые файлы с указанной мной схемой.

Может сам туплю, просветите.
Спасибо.
Автор: unreal666
Дата сообщения: 13.05.2016 00:09
Ivan 3259 r1

Цитата:
Для примера, покажите разницу в вашем и исправленном документе, я визуально не вижу отличий.  

я смотрел не визуально, а обычным копированием текста и просмотра, что там скопировалось.

Копировал 2 почти случайных куска - 1 чистый текст, 2-ой - код. В обоих ошибки были. Это еще не учитывая, что в русском и англ. языках есть много одинаковых на вид букв и при распознавании исходников FineReader скорее всего отдаст предпочтение русским буквам (если не будет однозначности) => поломает код.

Добавлено:
luxor
Акробат -> Файл -> Свойства -> Вид при открытии -> Вкладка навигации -> Панель миниатюр и страница

Страницы: 1234567891011121314151617181920212223242526272829303132333435

Предыдущая тема: SSH-клиент на Java


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.