Ru-Board.club
← Вернуться в раздел «Программы»

» Редактирование PDF файлов

Автор: ComboFZ
Дата сообщения: 09.04.2015 16:00
vbrv
Лучший софт для извлечения растра из PDF:

PDF Explorer 1.5.0.61P3
PDF Image Extraction Wizard
xJPG
Adobe Acrobat
Zoner Photo Studio


PDF Explorer 1.5.0.61P3 среди них - лучший.
-----------------------
PDF Image Extraction Wizard - тугодум, JPEG2000 конвертит в tiff
xJPG - шустрый, но не всегда извлекает jpeg из PDF
Acrobat 11 - требуется предварительное инспектирование PDF на наличие JPEG, JPEG2000
Zoner Photo Studio 17 - не видит JBIG2, шустрый

Что касается A-PDF Image Extractor, он не извлекает JPEG2000 без перекода

И нельзя обходиться только одной любимой программой для извлечения растра без перекода.
Автор: laprad
Дата сообщения: 10.04.2015 19:25
ComboFZ

Цитата:
xJPG - шустрый, но не всегда извлекает jpeg из PDF

под xJPG подразумевается pdfimages.exe из набора Xpdf? имхо абсолютный лидер из бесплатных. не срабатывает с -j, можно пробнуть без ключа, хоть с пережатием в другой формат, но будет картинка.
Автор: ComboFZ
Дата сообщения: 10.04.2015 22:55
laprad

PDF Image Extraction Wizard - GUI к утилите pdfimages

xJPG (JPG Extractor 0.1 --- by dwing --- Jun 1 2006):
http://rghost.ru/6hgqhqL8t
Автор: oshizelly
Дата сообщения: 11.04.2015 08:41
На мой вопрос 2-недельной давности так никто и не ответит? Ведь наверняка же есть какое-то простое решение для такой тривиальной задачи.
Автор: schukin
Дата сообщения: 11.04.2015 08:48
vbrv
Для вытаскивания картинки из pdf использовал Adobe Acrobat.
Автор: ComboFZ
Дата сообщения: 11.04.2015 10:11
schukin

Acrobat, как правило, хорошо вытаскивает оригинальный JPEG из PDF.
JPEG2000 любит только свой, созданный в своих адобовских программах, его он хорошо вытаскивает без перекода. Не родные не любит, норовит перекодировать, если что-то ему не нравиться.
PDF Explorer 1.5.0.61P3 и Zoner Photo Studio 17 в плане вытаскивания JPEG2000 без перекода на голову выше Акробата. Zoner Photo Studio, к тому же, делает это моментально.
Автор: henderson
Дата сообщения: 13.04.2015 17:58
Столкнулся недавно с одной проблемой. Скачал книгу в формате pdf, распознанный слой есть. Тест выделяешь, все выделяется и копируется, но когда вставляешь его скажем в Блокнот, то вставляется что-то типа

Что это за хрень, я так и не понял. Переводчики уверяют, что это либо чешский либо словенский язык, но на на русский не переводят. Пробовал декодер Лебедева, он тоже ничего не сказал. В свойствах pdf указываются следующие шрифты:

Создателем pdf указан PDFXC Library (version 2.5).
Жизнь это обстоятельство особо не портит, но хотелось бы понять, что это такое и как можно исправить, чтобы был поиск по тексту.
Автор: ComboFZ
Дата сообщения: 14.04.2015 06:17
henderson
Выложите несколько страничек из этой книги.
Автор: henderson
Дата сообщения: 15.04.2015 09:39
ComboFZ
Вот книга Ссылка
Автор: ComboFZ
Дата сообщения: 15.04.2015 23:09
henderson

Цитата:
...как можно исправить, чтобы был поиск по тексту


1. Оригинальный PDF открыть в Acrobat 11 (10-ка и ниже не пойдут), сохранить как PDF-A.
С помощью модуля Preflight, перевести PDF-A в обычный PDF.

2. Страницы 2,3,4 Акробатом зипуются, что плохо. Их нужно извлечь из PDF-оригинала, исправить в PixelPlanet PDFEditor Pro 2.0 и заменить в PDF-документе полученным из Акробата.

http://rghost.ru/85hb4QmPC
Автор: henderson
Дата сообщения: 16.04.2015 15:17
ComboFZ
Вижу, отредактировали файл. Больше спасибо!
Автор: MozgiNaStene
Дата сообщения: 20.05.2015 14:09
Подскажите как исправить отъехавшие шрифты и предотвратить в дальнейшем такой казус?

Сам PDF (17.7 Mb): http://rghost.ru/private/8CxwLdr5H/03acdfcc59c218425ee49d2b09a174e5
Автор: corrector
Дата сообщения: 24.05.2015 22:36
Помогите, кто знает как, пожалуйста!
Распознал в FR8 книгу. Вычитал. Использовал шрифт Antiqua. Для приближения к оригиналу во всех словах курсивом использовал шрифт Cambria, кроме буквы "т": для нее использовал шрифт Karelia. В паре мест использовал шрифт "Literaturnaya". Все упомянутые шрифты зарегистрированы в Windows.
При попытке сохранить как pdf (параметры сохранения: Формат сохранения - Только текст и картинки; Шрифт - использовать системные шрифты, Встраивать шрифты) возникли две такие две проблемы:
а) на одной из страниц вылезло: "Шрифт Literaturnaya не содержит всех необходимых символов. Некоторые символы не будут показываться на экране. Продолжить сохранение в PDF?". Отвечаю - Да; процесс идет дальше.
Здесь вопрос сформулирую так: меня просто предупреждают, что (возможно) в тексте встретится (а может и не встретиться) символ в шрифте Literaturnaya, который не будет отображаться при просмотре pdf-файла (поскольку в этом шрифте представлены не все символы), или же FR в процессе формирования pdf-файла наткнулся на такой неотображаемый символ? При втором варианте: что FR ставит в тексте (когда натыкается на такой символ) в случае ответа "Да" на предупреждение?
б) когда FR натыкается на букву "т" (шрифт Karelia, курсив) вылезает сообщение "Встраивание шрифта "Karelia" запрещено. Сохранение отменено". Естественно, pdf-файл не создается. Вопросы:
Почему? Кем запрещено? Можно ли снять этот запрет?
Конечно, можно отказаться от этого шрифта. Но опять искать другой подходящий шрифт и заменять шрифт во всех вхождениях буквы "т" в "Karelia" (сотни слов на 600 стр.) - жуткий гемморой (мне становится плохо).
Примечание: Все эти проблемы всплывают лишь при сохранении в pdf; при сохранении в doc, rtf, xml, html, lit - никаких сообщений, все сохраняется.
Среда: Win 7 Ent SP1 x64: FineReader 8.0.0.1126 port
UPD: проверил на Win Vista Home Basic SP2 (ноутбук) + FineReader 8.0.0.1126 port - все то же самое.
Автор: moroka33
Дата сообщения: 24.05.2015 23:34
Доброго.
По ходу, ноныча вечер обращений за помощью.))
Качнул PDF документ, в котором имеются данные закрытые цветными накладками.

Открывал Acrobat_ом 9_м, в нем струмента для снятия не сыскал.
Пробовал обработку файла прогами CoolUtils Total PDF Converter, PDF Decrypter Pro, PdfGrabber, PDF-XChange Editor, Tipard PDF Converter. Converterом перегнал в док, нашлепку сняло, но и формулу под ней покоцало. Остальными решить не получилось.
Может кто может подсказать инструмент коим можно удалить и хорошо бы порядок действий, опыта няма.)
Душевно, с наилучшими.
Автор: Voo2
Дата сообщения: 25.05.2015 06:12
moroka33
можно одну страницу на обменник?
Автор: moroka33
Дата сообщения: 25.05.2015 21:22
Voo2

Цитата:
можно одну страницу на обменник?

Одну сложно, не работал с редактированием PDF, долго буду разбираться.)
Файл целиком, не вопрос.)
Размер 2,7 МВ, защищенные формулы нач. с 29 стр.
Просьба, ежели удастся порешать, не сочти за труд рассказать чем и как.)
Душевно, с наилучшими.



Автор: Victorkoly
Дата сообщения: 25.05.2015 21:42
Тема про LaTex вроде на этом форуме в топе не бывает. Кто-то использовал?
Автор: niccolo
Дата сообщения: 25.05.2015 22:32

Цитата:
Одну сложно, не работал с редактированием PDF, долго буду разбираться.)
Файл целиком, не вопрос.)


Там две формулы. И закрашены надписи на рисунках - но видимо в граф. редакторе.

Так нормально будет
http://rghost.ru/7FNldKqPm
Автор: corrector
Дата сообщения: 25.05.2015 22:36
moroka33

Вот текст из вашего документа (включая формулу под "пластырем").
Получен с помощью Callas PDF Toolbox.
Автор: moroka33
Дата сообщения: 25.05.2015 22:57
niccolo
corrector

Профессионализьм, его ногтЁм не выдавишь.))
Одна печалька,
niccolo, с формулами на 29_й стр. все путем, но там на 30 и 32_й тоже есть защищенные цветной полосой - "пластырем" данные.(
Просьба не счесть за наглость, но пошукал на форуме Callas PDF Toolbox - няма, линком ув. corrector не поделился, да и наиболее полноценный экз. от ув. niccolo каким струментом и как сделан не указано.((
Может есть возможность дожать до кондиции?))
Или поделиться линком на струменты и слегонца накинуть описание техпроцесса?))
Душевно, с наилучшими.

Автор: arturrc
Дата сообщения: 25.05.2015 23:15
moroka33
В шапке описание плагинов и ссылка "Тема по плагинам для Acrobat"
Автор: Voo2
Дата сообщения: 25.05.2015 23:23
moroka33
http://rghost.net/74fhwxXCP
пробуем,
только 11 акробат,
только редактировать,
только вырезать, до получения результата
на 30 - 32 не получится, картинка в один слой
Автор: corrector
Дата сообщения: 25.05.2015 23:25
moroka33
Ссылку на продукт кину завтра.

Операция извлечения делается так:
Открываем подопытный файл.
Далее Tools -> Switchboard -> Arrange -> Slice ->
-> В окошке Check выбираем из выпадающего списка Text Objects -> жмем Execute
появляется панель сохранения - задаем имя для файла с графикой из подопытного; после сохранения идет процесс выделения текста и по окончании оного появлятся (в гл. окне) еще один файл. Его сохраняем через меню File->Save As.
Сохраненный результат и есть искомый файл со всеми текстовыми объектами из оригинала.
Автор: moroka33
Дата сообщения: 25.05.2015 23:42
Voo2

Цитата:
пробуем, только 11 акробат,

Душевно, но у меня Акробат 9_й, 11_й мой комп боюсь не потянет - 4_й пень, аднака, даже не буду пыжиться.))
corrector

Цитата:
Ссылку на продукт кину завтра.   Операция извлечения делается так:...

Понял, понял, пойдем. По наводке ув. arturrc зашел, нашел, 5_й качнул, там аднака монстр, мой 9_й Акробат в установленоом виде 108 МВ, а там архив 165МВ.))
С наилучшими, ожидаю.

Автор: Voo2
Дата сообщения: 25.05.2015 23:49

Цитата:
мой комп боюсь не потянет

имел ввиду, что без плагинов
9 обещал это тоже уметь,
и мне кажется 11 не тяжелее 9

Автор: moroka33
Дата сообщения: 26.05.2015 00:01
Voo2

Цитата:
9 обещал это тоже уметь

Понял, качнул, будем поглядеть.)) По тезультату отпишу.
Душевно, с наилучшими.
Автор: corrector
Дата сообщения: 26.05.2015 08:04

Цитата:
там аднака монстр


У меня не меньше. Функционал соответствует размеру. На всякий случай, вот ссылка.
Автор: moroka33
Дата сообщения: 26.05.2015 18:40
Voo2

Цитата:
9 обещал это тоже уметь


Цитата:
По тезультату отпишу

Открыл в 9_м Акробате норм, формулы с 29 норм, а заплатки с 30 и 32_й на месте.((
Через редактирование ничего сделать не удается.
corrector

Цитата:
вот ссылка

Душевно, качнул, учитывая, что портабельный, будем посмотреть.))

Добавлено:
corrector

Цитата:
вот ссылка.

moroka33

Цитата:
18:41 26-05-2015


Цитата:
качнул, учитывая, что портабельный, будем посмотреть.))

Распаковал в туже папку, запустил, вылез Есет и обозвав некий тулбокс трояном убил его.((
Такая же история была вчера
http://forum.ru-board.com/topic.cgi?forum=35&topic=47341&start=860#15
Результат

Самое смешное, что после отключения приложения в автозапуске у меня заблокировался переход по форуму, пришлось чистить и перезагружать систему.((
Не понятно, что за беда.
Автор: corrector
Дата сообщения: 26.05.2015 21:43
moroka33
Затрудняюсь комментировать - у меня программа работает уже третий год. Никаких нареканий. Система Win 7 Enterp SP1. За безопасностью следят в реале Microsoft Security Essential, Malwarebytes Anti-Malware, Spy Hunter + еженедельно провожу тотальное сканирование свежими сканировщиками eScan AntiVirus Toolkit, Emsisoft Emergency Kit, Kaspersky Virus Removal Tool. Ни разу Callas PDF Toolbox не вызывал подозрений у этих церберов.
Продуктами Eset не пользуюсь уже несколько лет - потеряли доверие.
Автор: arturrc
Дата сообщения: 26.05.2015 22:06
corrector
Мой AVG IS тоже заверещал. Я так понимаю, что кидается на упаковщик. Пока не вбил екзешник в исключения антивируса, выдавало ошибку при запуске портативки.
Я не спец по работе с PDF и попробовал прогу для общего развития.
Мне думается, что замазки на стр. 30 и 32 сделаны на фото, а потом это фото вставлено в PDF. И в этом случае Callas PDF Toolbox не справится с задачей. Я ошибаюсь или нет?

Страницы: 1234567891011121314151617181920212223242526272829303132333435

Предыдущая тема: SSH-клиент на Java


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.