Ru-Board.club
← Вернуться в раздел «Графика»

» Редактирование PDF файлов

Автор: DeadVillage
Дата сообщения: 17.09.2004 05:51
... и ваши паровозы
Автор: aar
Дата сообщения: 17.09.2004 07:25
DeadVillage
А текст отдельно, картинки отдельно — тебе так подойдет? Есть такая возможность в акробате, причем еще и разрешение можно указать, и тип файлов
Автор: Kassian
Дата сообщения: 17.09.2004 08:35
DeadVillage
У тебя пароль уже в куках хранится. А у нас нет.
Кстати есть плаг (и standalone) Gemini - позволяет создавать пользовательские таблицы перекодировки. По идее, должно помогать в ряде случаев.
Автор: renreg
Дата сообщения: 17.09.2004 09:14
Kassian

Цитата:
Кстати есть плаг (и standalone) Gemini - позволяет создавать пользовательские таблицы перекодировки.


А здесь можно поподробнее
Автор: DeadVillage
Дата сообщения: 17.09.2004 09:29
... и ваши паровозы
Автор: aar
Дата сообщения: 17.09.2004 09:43
renreg
Iceni Gemini Solo

Цитата:
Gemini Solo is the most advanced PDF extraction tool available. It quickly converts any size of PDF document into other formats enabling you to reuse the content. Whether you wish to post a user manual or a newspaper article on the internet, reformat a financial report or rework an entire book, Gemini Solo saves you time and effort.

What is "Gemini Solo"?
Gemini Solo is the latest incarnation of our existing product "Gemini" - a plug-in to Adobe Acrobat. However, Solo is not a plug-in but a stand-alone application. The advantage of this is that you do not need Acrobat or any other software in order to make use of Solo. It works right out of the box!


Features:

Convert PDF to ASCII, Open eBook, HTML and RTF (for MS Word)
Convert tables into all of the above plus SYLK (for MS Excel)
HTML customization - headers, footers, frames, colour & navigation links
Retain the layout of pages in ASCII, HTML and RTF formats
Export images as JPEG, TIFF, PNG or BMP with scaling
Full support for double-byte characters and Unicode output
Supports Japanese, Chinese, Korean and Vietnamese documents
Intelligent reflow and de-hyphenation using 40,000 word English dictionary
Preserve reading order in and across pages using Article Threads
Preserve hyper text links in HTML, eBook and RTF
Automatic creation of bookmarks even when the original document has none
Batch conversion - convert hundreds of documents with one click
Compatible with all versions of PDF

http://www.winsoft.fr/WinSoftSolutions/Iceni_Gemini.html

Сам пробовал, нормально

DeadVillage
Чем ты вытаскиваешь?
Автор: DeadVillage
Дата сообщения: 17.09.2004 10:45
... и ваши паровозы
Автор: aar
Дата сообщения: 17.09.2004 13:32
DeadVillage
Я знаю, что много есть софта, но чем ты пользуешся с успехом?
Автор: renreg
Дата сообщения: 17.09.2004 16:56
DeadVillage

Цитата:
попробуйте вот тут копию дёрнуть:
_http://shur.strana.de/305-5687-1077.pdf_


Дернул. Отлично получилось сохранить в Word. Прислать?
Автор: DeadVillage
Дата сообщения: 18.09.2004 03:01
... и ваши паровозы
Автор: Kassian
Дата сообщения: 18.09.2004 03:25
Пробовал в Acrobat CE 6.0.2. Этот pdf сохраняется в doc/rtf как одна большая картинка.
А зато Gemini вытащил все довольно прилично (сохранил кегель и цвет текста), картинку, правда, запихнул в конец раздела.
Автор: renreg
Дата сообщения: 18.09.2004 07:05
DeadVillage
Абсолютно ничего не делал. Save as в Word и открыл в Word 2003.
Acrobat 6.02 не СЕ и не МЕ - обычный
Автор: DeadVillage
Дата сообщения: 18.09.2004 08:06
... и ваши паровозы
Автор: renreg
Дата сообщения: 18.09.2004 09:15
DeadVillage
Отправил
Автор: DeadVillage
Дата сообщения: 18.09.2004 09:50
... и ваши паровозы
Автор: renreg
Дата сообщения: 18.09.2004 11:35
DeadVillage
Что-то я тебя не понимаю. Какой у тебя Word? Я тебе сечас отправлю PDF, который я сделал из полученного вордовского файла.
Автор: DeadVillage
Дата сообщения: 18.09.2004 12:51
... и ваши паровозы
Автор: aar
Дата сообщения: 18.09.2004 13:16
DeadVillage
Ну так чего молчишь, чем ты пользуешся для преобразования ПДФ кроме Акробат???
Автор: renreg
Дата сообщения: 18.09.2004 17:56
Это я виноват - ввел DeadVillage и всех в заблужнение. Вордовский файл получается, но.. текст в исходнике был переведен "в кривые" То есть путь один - программa OCR
Автор: aar
Дата сообщения: 18.09.2004 18:01
renreg
Говорил же про шрифты, про типы, а ты посты не читал. Ай-ай-ай самый верный способ определить, в кривых шрифт или нет - это посмотреть свойства документа. А еще можно сравнить его изображение в акробате и акробат ридере. В ридере, соотв, лесенкой.

А если кого сильно зацепило, то на adobe.com можно поживиться солюшенами по разным вопросам
Автор: DeadVillage
Дата сообщения: 18.09.2004 18:58
aar
... пардон, заговорился.
... кроме Акробата пользовался (говорю в прошлом потому, что... было дело - всё убрал ) ФайнРидером и немного СканСофт (ПДФ-конвертор). Но когда на автомате конвертируешь, то слишком уж зависит от типа документа и предпочтения чему-то одному отдать сложно. Плюс ограничения на язык в пдф. Для азиатов (по типу японского) ставил упомянутый "ясасику ПДФ ОСР". Но он капризный - установка и работа только под японской локалью и стрёмно работает со смешанным текстом. Т.е., либо англ либо чисто японский. Китайский текст переварился в нём лишь частично. Много иероглифов левых вылезло. У этой же конторы есть и специализированные программки по типу ПДФ-2-Ворд, ПДФ-2-Ексель и ещё чего-то в этом духе. Даже пробовать не стану.
Вот так и носит меня от проги к проге. Есть конечно и более горбатый вариант - перегон пдф в картинку и ОСР-программок для работы с имиджами гораздо больше.
... теперь вот ещё упомянутую тобой софтину попробую.
... если докачаю, то попробую СканСофт Омнипэйдж Про в14 Оффис Мулитилангвидж. Типа тоже многообещающее что-то. Посмотрим.

Добавлено
renreg
... погоди. Кривые кривыми, но ведь если в пдф исходном убрать рамочку вокруг текста, то всё идёт в Ворд вполне сносно. Куда кривые деваються?

_http://shur.strana.de/305-5687-1077-noBorders.pdf_
_http://shur.strana.de/305-5687-1077-noBorders.doc_
Автор: renreg
Дата сообщения: 19.09.2004 08:36
DeadVillage

Цитата:
... погоди. Кривые кривыми, но ведь если в пдф исходном убрать рамочку вокруг текста, то всё идёт в Ворд вполне сносно. Куда кривые деваються?


Делаю вывод: текст в рамочке и сама рамочка расположены на разных слоях. Acrobat, видимо, не может распознать два слоя и поэтому все лепи одной картинкой. Согласны?

Кстати, а как ты рамочку прибил?


aar

Цитата:
Говорил же про шрифты, про типы, а ты посты не читал. Ай-ай-ай самый верный способ определить, в кривых шрифт или нет - это посмотреть свойства документа. А еще можно сравнить его изображение в акробате и акробат ридере. В ридере, соотв, лесенкой


Извините, сэр Ты прав - не посмотрел в свойства. А с ридером проблема - нетути его у меня.
Автор: aar
Дата сообщения: 19.09.2004 08:49
renreg
В свойства полезно еще смотреть и потому, чтобы узнать, чем сделан этот пдф, и себе раздобыть такую же софтинку на пробу. я так на TeX перешел для верстки мат. документов вместо ворда

Добавлено
DeadVillage
Намыль мне этот файл на aar5[в будке]яндекс[поинт]ру, а то скачать не получается
Автор: renreg
Дата сообщения: 19.09.2004 10:03
aar
Я математикой пока не занимаюсь - мне бы обычную периодику освоить
Автор: DeadVillage
Дата сообщения: 20.09.2004 10:38
renreg
... рамочка разбирается с помощью TouchUp Object Tool.
... вариант с разными слоями своеобразен. а есть ли возможность "пролистать" слои?

aar
... ни с какого адреса взять не получилось? странненько... ща намылю.
Автор: renreg
Дата сообщения: 20.09.2004 19:40
DeadVillage

Цитата:
... рамочка разбирается с помощью TouchUp Object Tool.


Понял. Спасибо.



Цитата:
... вариант с разными слоями своеобразен. а есть ли возможность "пролистать" слои?


Что ты имеешь в виду под этим словом "пролистать"?

Ты же видишь ихотдельно. Вероятно (я так думаю) Acrobat и спотыкается на многослойном документе и вместо текстовых докуметов получаем картинку.
Может я и не прав, но пока друго объяснения не вижу.
Автор: DeadVillage
Дата сообщения: 21.09.2004 04:45
renreg

... под листанием я подразумевал возможность видеть не слои всем скопом, а, например, лист с именами/номерами слоёв.
... спасибо за ответ "мыльный"! Давайте уж тут говорить. Иначе повторов и непоняток не избежать.

... похоже, что для Acrobat каёмочка вокруг текста и является чем-то непреодолимым, но не всегда. Похоже, что от способа создания PDF-файла это зависит. Я попробовал состряпать текст в рамке в Illustrator-е и в Word-е - Acrobat не вытащил текст ни из одного файла.
.. потом полез к XaraX. Состряпал я там двухстраничник.
На первой странице текст был, как и во всех прежних вариантах, внутри "пустой" рамки. На второй странице рамку я залил белым. Т.е., получился текст поверх прямоугольника белого с черной каёмкой. Распечатал это дело в PDF. В Acrobat-е мог выделять текст на обеих страницах. Но вот сохранил в doc-файл и получил текст с первой страницы и картинку текста со второй страницы. Т.е., Acrobat смог перескачить рамку. Но вот что ему помешало сделать подобное на второй странице? Ведь в таком случае Acrobat не сможет перевернуть в вордовский файл любой текст, что поверх картинки идёт. Так?
... Проверяю, вставляю в пустую рамку фотку и поверх неё текст, печатаю аналогично в PDF, в Acrobat-e всё опять читабельно и выделябельно. Из Acrobat-a сохраняю в doc, открываю - кроме прошлых результатов, получил текст, что поверх картинки шёл... картинку (из-под текста) Acrobat где-то теряет - нету её в вордовском файле.

... пойду InD, PM и FH помучаю...
Автор: aar
Дата сообщения: 21.09.2004 09:41
DeadVillage

Цитата:
похоже, что для Acrobat каёмочка вокруг текста и является чем-то непреодолимым, но не всегда. Похоже, что от способа создания PDF-файла это зависит. Я попробовал состряпать текст в рамке в Illustrator-е и в Word-е - Acrobat не вытащил текст ни из одного файла

А в ПДФ какой редакции ты выгонял? Варианты ответов на adobe.com 1.2, 1.3, 1.4, 1.5? Их же там несколько, и все обладают разными возможностями. Еще зависит от того, как создается ПДФ: сразу, напрямую из документа, или же используя PS-файл. Если второе, то на какой виртуальный принтер этот псник выгоняется, а потом чем преобразуется в ПДФ. Допустим, результаты работы Adobe Distiller и GhostScript разняться. Сужу это по тому, что ПДФ-файл, созданный дистиллером, не печатался как надо на HP1300, в отличие от файла, созданного GS. Так что причин может быть вагон и маленькая тележка

Цитата:
потом полез к XaraX

У этой программы своеобразное представление о PostScript, которое иногда не может понять ни один дистиллер

Цитата:
пойду InD, PM и FH помучаю

И ради чего все это? имхо, почитай лучше солюшены по формату пдф и постскрипт (можно взять на том же adobe.com, юзай поиск)

Цитата:
рамочка разбирается с помощью TouchUp Object Tool

Этим инструментом она не разбивается, а выделяются ее части. А разбивается она при создании файла. То есть если это был прямоуголник в Illustrator, и потом сделали пдф-файл, интерпретатор ПС мог решить, что ему проще разбить его на части, то бишь линии. К примеру, текст, расположенный на одной строке, может быть записан в пдф-файл по одной букве. Это можно посмотреть, взглянув во внутренности пс-файла — то, что в круглых скобочках — это и есть текстовые блоки.

И читайте, если есть возможность, руководства, почти все ответы на ваши вопросы — там!
Автор: renreg
Дата сообщения: 21.09.2004 09:56
DeadVillage
То, что ты делал (заливал белым, а потом накладывал текст) и есть работа со слоями.

aar

Цитата:
А в ПДФ какой редакции ты выгонял? Варианты ответов на adobe.com 1.2, 1.3, 1.4, 1.5?


В данном случае нам все равно - Acrobat 6.02 не может работать со слоями. Почему?

aar

Цитата:
И читайте, если есть возможность, руководства


Ты много их видел? Я видел только для версии Acrobat 4.0 - пустая кнжка.
А если практически все работают на не совсем лицензионном софте, то руководства они и в глаза не видели. Так что лучше ищи решение, а то получается не очень красиво
Автор: DeadVillage
Дата сообщения: 21.09.2004 10:28
aar

Цитата:
И читайте, если есть возможность, руководства, почти все ответы на ваши вопросы — там!

... спасибо, но руководства в лучшем случае растолкуют почему такая-то операция не проистекает ожидаемым образом. Но это не поможет переварачивать файлы по типу упомянутого в вордовские файлы без "хирургического" вмешательства.


Цитата:
Этим инструментом она не разбивается, а выделяются ее части.

... а мы и не разбиваем - мы разбираем

Страницы: 1234567

Предыдущая тема: САПР Компас


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.