... и ваши паровозы
» Редактирование PDF файлов
DeadVillage
А текст отдельно, картинки отдельно — тебе так подойдет? Есть такая возможность в акробате, причем еще и разрешение можно указать, и тип файлов
А текст отдельно, картинки отдельно — тебе так подойдет? Есть такая возможность в акробате, причем еще и разрешение можно указать, и тип файлов
DeadVillage
У тебя пароль уже в куках хранится. А у нас нет.
Кстати есть плаг (и standalone) Gemini - позволяет создавать пользовательские таблицы перекодировки. По идее, должно помогать в ряде случаев.
У тебя пароль уже в куках хранится. А у нас нет.
Кстати есть плаг (и standalone) Gemini - позволяет создавать пользовательские таблицы перекодировки. По идее, должно помогать в ряде случаев.
Kassian
Цитата:
А здесь можно поподробнее
Цитата:
Кстати есть плаг (и standalone) Gemini - позволяет создавать пользовательские таблицы перекодировки.
А здесь можно поподробнее
... и ваши паровозы
renreg
Iceni Gemini Solo
Цитата:
http://www.winsoft.fr/WinSoftSolutions/Iceni_Gemini.html
Сам пробовал, нормально
DeadVillage
Чем ты вытаскиваешь?
Iceni Gemini Solo
Цитата:
Gemini Solo is the most advanced PDF extraction tool available. It quickly converts any size of PDF document into other formats enabling you to reuse the content. Whether you wish to post a user manual or a newspaper article on the internet, reformat a financial report or rework an entire book, Gemini Solo saves you time and effort.
What is "Gemini Solo"?
Gemini Solo is the latest incarnation of our existing product "Gemini" - a plug-in to Adobe Acrobat. However, Solo is not a plug-in but a stand-alone application. The advantage of this is that you do not need Acrobat or any other software in order to make use of Solo. It works right out of the box!
Features:
Convert PDF to ASCII, Open eBook, HTML and RTF (for MS Word)
Convert tables into all of the above plus SYLK (for MS Excel)
HTML customization - headers, footers, frames, colour & navigation links
Retain the layout of pages in ASCII, HTML and RTF formats
Export images as JPEG, TIFF, PNG or BMP with scaling
Full support for double-byte characters and Unicode output
Supports Japanese, Chinese, Korean and Vietnamese documents
Intelligent reflow and de-hyphenation using 40,000 word English dictionary
Preserve reading order in and across pages using Article Threads
Preserve hyper text links in HTML, eBook and RTF
Automatic creation of bookmarks even when the original document has none
Batch conversion - convert hundreds of documents with one click
Compatible with all versions of PDF
http://www.winsoft.fr/WinSoftSolutions/Iceni_Gemini.html
Сам пробовал, нормально
DeadVillage
Чем ты вытаскиваешь?
... и ваши паровозы
DeadVillage
Я знаю, что много есть софта, но чем ты пользуешся с успехом?
Я знаю, что много есть софта, но чем ты пользуешся с успехом?
DeadVillage
Цитата:
Дернул. Отлично получилось сохранить в Word. Прислать?
Цитата:
попробуйте вот тут копию дёрнуть:
_http://shur.strana.de/305-5687-1077.pdf_
Дернул. Отлично получилось сохранить в Word. Прислать?
... и ваши паровозы
Пробовал в Acrobat CE 6.0.2. Этот pdf сохраняется в doc/rtf как одна большая картинка.
А зато Gemini вытащил все довольно прилично (сохранил кегель и цвет текста), картинку, правда, запихнул в конец раздела.
А зато Gemini вытащил все довольно прилично (сохранил кегель и цвет текста), картинку, правда, запихнул в конец раздела.
DeadVillage
Абсолютно ничего не делал. Save as в Word и открыл в Word 2003.
Acrobat 6.02 не СЕ и не МЕ - обычный
Абсолютно ничего не делал. Save as в Word и открыл в Word 2003.
Acrobat 6.02 не СЕ и не МЕ - обычный
... и ваши паровозы
DeadVillage
Отправил
Отправил
... и ваши паровозы
DeadVillage
Что-то я тебя не понимаю. Какой у тебя Word? Я тебе сечас отправлю PDF, который я сделал из полученного вордовского файла.
Что-то я тебя не понимаю. Какой у тебя Word? Я тебе сечас отправлю PDF, который я сделал из полученного вордовского файла.
... и ваши паровозы
DeadVillage
Ну так чего молчишь, чем ты пользуешся для преобразования ПДФ кроме Акробат???
Ну так чего молчишь, чем ты пользуешся для преобразования ПДФ кроме Акробат???
Это я виноват - ввел DeadVillage и всех в заблужнение. Вордовский файл получается, но.. текст в исходнике был переведен "в кривые" То есть путь один - программa OCR
renreg
Говорил же про шрифты, про типы, а ты посты не читал. Ай-ай-ай самый верный способ определить, в кривых шрифт или нет - это посмотреть свойства документа. А еще можно сравнить его изображение в акробате и акробат ридере. В ридере, соотв, лесенкой.
А если кого сильно зацепило, то на adobe.com можно поживиться солюшенами по разным вопросам
Говорил же про шрифты, про типы, а ты посты не читал. Ай-ай-ай самый верный способ определить, в кривых шрифт или нет - это посмотреть свойства документа. А еще можно сравнить его изображение в акробате и акробат ридере. В ридере, соотв, лесенкой.
А если кого сильно зацепило, то на adobe.com можно поживиться солюшенами по разным вопросам
aar
... пардон, заговорился.
... кроме Акробата пользовался (говорю в прошлом потому, что... было дело - всё убрал ) ФайнРидером и немного СканСофт (ПДФ-конвертор). Но когда на автомате конвертируешь, то слишком уж зависит от типа документа и предпочтения чему-то одному отдать сложно. Плюс ограничения на язык в пдф. Для азиатов (по типу японского) ставил упомянутый "ясасику ПДФ ОСР". Но он капризный - установка и работа только под японской локалью и стрёмно работает со смешанным текстом. Т.е., либо англ либо чисто японский. Китайский текст переварился в нём лишь частично. Много иероглифов левых вылезло. У этой же конторы есть и специализированные программки по типу ПДФ-2-Ворд, ПДФ-2-Ексель и ещё чего-то в этом духе. Даже пробовать не стану.
Вот так и носит меня от проги к проге. Есть конечно и более горбатый вариант - перегон пдф в картинку и ОСР-программок для работы с имиджами гораздо больше.
... теперь вот ещё упомянутую тобой софтину попробую.
... если докачаю, то попробую СканСофт Омнипэйдж Про в14 Оффис Мулитилангвидж. Типа тоже многообещающее что-то. Посмотрим.
Добавлено
renreg
... погоди. Кривые кривыми, но ведь если в пдф исходном убрать рамочку вокруг текста, то всё идёт в Ворд вполне сносно. Куда кривые деваються?
_http://shur.strana.de/305-5687-1077-noBorders.pdf_
_http://shur.strana.de/305-5687-1077-noBorders.doc_
... пардон, заговорился.
... кроме Акробата пользовался (говорю в прошлом потому, что... было дело - всё убрал ) ФайнРидером и немного СканСофт (ПДФ-конвертор). Но когда на автомате конвертируешь, то слишком уж зависит от типа документа и предпочтения чему-то одному отдать сложно. Плюс ограничения на язык в пдф. Для азиатов (по типу японского) ставил упомянутый "ясасику ПДФ ОСР". Но он капризный - установка и работа только под японской локалью и стрёмно работает со смешанным текстом. Т.е., либо англ либо чисто японский. Китайский текст переварился в нём лишь частично. Много иероглифов левых вылезло. У этой же конторы есть и специализированные программки по типу ПДФ-2-Ворд, ПДФ-2-Ексель и ещё чего-то в этом духе. Даже пробовать не стану.
Вот так и носит меня от проги к проге. Есть конечно и более горбатый вариант - перегон пдф в картинку и ОСР-программок для работы с имиджами гораздо больше.
... теперь вот ещё упомянутую тобой софтину попробую.
... если докачаю, то попробую СканСофт Омнипэйдж Про в14 Оффис Мулитилангвидж. Типа тоже многообещающее что-то. Посмотрим.
Добавлено
renreg
... погоди. Кривые кривыми, но ведь если в пдф исходном убрать рамочку вокруг текста, то всё идёт в Ворд вполне сносно. Куда кривые деваються?
_http://shur.strana.de/305-5687-1077-noBorders.pdf_
_http://shur.strana.de/305-5687-1077-noBorders.doc_
DeadVillage
Цитата:
Делаю вывод: текст в рамочке и сама рамочка расположены на разных слоях. Acrobat, видимо, не может распознать два слоя и поэтому все лепи одной картинкой. Согласны?
Кстати, а как ты рамочку прибил?
aar
Цитата:
Извините, сэр Ты прав - не посмотрел в свойства. А с ридером проблема - нетути его у меня.
Цитата:
... погоди. Кривые кривыми, но ведь если в пдф исходном убрать рамочку вокруг текста, то всё идёт в Ворд вполне сносно. Куда кривые деваються?
Делаю вывод: текст в рамочке и сама рамочка расположены на разных слоях. Acrobat, видимо, не может распознать два слоя и поэтому все лепи одной картинкой. Согласны?
Кстати, а как ты рамочку прибил?
aar
Цитата:
Говорил же про шрифты, про типы, а ты посты не читал. Ай-ай-ай самый верный способ определить, в кривых шрифт или нет - это посмотреть свойства документа. А еще можно сравнить его изображение в акробате и акробат ридере. В ридере, соотв, лесенкой
Извините, сэр Ты прав - не посмотрел в свойства. А с ридером проблема - нетути его у меня.
renreg
В свойства полезно еще смотреть и потому, чтобы узнать, чем сделан этот пдф, и себе раздобыть такую же софтинку на пробу. я так на TeX перешел для верстки мат. документов вместо ворда
Добавлено
DeadVillage
Намыль мне этот файл на aar5[в будке]яндекс[поинт]ру, а то скачать не получается
В свойства полезно еще смотреть и потому, чтобы узнать, чем сделан этот пдф, и себе раздобыть такую же софтинку на пробу. я так на TeX перешел для верстки мат. документов вместо ворда
Добавлено
DeadVillage
Намыль мне этот файл на aar5[в будке]яндекс[поинт]ру, а то скачать не получается
aar
Я математикой пока не занимаюсь - мне бы обычную периодику освоить
Я математикой пока не занимаюсь - мне бы обычную периодику освоить
renreg
... рамочка разбирается с помощью TouchUp Object Tool.
... вариант с разными слоями своеобразен. а есть ли возможность "пролистать" слои?
aar
... ни с какого адреса взять не получилось? странненько... ща намылю.
... рамочка разбирается с помощью TouchUp Object Tool.
... вариант с разными слоями своеобразен. а есть ли возможность "пролистать" слои?
aar
... ни с какого адреса взять не получилось? странненько... ща намылю.
DeadVillage
Цитата:
Понял. Спасибо.
Цитата:
Что ты имеешь в виду под этим словом "пролистать"?
Ты же видишь ихотдельно. Вероятно (я так думаю) Acrobat и спотыкается на многослойном документе и вместо текстовых докуметов получаем картинку.
Может я и не прав, но пока друго объяснения не вижу.
Цитата:
... рамочка разбирается с помощью TouchUp Object Tool.
Понял. Спасибо.
Цитата:
... вариант с разными слоями своеобразен. а есть ли возможность "пролистать" слои?
Что ты имеешь в виду под этим словом "пролистать"?
Ты же видишь ихотдельно. Вероятно (я так думаю) Acrobat и спотыкается на многослойном документе и вместо текстовых докуметов получаем картинку.
Может я и не прав, но пока друго объяснения не вижу.
renreg
... под листанием я подразумевал возможность видеть не слои всем скопом, а, например, лист с именами/номерами слоёв.
... спасибо за ответ "мыльный"! Давайте уж тут говорить. Иначе повторов и непоняток не избежать.
... похоже, что для Acrobat каёмочка вокруг текста и является чем-то непреодолимым, но не всегда. Похоже, что от способа создания PDF-файла это зависит. Я попробовал состряпать текст в рамке в Illustrator-е и в Word-е - Acrobat не вытащил текст ни из одного файла.
.. потом полез к XaraX. Состряпал я там двухстраничник.
На первой странице текст был, как и во всех прежних вариантах, внутри "пустой" рамки. На второй странице рамку я залил белым. Т.е., получился текст поверх прямоугольника белого с черной каёмкой. Распечатал это дело в PDF. В Acrobat-е мог выделять текст на обеих страницах. Но вот сохранил в doc-файл и получил текст с первой страницы и картинку текста со второй страницы. Т.е., Acrobat смог перескачить рамку. Но вот что ему помешало сделать подобное на второй странице? Ведь в таком случае Acrobat не сможет перевернуть в вордовский файл любой текст, что поверх картинки идёт. Так?
... Проверяю, вставляю в пустую рамку фотку и поверх неё текст, печатаю аналогично в PDF, в Acrobat-e всё опять читабельно и выделябельно. Из Acrobat-a сохраняю в doc, открываю - кроме прошлых результатов, получил текст, что поверх картинки шёл... картинку (из-под текста) Acrobat где-то теряет - нету её в вордовском файле.
... пойду InD, PM и FH помучаю...
... под листанием я подразумевал возможность видеть не слои всем скопом, а, например, лист с именами/номерами слоёв.
... спасибо за ответ "мыльный"! Давайте уж тут говорить. Иначе повторов и непоняток не избежать.
... похоже, что для Acrobat каёмочка вокруг текста и является чем-то непреодолимым, но не всегда. Похоже, что от способа создания PDF-файла это зависит. Я попробовал состряпать текст в рамке в Illustrator-е и в Word-е - Acrobat не вытащил текст ни из одного файла.
.. потом полез к XaraX. Состряпал я там двухстраничник.
На первой странице текст был, как и во всех прежних вариантах, внутри "пустой" рамки. На второй странице рамку я залил белым. Т.е., получился текст поверх прямоугольника белого с черной каёмкой. Распечатал это дело в PDF. В Acrobat-е мог выделять текст на обеих страницах. Но вот сохранил в doc-файл и получил текст с первой страницы и картинку текста со второй страницы. Т.е., Acrobat смог перескачить рамку. Но вот что ему помешало сделать подобное на второй странице? Ведь в таком случае Acrobat не сможет перевернуть в вордовский файл любой текст, что поверх картинки идёт. Так?
... Проверяю, вставляю в пустую рамку фотку и поверх неё текст, печатаю аналогично в PDF, в Acrobat-e всё опять читабельно и выделябельно. Из Acrobat-a сохраняю в doc, открываю - кроме прошлых результатов, получил текст, что поверх картинки шёл... картинку (из-под текста) Acrobat где-то теряет - нету её в вордовском файле.
... пойду InD, PM и FH помучаю...
DeadVillage
Цитата:
А в ПДФ какой редакции ты выгонял? Варианты ответов на adobe.com 1.2, 1.3, 1.4, 1.5? Их же там несколько, и все обладают разными возможностями. Еще зависит от того, как создается ПДФ: сразу, напрямую из документа, или же используя PS-файл. Если второе, то на какой виртуальный принтер этот псник выгоняется, а потом чем преобразуется в ПДФ. Допустим, результаты работы Adobe Distiller и GhostScript разняться. Сужу это по тому, что ПДФ-файл, созданный дистиллером, не печатался как надо на HP1300, в отличие от файла, созданного GS. Так что причин может быть вагон и маленькая тележка
Цитата:
У этой программы своеобразное представление о PostScript, которое иногда не может понять ни один дистиллер
Цитата:
И ради чего все это? имхо, почитай лучше солюшены по формату пдф и постскрипт (можно взять на том же adobe.com, юзай поиск)
Цитата:
Этим инструментом она не разбивается, а выделяются ее части. А разбивается она при создании файла. То есть если это был прямоуголник в Illustrator, и потом сделали пдф-файл, интерпретатор ПС мог решить, что ему проще разбить его на части, то бишь линии. К примеру, текст, расположенный на одной строке, может быть записан в пдф-файл по одной букве. Это можно посмотреть, взглянув во внутренности пс-файла — то, что в круглых скобочках — это и есть текстовые блоки.
И читайте, если есть возможность, руководства, почти все ответы на ваши вопросы — там!
Цитата:
похоже, что для Acrobat каёмочка вокруг текста и является чем-то непреодолимым, но не всегда. Похоже, что от способа создания PDF-файла это зависит. Я попробовал состряпать текст в рамке в Illustrator-е и в Word-е - Acrobat не вытащил текст ни из одного файла
А в ПДФ какой редакции ты выгонял? Варианты ответов на adobe.com 1.2, 1.3, 1.4, 1.5? Их же там несколько, и все обладают разными возможностями. Еще зависит от того, как создается ПДФ: сразу, напрямую из документа, или же используя PS-файл. Если второе, то на какой виртуальный принтер этот псник выгоняется, а потом чем преобразуется в ПДФ. Допустим, результаты работы Adobe Distiller и GhostScript разняться. Сужу это по тому, что ПДФ-файл, созданный дистиллером, не печатался как надо на HP1300, в отличие от файла, созданного GS. Так что причин может быть вагон и маленькая тележка
Цитата:
потом полез к XaraX
У этой программы своеобразное представление о PostScript, которое иногда не может понять ни один дистиллер
Цитата:
пойду InD, PM и FH помучаю
И ради чего все это? имхо, почитай лучше солюшены по формату пдф и постскрипт (можно взять на том же adobe.com, юзай поиск)
Цитата:
рамочка разбирается с помощью TouchUp Object Tool
Этим инструментом она не разбивается, а выделяются ее части. А разбивается она при создании файла. То есть если это был прямоуголник в Illustrator, и потом сделали пдф-файл, интерпретатор ПС мог решить, что ему проще разбить его на части, то бишь линии. К примеру, текст, расположенный на одной строке, может быть записан в пдф-файл по одной букве. Это можно посмотреть, взглянув во внутренности пс-файла — то, что в круглых скобочках — это и есть текстовые блоки.
И читайте, если есть возможность, руководства, почти все ответы на ваши вопросы — там!
DeadVillage
То, что ты делал (заливал белым, а потом накладывал текст) и есть работа со слоями.
aar
Цитата:
В данном случае нам все равно - Acrobat 6.02 не может работать со слоями. Почему?
aar
Цитата:
Ты много их видел? Я видел только для версии Acrobat 4.0 - пустая кнжка.
А если практически все работают на не совсем лицензионном софте, то руководства они и в глаза не видели. Так что лучше ищи решение, а то получается не очень красиво
То, что ты делал (заливал белым, а потом накладывал текст) и есть работа со слоями.
aar
Цитата:
А в ПДФ какой редакции ты выгонял? Варианты ответов на adobe.com 1.2, 1.3, 1.4, 1.5?
В данном случае нам все равно - Acrobat 6.02 не может работать со слоями. Почему?
aar
Цитата:
И читайте, если есть возможность, руководства
Ты много их видел? Я видел только для версии Acrobat 4.0 - пустая кнжка.
А если практически все работают на не совсем лицензионном софте, то руководства они и в глаза не видели. Так что лучше ищи решение, а то получается не очень красиво
aar
Цитата:
... спасибо, но руководства в лучшем случае растолкуют почему такая-то операция не проистекает ожидаемым образом. Но это не поможет переварачивать файлы по типу упомянутого в вордовские файлы без "хирургического" вмешательства.
Цитата:
... а мы и не разбиваем - мы разбираем
Цитата:
И читайте, если есть возможность, руководства, почти все ответы на ваши вопросы — там!
... спасибо, но руководства в лучшем случае растолкуют почему такая-то операция не проистекает ожидаемым образом. Но это не поможет переварачивать файлы по типу упомянутого в вордовские файлы без "хирургического" вмешательства.
Цитата:
Этим инструментом она не разбивается, а выделяются ее части.
... а мы и не разбиваем - мы разбираем
Предыдущая тема: САПР Компас
Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.