Ru-Board.club
← Вернуться в раздел «Программы»

» Adobe Acrobat

Автор: krukoff
Дата сообщения: 13.03.2006 00:23
Astra55

Цитата:
krukoff
>При попытке конвертирования файла (*.spl от программы Splan 5.0) выдает ошибку
Действо не имеет смысла, sPlan не может печатать в векторе

Сколько времени прошло после моего вопроса.
Если бы не feuerloescher, то я бы так и думал, что не удастся в *.pdf конвертировать spl-файл.
Автор: Eliza
Дата сообщения: 13.03.2006 00:30
Astra55

Цитата:
Глава 8
12. И поняли спросившие, что за падло их держат, и решили сами попробовать, но фраернулись.
13. И порешили меж собой: крут, а мы перед ним сынки.

Гыыы! (На выдохе, восхищённо)... Мощнааа...
Автор: Astra55
Дата сообщения: 13.03.2006 17:01
Гм, я полагал, что Евангелие от Митьков достаточно известно публике. Но к теме pdf это имеет смутное отношение

Добавлено:
2 krukoff

Так ведь и я тоже вполне искренне заблуждался, поскольку немцы вроде накосячили.
Хотя есть странные файлы pdf, недавно скачал кучу журналов, все genuine pdf, явно от издателя. Но некоторые года печатаются в pdfFactory только как графика, виртуал не принимает их за pdf, хотя никаких сомнений нет.
На других журналах оценил достоинства Акробата 7, как оптимизатора pdf, результаты весьма впечатляющие:
pdf оригинал - 111 102 509, pdf ужатые - 43 000 092, на качестве абсолютно не отразилось. Серьезная экономия получилась, причем на ровном месте.
Автор: ozioso
Дата сообщения: 13.03.2006 18:48
Был установлен Acrobat Reader 7.0.7 - смотрел я им все ПДФки. Установил Acrobat 6.0 CE Professional - в результате ПДФ файлы стали открываться при просмотре из Проводника именно в Acrobat 6.0 CE Professional. Как я могу ассоциировать ПДФ-файлы с Acrobat Reader 7.0.7 и избежать в дальнейшем "несанкционированной" смены ассоциаций?
Автор: rex
Дата сообщения: 13.03.2006 19:27
ozioso

Цитата:
Как я могу ассоциировать ПДФ-файлы с Acrobat Reader 7.0.7 и избежать в дальнейшем "несанкционированной" смены ассоциаций?

Да как обычно
Правый клик на pdf файле, Свойства -- Изменить -- Adobe Reader 7.0
Автор: ozioso
Дата сообщения: 13.03.2006 19:56
rex
И в дальнейшем не будет никаких "самозахватов" ассоциаций ни одной из программ?
Автор: Irbius
Дата сообщения: 16.03.2006 14:10
Может кто подскажет как решить проблему конвертирования pdf в doc. По прочтению данной ветки увидел что подобные проблемы возникают часто только их причины и их решения бывают различными. В моем случае имеется pdf. В архиве с файлом были шрифты true type. Для интереса попробовал открыть файл без их установки – получил кракозябры. Установил шрифты pdf читается. При конвертировании в doc, rtf или htm с помощью Adobe Acrobat 6.0СЕ в итоговом файле получаются кракозябры. Пробовал так же с помощью Solid Converter PDF 3.0 – так же получаются кракозябры но немного другого вида. Solid Converter PDF в отчете пишет:
Внешний вид выходного документа может отличаться от исходного так как
Документ содержит внедренный шрифт
Документ не использует встроенных шрифтов

Как с этим бороться?
Автор: vitaly1
Дата сообщения: 16.03.2006 14:34
Irbius
Попробуйте ФайнРидер. У меня он работал лучше всех других конверторов.
Автор: Astra55
Дата сообщения: 17.03.2006 19:58
ФайнРидер не имеет ни малейшего отношения к конвертации pdf. В принципе. Иначе это был бы совершенно другой софт . Ибо он делает из pdf растр и распознает его, что назвать конвертированием вряд ли можно, получается совершенно другой документ.

Пока что, наиболее корректно, с созданием файлов примененных фонтов и минимальным размером конечного документа, работает PDF Grabber 3. Где его брать и как лечить - другая тема для другого места. Если нужно plain текст, то вроде бы я уже упоминал плагин к Акробату от Тракшн и отдельный конвертер от Гленн Алкотт.
Автор: vitaly1
Дата сообщения: 17.03.2006 20:41
Astra55

Цитата:
ФайнРидер не имеет ни малейшего отношения к конвертации pdf

Смотря что понимать по конвертацией Существует ведь ABBYY Pdf Transformer, который как раз и предлагается, как средство перевода пдф-ов в доки. Судя по всему, это просто обрезанная версия ФайнРидера с минимумом настроек. Даже ошибки в словах при распознавании делают одинаковые.
Автор: feuerloescher
Дата сообщения: 17.03.2006 23:17

Цитата:
Если нужно plain текст

Для простого текста достаточно pdftotext.exe из Xpdf
http://www.foolabs.com/xpdf/download.html
Автор: DeadVillage
Дата сообщения: 17.03.2006 23:38

Цитата:
ФайнРидер не имеет ни малейшего отношения к конвертации pdf. В принципе.


Как в принципе работает конвертор, если не лезть во внутрь?
... на входе "чёрного ящика" имеем пдф
... на выходе - текстовый файл
... что именно и как происходит внутри "чёрного ящика" - какая разница?

ФР в частном случае работае именно так и потому является конвертором

иные плюсы ФР:
1. довольно хорошо переносит формат исходного документа в желаемый док-файл. Согласен, что могут быть ошибочки распознавания. Но тогда вот вам ишо один плюс:
2. позволяет "конвертнуть" в док и пдф-ы состряпанные из сканов. Без распознования их в текст не перевернуть.
Автор: Irbius
Дата сообщения: 19.03.2006 12:11

Цитата:
Попробуйте ФайнРидер.

пробовал. файл получился без кракозябрин но так как в документе используются необычные шрифты ФайнРидер наделал кучу ошибок, которые замучаешься исправлять да и файл он обрабатывает уж очень долго по сравнению с Solid Converter PDF.

Цитата:
Если нужно plain текст, то вроде бы я уже упоминал плагин к Акробату от Тракшн и отдельный конвертер от Гленн Алкотт.

поясни пожалуйста что такое plain текст? не подскажешь ссылочки на упомянутые тобой плагин от Тракшн и конвертер от Гленн Алкотт?
надо будет попробовать PDF Grabber 3. с трафиком правда под конец месяца напряженка
могу ошибаться но по моему при работе с готовыми документами лучше использовать софт который работает с файлами одного "типа" (текстовый документ) переводя их в другой "вид" (doc, rtf, pdf, html). в этом случае если прога корректно подцепит шрифт будет меньше ошибок. да и обработка гораздо быстрее. когда же картинка в текстовый документ (как ФайнРидер) получается наоборот.
Автор: aar
Дата сообщения: 19.03.2006 12:56
Irbius
Попробуй программу, которую посоветовал feuerloescher для извлечения текста (plain text — это обыкновенный текст, без разметки).

Или выкладывай PDF со шрифтами вместе.
Автор: Astra55
Дата сообщения: 19.03.2006 18:47
Если после "конвертации" нужно править ошибки, причем непредсказуемые, то это уже не конвертация, а OCR. Со всеми вытекающими и независимо от названия - ФайнРидер, Трансформер или еще что-то. Нравится считать это конвертацией? Да сколько угодно, не буду спорить.

Насчет Тракшн - h**p://www.traction-software.co.uk/pdf2text/
Насчет Гленна - h**p://www.galcott.com/pd.htm , вот только там версия 1.4, в ней добавлена фича сохранения страниц в виде картинок, по моему, софт стал хуже работать, бывают отказы без объяснения причин, я откатился на версию 1.2, последнюю без наворотов.
Необходимые "дополнения" имеются.

Почему один конвертер правильно извлекает текст из одного файла и затыкается на другом, а второй наоборот? Тайна сия велика есть и заключена оная в фонтах, коих великое множество. Подвластно исправление сего глюка только девелоперам, а общение с ними затруднено по причине некупленного софта .
Автор: DeadVillage
Дата сообщения: 19.03.2006 19:12
... а об чём спорить-то? ФР распознаёт, но править часто надо когда шрифты с выгибонами. "Конверторы" конвертят, но чаще всего формат исходной страницы не поддерживают. Так чтоп править результат тож надо.

Цитата:
Тайна сия велика есть и заключена оная в фонтах, коих великое множество.
... либо в способе создания пдф-а
Автор: feuerloescher
Дата сообщения: 19.03.2006 21:00
Да, еще с Xpdf-овским pdftotext внутри работает PDF2HTML, к которому есть еще и GUI (http://guiguy.wminds.com/downloads/pdf2htmlgui/)
При этом сохраняется кое-какое форматирование (цвет, п/ж, курсив, размер шрифта), правда придется в html коде поправить charset=ISO-8859-1 на charset=windows-1251 в случае кириллицы -- пара секунд в многооконном текстовом редакторе, типа Aditor.
Автор: Irbius
Дата сообщения: 21.03.2006 20:56

Цитата:
Для простого текста достаточно pdftotext.exe из Xpdf
http://www.foolabs.com/xpdf/download.html

что-то не получилось у меня разобраться с Xpdf. скачал xpdf-3.01.tar.gz но в архиве не нашел ни pdftotext.exe, ни pdftohtml.exe. такое впечатление что там одни исходники.

Цитата:
Или выкладывай PDF со шрифтами вместе.

http://www.orth.kherson.ua/save/kanon.rar
может быть так действительно быстрее удастся решить проблему конвертации.
Автор: feuerloescher
Дата сообщения: 22.03.2006 00:15

Цитата:
xpdf-3.01.tar.gz

Там написано же, "Linux". А ниже "DOS/Win32", файл xpdf-3.01pl2-win32.zip

В pdf использованы шрифты с кустарной кодировкой, xpdf дает такой результат:
http://www.mytempdir.com/533273
Все кроме простой кирилицы теряется.


Цитата:
файл он обрабатывает уж очень долго

Если сохранить pdf из Acrobat в jpeg-и или tif-ы (Save as...) то Finereader будет работать с ними быстрей.

Цитата:
ФайнРидер наделал кучу ошибок

У него нет подходящего словаря для этого.

В качестве утешения pdf для просмотра которого не потребуется больше ставить шрифты.
kanon2.zip (2,242,003 b)
http://www.mytempdir.com/533566

ps: Можно поизучать Xpdf Cyrillic support package, и подредактировать файлы, но это довольно сложно.
Автор: Astra55
Дата сообщения: 22.03.2006 22:10
Как два пальца об асфальт . Поставил фонты, ФайнПринт конвертнул сносно, Гленн - хорошо, Тракшн - отлично, на мой взгляд, включил даже украинский. Потребовалось только заменить "=" на ничто, но тут уж что делать, нет в обычных фонтах ударений.
Первый вариант - Гленн, я не стал менять "=" для наглядности. Вот результат:
http://rapidshare.de/files/16164905/kanon.RAR.html - 170 кил
Автор: feuerloescher
Дата сообщения: 23.03.2006 12:10

Цитата:
но тут уж что делать, нет в обычных фонтах ударений.

Вообще то есть например U+0301 : COMBINING ACUTE ACCENT в том же Times New Roman.
Word их умеет ставить над буквой.
Ctrl H "=" заменить на "^c"
[more]Пуск > Программы > Стандартные > Служебные > Таблица символов > Галка на "Дополнительные параметры" - Группировка "Дополнительные диакритические" - Второй слева вверху - Копировать и вставить в Word (Больше - Специальный - Содержимое буфера обмена) в поле "Заменить на"[/more]
File kanonUdar.rar (258,460 b) has been successfully uploaded.
Link to the file:
http://www.mytempdir.com/536789
Автор: Astra55
Дата сообщения: 23.03.2006 16:12
Само собой, что это все можно,. только в мою задачу это не входило. Заменить букву и "=" на необходимый знак - дело нескольких минут. Дело было в принципиальной возможности конвертировать искомый pdf в текст и в правильном выборе конвертера. Xpdf меня совсем не впечатлил, равно как и pdf2html, только что бесплатные, но на этом достоинства кончаются .
Автор: feuerloescher
Дата сообщения: 23.03.2006 16:31

Цитата:
Xpdf меня совсем не впечатлил

А меня впечатлили знаки абзаца после каждой строчки после Traction и Glenn
Такой убогий способ сохранять форматирование в дальнейшем довольно сложно исправить.
Автор: DimONtm
Дата сообщения: 23.03.2006 18:32
Поставил себе 7-ой акробат с 4-го CD CS2 Rus, чтобы настроить его на понимание кириллицы.
Согласно инструкции, пытаюсь сделать апдейт до 7.0.5 файлом Ac705aCS2PrP_rtrc.exe [28 081 167 байт].
Столкнулся с трудностями:
1) Во время апдейта появляется окно ошибки с текстом:

Цитата:
==============
Windows Installer
==============
Cлужбe Windows Installer нe удaeтcя уcтaнoвить пaкeт иcпpaвлeний, пocкoльку либo oтcутcтвуeт oбнoвляeмaя пpoгpaммa, либo cущecтвуeт
oпacнocть oбнoвлeния дpугoй вepcии этoй пpoгpaммы. Пpoвepьтe, чтo oбнoвляeмaя пpoгpaммa пpиcутcтвуeт нa кoмпьютepe, и чтo иcпoльзуeтcя пpaвильный пaкeт иcпpaвлeний.

кликаешь ОК, окно закрывается и пипец, больше ничего
2) В меню Файл/Создать pdf/Из Web страницы, в списке выбрать html, "Параметры" нет выбора "Кириллица (Windows)"

Естественно, что вставлять киррилический текст в pdf я не могу
Думаю, что 2-ое - это следствие 1-го.

Очень прошу помочь с ответом на вопрос - где рыть, в чем причина ?
Заранее спасибо.
Автор: Astra55
Дата сообщения: 23.03.2006 20:22
2 DimONtm

В дистрибутиве. У меня с вебовской версия точно такая же штука была. Насколько я понял, это не лечится простыми способами. Купил дисковую версию, на нее все встало как по маслу. Если нужно, то могу выложить sfv файлы для вебовского и нормального дистрибута, включая распакованный cab, поскольку именно в нем сидит все самое существенное, типа файлов RUS.

2 feuerloescher

На то, чтобы привести такой текст в нормальное состояние, нужно минут пять-десять времени, УльтраЭдит и Словогрыз. Будет любой формат, какой пожелает душа. Я такие кривые тексты из конвертированных pdf-ов правил для последующей загонки в базу dbf, что меня не напугать пустяками типа множественных пробелов и прочего мусора .
Автор: feuerloescher
Дата сообщения: 23.03.2006 20:36

Цитата:
ытипа множественных пробелов и прочего мусора

А как с абзацами в строчках? Все 300 страниц за 5 минут и как надо? И зачем вообще бороться с ними если можно xpdf без них вынуть?
Автор: DimONtm
Дата сообщения: 23.03.2006 21:12
Astra55
Как узнать, какая версия?
Человек ставил с этого же дистрибутива и проблем не было...
Выкладывай.
Заранее спасибо!
Автор: Astra55
Дата сообщения: 24.03.2006 18:36
2 DimONtm

Вот файлы sfv, там же файл отличий двух версий.
h**p://rapidshare.de/files/16313180/Acro7.zip.html

Насчет установки другим челом - это очень любопытно, можно ли узнать чем именно у него отличалась система, может быть решение лежит на поверхности? Отслеживать инсталл ФайлМоном мне было лень, поэтому когда попался новый диск, то выяснять в чем дело я уже не стал. Да и слишком велики отличия в дистрибутах.

2 feuerloescher

Поскольку мы оба не знаем, что именно было нужно страждущему, то гадать и приводить рецепты бессмысленно. Я получил текст в других конвертерах, в виде doc или rtf, там будет больше похоже на оригинал. Но поскольку в начале речь шла о plain тексте, то сдается мне, если оный выдран и выдран правильно, то его форматирование - другой вопрос, который решается в зависимости от требований. Которые мы, опять таки, не знаем. К тому же консоли я органически не перевариваю, пользуюсь только по крайней нужде, если ничего другого нет .


Автор: Irbius
Дата сообщения: 25.03.2006 12:58
Большое спасибо Astra55 и feuerloescher за оказанное внимание моей проблеме и помощи в ее разрешении.

Цитата:
Я получил текст в других конвертерах, в виде doc или rtf, там будет больше похоже на оригинал.

можешь поподробней поделиться своими результатами.

Цитата:
в начале речь шла о plain тексте

да вобщем-то нет. хотелось именно максимально похоже на оригинал и чтобы не было по возможности проблем с форматированием документа (шрифт, поля)
Автор: Astra55
Дата сообщения: 26.03.2006 16:52
Наилучшие результаты показал ScanSoft PDF Converter 3, примеры лежат:
h**p://rapidshare.de/files/16470616/kanon14_50a.rar.html. Само собой, что в системе должен быть этот кривой фонт Triod, он же Петербург. Если удалить ударения, то будет смотреться получше. Пробовал разные варианты, например, конверт в Акробате 7 в html, потом из браузера можно вставлять в Ворд, но с упомянутым фонтом. Форматирование при этом теряется. Еще подходит фонт Futura.
Кроме того, можно копировать текст в Ворд прямо через клипборд из Infix, другие редакторы pdf такого не могут.
Словом, инфа для размышления есть, дальше дело хозяйское как ее использовать.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: Becky! Internet Mail


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.