Ru-Board.club
← Вернуться в раздел «Программы»

» Adobe Acrobat

Автор: andysirin
Дата сообщения: 01.11.2004 12:34
Проблема следующая:
-есть pdf-файл собранный из отсканированных страниц.
-нужно распознать кусок текста (не весь текст) типа название статьи и ключевые слова и вставить их в виде техта, чтобы можно было производить поиск.
Может кто подскажет какой нибудь плугин или еще чего.
Автор: ZZmiy
Дата сообщения: 01.11.2004 15:30
andysirin
Такого плугина не видел.
Предлагаю пропустить этот PDF через FineReader, распознать и сохранить опять в PDF.
Автор: andysirin
Дата сообщения: 02.11.2004 05:31
ZZmiy
Прогонять весь файл через Finereader морока.
Вот если бы у Finereader как у Promt 7 был плугин для acrobata,тогда да

Добавлено
Поковырялся в Acrobate 6
меню DOCUMENT>>PAPER CAPTURE
там встроенная OCR делает почти то что нужно
только нет русского языка и работает со страницами, нельзя работать с выделенным фрагментом.
Автор: ZZmiy
Дата сообщения: 02.11.2004 09:57
andysirin
А в чем проблема пропустить через FineReader ?
Открываешь PDF в FR, формируешь два блока - там где распознавать - текст, там где не распознавать - картинка, сохраняешь блоки, потом накладываешь блоки на все страницы, пока накладывает - ищешь сигареты, пускаешь распознавание, пока распознает - куришь, проверяешь и сохраняешь как PDF...
Так просто получится, если в исходном PDF твои "типа название статьи и ключевые слова" находятся в одном и том же месте на всех страницах (чтобы блоки попали куда надо).
Автор: andysirin
Дата сообщения: 02.11.2004 10:11
ZZmiy
Проблема в том, что из 6-15 графических страниц нужно распознать и вставить кусок текста на 1-ой странице. После чего FineReader кричит, что сохранить может только распознанную страницу, а остальные нет. Можно конечно сохранить одну страницу, а потом в Acrobate ее вставить, но это столько м***ты. Хотелось бы упростить.

Добавлено
И кроме того после эксперимента выяснилось, что открытие графического pdf finereader-ом занимает приличное количество времени
Автор: bdfy
Дата сообщения: 10.11.2004 23:33
Adobe Acrobat 5.0.5
Присоветовали тут на печать листы из Mathcad2k1 через виртуальный принтре в pdf выкидывать ( дома принтака нет , а куда пойду печатать может маткада не быть ) . Но есть проблема : графика некоректно отображаеться штриховка черниться или шаг теряет . Ладно , выкручиваю качество , снимаю галки компрессии - тепреь наоборот линии толще и их меньше . Я долго игрался с настройками , но получить файл "как он был" не могу
Кинул сюда файл в pdf и в html
http://turel.boom.ru/mech.rar - 150 кило
Если что , графика в SmartDraw 6.51 сделана .

Автор: MetroidZ
Дата сообщения: 11.11.2004 19:07
bdfy
файл не смог скачать (404)
Возможно при печати все будет выглядеть нормально. Иногда акробат показывает корявые круги, которые после печати становятся идеально круглыми.
Надо просто проверить печать.
Автор: bdfy
Дата сообщения: 12.11.2004 00:30
MetroidZ
Вот точно рабочая ссылка http://redhammer.h14.ru/mech.rar
BTW , они из песни "помогите выбрать векторный редактор" так что у тебя могло еще что-то и завалятmcz похожее )
Я с настройками наверное час игрался ...мож кто на шестом акробате попробует ?

Акробат же позволяет редактировать пдф ? Как там строчку вниз опустить например ? рюшечек каких то много , а самого элементарного найти не могу ...
Автор: aar
Дата сообщения: 12.11.2004 07:25
bdfy
Напрямую акробат дает мало что подредактировать, так что не обольщайся. Посмотрел файл пдф, который ты дал. Все там нормально с линиями. При увеличении они все есть, четкая вертикальная штриховка. Даже если некоторые из них на экране кажутся чуть наклоненными, при печати все будет нормально. Акробат показывает графику более качественно, чем акробат ридер.
Автор: Restr
Дата сообщения: 12.11.2004 13:07
Кто знает, как защитить свой документ *.pdf от захвата из него изображений программами наподобие SnagIt?
Автор: ZZmiy
Дата сообщения: 12.11.2004 13:18
Restr
Никак - нет такой настройки безопасности в PDF. PrintScreen же не запретишь...
Автор: bdfy
Дата сообщения: 13.11.2004 14:42
При печати все действительно отлично . Это только акробат не до конца корректно отображает ...
Автор: Verter
Дата сообщения: 13.11.2004 18:25
Перечитал кучу топиков, но ответа так и не нашел.
Возможно, кто-нибудь пропробует вставить рус. текст в ету пдф-страничку:

__http://www.aloofhosting.com/baraban/Tale.of.two.Sieves.1th.page.pdf (84К)

Ну никак не получаеться....
П.С. У меня стоит: Adobe Acrobat 5.0 (есть еще Adobe Illustrator 9.0)
Автор: bdfy
Дата сообщения: 14.11.2004 01:50
Verter
У меня вообще ни в один пдф _русский- текст не вставляеться ... ( звездочки вместо букв ) . Акробат тоже 5тый.
ИМХО как варинт сохранить как rtf например , вставить что нужно и назад зажать - так работает , только форматировать текст придеться заново ( он весь по левому краю рровняется )
Автор: aar
Дата сообщения: 14.11.2004 09:33
Verter
Если мало русского текста, то ты можешь сделать ввод символов через ALT+цифровой код на дополнительной цифровой клавиатуре. Допустим, обыкновенное тире (—) вводится следующим образом: ALT+0151. Можно глянуть в таблицу символов и для русских. При этом, если используется внедренный шрифт, то он должен иметь эти буквы в своем составе, иначе будут звездочки. Лучше всего, если шрифт встроен полностью, а не частично.
Автор: Restr
Дата сообщения: 14.11.2004 11:49
ZZmiy

Цитата:
Никак - нет такой настройки безопасности в PDF. PrintScreen же не запретишь...


Всё верно. PrintScreen не запретишь. Есть и другие проги для захвата экрана. Например SnagIt. ACDSEE тоже захватывает.

Но однажды в запароленном документе *.pdf мне нужно было захватить текст и перебросить в Word (через Fine Reader).
Экран захватился, но качество захвата было такое низкое, что Fine Reader текст просто не распознавал.
При тех же настройках системы из других документов захват экрана распознавался отлично.

Может у кого есть свежие мысли или ссылки на похожие топики?
Автор: eika
Дата сообщения: 14.11.2004 22:20
Restr

Цитата:
Но однажды в запароленном документе *.pdf мне нужно было захватить текст и перебросить в Word (через Fine Reader).
Экран захватился, но качество захвата было такое низкое, что Fine Reader текст просто не распознавал.
При тех же настройках системы из других документов захват экрана распознавался отлично.

Бред. Что видно на экране, то и попадает в буфер при Print Screen.

Проблема была в чем-то другом (например, файл был сохранен с разрешением 72 dpi, а FR как известно, хорошо распознает при разрешениях > 300 dpi).
Автор: ZZmiy
Дата сообщения: 14.11.2004 23:48
Restr

Цитата:
однажды в запароленном документе *.pdf мне нужно было захватить текст

А зачем так извращаться, если проще снять пароль, сохранить в tiff, а дальше по этапу...
Если уж делать захват экрана с текстом, так надо увеличение делать как можно большее, тогда FineReaderу понравится...
Verter
Скачал твой PDF... Там запреты какие-то на ввод кирилических букв... Я таких еще не видел pdfов... Интересно, что про такой pdf думает renreg?
Ну кое-как получилось с извращениями вставить русский текст...
Открыл твой pdf, рядом другой - с русскими словами, из русского копировал, в твой вставлял...
Ты скажи, что ты хочешь именно с этим PDF сделать? Перевести, что ли?
Может проще перенабрать как тебе удобно и сделать другой (нормальный) PDF.
bdfy
А у тебя похоже просто-напросто Acrobat английский без поддержки кирилицы.
Найди лучше Acrobat 6 CE (Central Europe) - там русский вводится...
Автор: Restr
Дата сообщения: 15.11.2004 12:05
ZZmiy

Цитата:
А зачем так извращаться, если проще снять пароль, сохранить в tiff, а дальше по этапу...


Не сбросишь ссылку на инструкцию по снятию паролей с запароленных *.pdf файлов?
Заранее благодарен.
Автор: NikolayK
Дата сообщения: 15.11.2004 14:47
Кто-нибудь может подсказать по следующему глюку:
1. Текст сверстан в Pagemaker/
2. Текст распечатан на простом струйном принтере,
если замерить распечатанное тест. поле, оно такое какое должно быть,
то есть 100%.
3. А вот если текст перевели в PDF и распечатали ,то текст. поле уменьшилось
(около 90 %)
Сисиема Win XP Acrobat 6.0
Раньше под Win ME такого не было.
Автор: ZZmiy
Дата сообщения: 15.11.2004 15:12
NikolayK

Цитата:
около 90 %

А вот если для печати PDFа не жать кнопку печати на панели, а пойти через меню - Файл, Печать, то что увидишь с поле Обработка страниц - Размер страниц ?
У меня по-крайней мере стоит по умолчанию "Уменьшать большие страницы" и в поле Просмотр написан Масштаб 92%... А когда поставить Все в поле Размер страниц - то 100%.
Попробуй...

Добавлено
Restr

Цитата:
паролей с запароленных

Есть несколько программ для этого - Advanced eBook Processor, Advanced PDF Password Recovery, PDF Password Remover и др. См. в Варезнике...
Автор: NikolayK
Дата сообщения: 15.11.2004 15:40
Спасибо, попробую. Собственно проблемы начались,
когда я поставил Acrobat 6.0 и еще одновременно
Acrobat 4.0. дело в том что я работаю на PC, а распечатываю
на Mac (уже сами кальки) И при печати на Mac все хорошо, только
он воспринимает хорошо acrobat 4, на следующих версиях печать идет крайне медленно.
Попробую сегодня снести все Акробаты, поставить что-то одно.

Автор: aar
Дата сообщения: 16.11.2004 13:09
NikolayK
Посмотри на галочки в акробате при печати с названием Fit to page и другие из этой группы.

Цитата:
Попробую сегодня снести все Акробаты, поставить что-то одно

Не занимайся глупостями, а лучше почитай хэлп акробата по печати.
Автор: Widok
Дата сообщения: 16.11.2004 14:13
Официально объявлено о 7.0:
http://www.adobe.com/products/acrobatpro/main.html?c=us
Автор: VladZher
Дата сообщения: 16.11.2004 14:51
win98, foxpro, adobe 5

при печати отчета из foxpro на adobe distiller
отчет получается жутко маленьким

как победить?
Автор: QuickeneR
Дата сообщения: 18.11.2004 14:22
Столкнулся с такой проблемой: в pdf очень низкокачественные шрифты. Вот пример http://members.lycos.co.uk/thefilez/fonts.gif
Arial 8 в вордпаде смотрится раз в 10 лучше, чем непонятно что в акробате.
Файл не сканированный (гугль его индексирует успешно), т.е. проблема именно в шрифте. Пытался изменить его в акробате, но не нашел как.

Спецы по акробату, подскажите плиз, что здесь можно предпринять для улучшения читаемости.
Пример файла http://www.cs.toronto.edu/~cvs/dlog/research_paper.pdf
Автор: aar
Дата сообщения: 18.11.2004 14:45
QuickeneR
Похоже, что у тебя документ из TeX. И это растрированные шрифты. Чтобы такого не было, надо иметь векторные шрифты именно в TeX'е. Подробнее можно сказать, когда узнаю, чем ты пользуешся для создания ps и pdf файлов.
Автор: QuickeneR
Дата сообщения: 18.11.2004 16:57
aar
Я их ничем не создаю, я их только читаю
Файл не мой, так что повлиять на его тексовый исходник затруднительно.
Автор: aar
Дата сообщения: 18.11.2004 17:03
QuickeneR
При печати все будет нормально — не отличишь от векторного. А тот человек, который создавал такой документ, имеет малость кривоватые ручонки
Автор: QuickeneR
Дата сообщения: 18.11.2004 17:24
aar
А если надо с монитора читать - уже ничего не сделаешь?
Что же касается кривоватых ручек, в некоторых областях (в этом случае академических) не принято особенно гнаться за результатом: работает - и ладно.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667

Предыдущая тема: Becky! Internet Mail


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.