Ru-Board.club
← Вернуться в раздел «Программы»

» Adobe Acrobat Professional

Автор: deadcat
Дата сообщения: 27.10.2007 11:02
renreg
Издеваешься?
Ты вот это читал?

Цитата:
Такая вот задачка:
Есть книжка в пдф, буковки в книжке выглядят неровными, вот так:

При использовании инструмента Выделение->Копировать, копируется вполне внятный текст, т.е. все распознано. Где то встречал что в пдф сгенереным файнридером может быть на распознаный текст наложена картинка. И что картинку можно убрать при помощи Adobe Acrobat.
Подскажите плиз, как убрать кривые сканы и оставить только распознанный текст.

P.S. В наличии есть Adobe Acrobat 8.1 Pro Rus

Я не хочу никакого OCR, я хочу убрать картинки над уже хорошо распознанным текстом.
Автор: Astra55
Дата сообщения: 27.10.2007 11:46

Цитата:
Про конвертер не совсем ясно

Я уже точно не помню, какой применял, если можно, то небольшой пример из книги, с десяток страниц, тогда скажу точно что подходит для такой операции.
Автор: deadcat
Дата сообщения: 27.10.2007 12:17
http://deadcat99.at.tut.by/123.rar (1MB) - кусок книжки
Автор: feuerloescher
Дата сообщения: 27.10.2007 13:17
deadcat
Save as в Acrobat в, например, rtf без картинок. Скриншоты там бесполезного качества и являются частью "кривых сканов" над невидимым текстовым слоем.
Finereader (pdf сделан с его помощью) распознал кстати текст на этих скриншотах тоже где смог.


Цитата:
И что картинку можно убрать при помощи Adobe Acrobat.

Это несложно, гораздо трудней будет сделать невидимый текст видимым.

Совет воспользоваться OCR вполне разумный, насколько мне известно программы ABBYY понимают этот невидимый слой.


Цитата:
_http

прочти пункт 2.21. в правилах форума
Автор: Astra55
Дата сообщения: 27.10.2007 13:41
Резюме такое (файл я не качал, а нашел у себя похожее творение:
В Ворд конвертит Solid Converter, но получается накладка текста на графику, можно через удаление подложки сделать нечто читаемое, но картинки сгинут.
В текст корректно конвертит ТОЛЬКО PDF2Text v1.09 от http://www.traction-software.co.uk/pdf2text/ , но опять же, картинки сгинут. OCR не имеет смысла, я проверил на PDF Transformer, он делает все заново и добавляет свои ошибки, поскольку графика уже испорчена.
Make your choice!
Автор: lsn
Дата сообщения: 27.10.2007 14:21
Почитал я ваши последние прения, умные наверно вы, а вот на мой простой вопрос заданный ранее на предыдущей странице ответить не можете. Может я и ошибаюсь, но очень хочется получить ответ.
Автор: Astra55
Дата сообщения: 27.10.2007 14:35
Если с чтением все в порядке, то просто прочитать простой ответ на простой вопрос.
Автор: renreg
Дата сообщения: 27.10.2007 14:59
lsn
Цитата:
Вопрос такой. На экране шрифт выглядит как надо. При печати (в некоторых документах) - одни крякозябры.

Или сказать по другому, что бы было на экране и на бумаге одинаково.

Поскажите в какой ветке форума искать ответ.


Это значит, что при создании PDF шрифты были неправильно встроены в PDF.
Это неаз обсуждалось и поэтому никто не отвечал.
Нужно создать как создавался файл. Я не раз разбирался в этом, но надоело говорить всем одно и тоже: "Хочешь получить нормальный ответ - отвечай на вопросы полностью".

Ты же не написал НИЧЕГО: ни программы, ни формата шрифтов, ни драйвера....
Ты когда жениться будешь имя у невесты спросишь? Или будешь называть НЕВЕСТА и ЖЕНА

Теперь понял почему НЕ МОЖЕМ ответить?
Автор: feuerloescher
Дата сообщения: 27.10.2007 15:30

Цитата:
ТОЛЬКО PDF2Text

Текст в выложенном pdf Save as в Acrobat 7 сохранил в txt и rtf на первый взгляд вполне корректно, включая распознанные Finereader надписи на скриншотах. Дословно я не проверял.
Автор: Astra55
Дата сообщения: 27.10.2007 16:06
Я же сказал, что пробовал на другом файле, Акробат при rtf вообще повернул все страницы на 90 градусов. Что до обычного текста, то все получается сдвинутым к левому краю, у плагина форматирование сохраняется. Теперь попробовал на приложенном файле, практически такая же картина. Если бы в Акробате были средства для корректного сохранения текста в разных форматах, то кто бы стал девелопить плагины и отдельные софты для той же задачи?
Автор: deadcat
Дата сообщения: 28.10.2007 03:33
Удалось удалить графический слой на конкретном листе (Инструменты->Дополнительное редактирование->Редактирование объектов). Под картинкой оказался невидимый текст. При установлении заливки черным, кирилица остается не видна. Что можно с этим сделать?
Автор: lsn
Дата сообщения: 28.10.2007 10:21

Цитата:
[/q]
[q]lsn
Цитата:Вопрос такой. На экране шрифт выглядит как надо. При печати (в некоторых документах) - одни крякозябры.

Или сказать по другому, что бы было на экране и на бумаге одинаково.

Поскажите в какой ветке форума искать ответ.


Это значит, что при создании PDF шрифты были неправильно встроены в PDF.
Это неаз обсуждалось и поэтому никто не отвечал.
Нужно создать как создавался файл. Я не раз разбирался в этом, но надоело говорить всем одно и тоже: "Хочешь получить нормальный ответ - отвечай на вопросы полностью".

Ты же не написал НИЧЕГО: ни программы, ни формата шрифтов, ни драйвера....
Ты когда жениться будешь имя у невесты спросишь? Или будешь называть НЕВЕСТА и ЖЕНА





Теперь понял почему НЕ МОЖЕМ ответить?



Я же просил всего навсего подсказать - В КАКОЙ ВЕТКЕ ФОРУМА ИСКАТЬ ОТВЕТ-
(Ведь здесь столько информации, что не сразу же её найдёш. Тем более что я этой проблемой первый раз столкнулся. До этого всё было нормально.)

И далее если бы я не нашёл, я конечно бы полностью расписал проблему.
Про шрифты, формат и т.д. я в курсе.

Теперь про женитьбу. В этом году я с женой отметил серебрянную свадьбу. И уж как её звать за эти годы я запомнил. Но это так к слову.

Astra55
Вот почитай мой вопрос повнимательно , а потом подкалывай.
Хоть на форуме все и равны но надо оставлять в мыслях мыысль о том. кто и в каком возрасте с тобой здесь ведёт беседу. Форумчан надо УВАЖАТЬ. И это первое правило данного форума

renreg
Тебе спасибо.
А спроблемой я разобрался. У меня кто-то из домашних на компе убрал одну галочку в в дополнительных свойствах принтера .



Автор: Astra55
Дата сообщения: 28.10.2007 11:37

Цитата:
Цитата:При печати (в некоторых документах) - одни крякозябры

Либо править соответствие фонтов, либо печатать как изображение, есть такой пункт в настройках печати Акробата.

И где тут усмотрено какое-либо несоответствие ответа на вопрос? И раз уж так вопрос поставлен, то тыкать другим тоже не лучший способ доказать свой преклонный возраст. Я уже десять лет на пенсии, но это никакой роли на форуме не играет.
Автор: Lapa222
Дата сообщения: 04.11.2007 11:18
При запуске Setup вылезает окошко с выбором языка (русский) нажимаю OK, вылезает следующее окно

Adobe Acrobat 8 Professional Multilanguage
Operating System : Windows XP Professional (5.01.2600 Service Pack 2)
Country : Russia
Language : Russian
Установил WindowsInstaller-KB893803-v2-x86
В чем может быть причина?
Автор: feuerloescher
Дата сообщения: 04.11.2007 13:01
Lapa222
Место свободное есть на диске?
Автор: Lapa222
Дата сообщения: 04.11.2007 13:08

Цитата:
Место свободное есть на диске?

33ГБ

Всё установилось. Вопрос снят.
Автор: hel
Дата сообщения: 05.11.2007 06:16
В Висте Адоб Акробат и все остальные (Inceni, Foxit и еще несколько других) показывают вместо русского текста кракозябрики. Проблема, что в висте нет определенных фонтов(Helvetica, Times и т.п.) Где их взять?
Автор: feuerloescher
Дата сообщения: 05.11.2007 10:29
hel

Цитата:
в висте нет определенных фонтов(Helvetica, Times

Их нет и в XP. Те которые раньше входили в дистрибутив Acrobat и Adobe Reader кириллицы все равно не содержали.
Покажите PDF.
Автор: hel
Дата сообщения: 05.11.2007 13:43
Джуди Смит, Дорил Холл, Бел Гиббс
Йога. Большая иллюстрированная энциклопедия

http://touching.ru/article/library/tekst_library#ii - вот отсюда.

Неужели нет такого как было в ХР, font substitute? Как в ХР не сработало, пыталась дописать в реестр, перезагрузилась - не работает.
Один только выход нашла, открыть Inceni и поблочно менять шрифты, но там блоки очень мелкие, трудно.

Добавлено:
Мда... Еще один вариант: сохранить как ворд и там поменять шрифт... Чуть получше, только блоки съезжают. Так уже читать хоть можно.
Автор: Astra55
Дата сообщения: 05.11.2007 15:50
Совершенно нормальный файл. Гельветика тут не при чем, она штатно меняется на АриалМТ. Копайте свою, извините за выражение, сВисту, косяки явно в ней зарыты. Оба Акробата - полный и Ридер, а также ФоксИт кажут все как надо. Фонты в ХР штатные, ничего кроме русских допкодировок не добавлялось. Шрифты меняет EnfocusPitSiop, но это карты в руки feuerloescher-у, я с этим плагином практически не работал.
Автор: hel
Дата сообщения: 05.11.2007 16:04
Вот ведь... Виста... Спасибо, попробую EnfocusPitSiop.

Добавлено:
EnfocusPitStop наверное?
Автор: Astra55
Дата сообщения: 05.11.2007 19:02
Да, у меня была опечатка.
Автор: hel
Дата сообщения: 07.11.2007 02:03
Спасибо! Да ну ее в баню, снесла к монахам, переставила обратно ХР. Компьютер просто летает.
Автор: Astra55
Дата сообщения: 07.11.2007 05:57
Лишь бы совсем не улетел А как с отображением пресловутого файла дела обстоят? Направилось или по прежнему есть нужда в правке?
Автор: renreg
Дата сообщения: 07.11.2007 05:58
lsn

Цитата:
А спроблемой я разобрался. У меня кто-то из домашних на компе убрал одну галочку в в дополнительных свойствах принтера .


Кошка, кто же еще
Автор: feuerloescher
Дата сообщения: 07.11.2007 08:04
Pitstop скорей всего не поможет. Finereader прописывает левые названия использованных шрифтов, под XP подмена работает, под Вистой видимо нет.
Самое простое перепечатать на pdf-принтер с включенной в настройках опцией embed.
Автор: hel
Дата сообщения: 08.11.2007 19:58
В ХР все работает без дополнительных танцев с бубном! И микрофон оказывается работает, и бат-почтовик работает. Сколько счастья сразу.
Автор: Astra55
Дата сообщения: 09.11.2007 05:50
Ну вот, а то все на лыжах и стоя в гамаке, то бишь, на Висте и с приключениями
Автор: Alex_B
Дата сообщения: 12.11.2007 01:19
В Акробате 8.1.1 английском (как и раньше) имеется проверка орфографии русского языка (в комментариях, например). В опциях поставил галку на Russian, но проверка не работает. В 7-ой работало. Как настроить проверку?
Автор: realmari
Дата сообщения: 22.11.2007 00:06
Привет всем, может кто нибудь знает в чем проблемаю При пересохранении pdf в word
документ сохраняет форматироавние абзатцев, но при попытке работать с абзатцами выясняется что каждый абзатц заключенр в невидимый текстовый блок( рамочку) и работать со всем текстом без отдельного копирования каждого абзатца в новый документ не возможно. Может фишка в каких нибудь настройках?? Ках переконвертировать pdf файл в док, что бы документ не разьивался на подобные абзатцы рамочки и что бы с текстом можно было работать как с единым целым?

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179

Предыдущая тема: проблема с отправкой писем


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.