Ru-Board.club
← Вернуться в раздел «Программы»

» Помогите вытащить формулы из *.pdf файла!

Автор: DNA DAN
Дата сообщения: 07.06.2002 20:50
Текст нормально копируется из Acrobat Reader'а - а вот вместо формул всякая абракадабра!!!
что делать??
Люди - Help - формулы позарез нужно выдрать и отредактировать(В вордовском Math Type)!!!
Автор: vengr
Дата сообщения: 08.06.2002 00:40
DNA DAN
Acrobat (не Reader) немного лучше копирует.

но думаю, надо искать конвертор.
Автор: lucky
Дата сообщения: 08.06.2002 03:25
DNA DAN,
если те в граffiческой форме надо, то мОжу предложить "быструю" операцию
2 раза подряд стукни по кнопке "Print" - должен произойти сброс экрана в буфер обмена, потом Ctrl+V в любом граф.редахтуре и вырежи. А потом как графику вставляй в Word =)
С редактированием, правда, не прокатит =(
Автор: vserd
Дата сообщения: 08.06.2002 08:51
Скорей всего никак.
Т.к. формула это сложный объект со всякими извратами, и ты можешь ее нарисовать (засунуть в PDF), а вытянуть врядли, т.к. это просто набор управляющих кодов для формирования изображения на принтере. И конвертору не определить что кончился текст, и началась формула (особенно если она шестиэтажная). Так что действуй по методе lucky или перебирай ручками. :(
Автор: DNA DAN
Дата сообщения: 08.06.2002 11:20
Вот то что я имею в акробате:



Не правда ли формулы сильно смахивают на MathTyp'овские из Ворда?
они в Reader'е выделяются даже не так как картинки(т.е. целиком), а по отдельным буквам и знакам!
Не может быть чтобы они обратно не могли вернуться в ворд!!!
Автор: oio
Дата сообщения: 08.06.2002 12:01
DNA DAN

Цитата:
Не может быть чтобы они обратно не могли вернуться в ворд

Обратно в ворд, да ещё как мастайп они уже никогда не вернутся... Посимвольно - тоже без мазы - сам такой фигнёй маялся с месяц...
Только как битмап (в смысле растр).
Автор: vserd
Дата сообщения: 08.06.2002 12:17
Да там скорей всего и набиралось, хотя может какой нибудь PageMaker тоже нельзя исключать.

PDF это просто скомпилированный PostScript, который в свою очередь предназначен для вывода на печать очень сложных текстов. Принтер их обрабатывает, и рисует их на бумаге.
Т.е. для двух этажной формулы x/y, это сивол х, затем некий промежуток, затем линия, затем некий промежуток, затем символ y.
При засовывании их в pdf, сформировать как обыкновенные символы (заданного шрифта, с необходимыми директивами) непредставляет труда, а вот вытащить их обратно, да еще в OLE-объект MathType, да еще в правильной последовательности (со всеми верхними/нижними индексами, подчеркиваниями, спец. символами) задача для конвертора очень не простая.
Если кто-то и создал такой конвертор, то стоить он будет очень дорого.
Автор: Advanced_Guest
Дата сообщения: 08.06.2002 15:13
DNA DAN
А кто тебе мешает заново их вручную ввести В вордовский Math Type ?

IMHO - будет гораздо проще
Автор: DNA DAN
Дата сообщения: 09.06.2002 22:25
Advanced_Guest
Да мешает та уйма времени которая уйдет на это заново-вбивание их в MathType с нуля...
Автор: Uncle KILLER
Дата сообщения: 10.06.2002 01:55
DNA DAN, а если так: выдергиваешь их плугинами к Акробат Ридеру как картинки, а потом распознаешь в OCR-системе какой-нибудь?
Автор: vserd
Дата сообщения: 10.06.2002 08:31
Uncle KILLER
Чем распознавание формул через OCR отличается от вытягивания их сразу через конвертер?
Ответ ничем. Т.к. создатель OCR врядли будет мучатся с созданием OLE объекта MatchType.
DNA DAN
Неужели тебе нужно их все перенабирать? ведь это специализированный текст, и формулы там, в разных источниках, везде одинаковые, перенабирай только те, котрые нужно править.

Страницы: 1

Предыдущая тема: Light Alloy


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.