Ru-Board.club
← Вернуться в раздел «Программы»

» Из pdf в текст (doc, txt, html)

Автор: Margel
Дата сообщения: 30.05.2002 11:55
Братва срочно нужен конвертер с PDF на Текст (*.Doc,*.Txt ) !

Кто знает откуда скачать полную версию?????
Автор: snop
Дата сообщения: 30.05.2002 12:18
da i ne polnuu toje neploho
est pdf2doc,no on tolko dlia Palm doc files
Автор: Ant
Дата сообщения: 30.05.2002 13:14
Adobe Acrobat (ne Reader). В меню файл выбираешь сохранить как... в списке типов файлов выбираешь rtf. Картинки тоже можно отдельно вытащить. В чем проблема??
Автор: snop
Дата сообщения: 30.05.2002 13:57
Ant
thanks,
ia daje i ne podumal chto tak mojet bit
Автор: 4567
Дата сообщения: 31.05.2002 22:45
Ant
--------------------------------------------------------------------------------
Adobe Acrobat (ne Reader). В меню файл выбираешь сохранить как... в списке типов файлов выбираешь rtf.
В чем проблема??
--------------------------------------------------------------------------------
проблема вот такая :

Aaei, anniio aiiia Eiinoeoooeiiiui Noaii inneeneie Oaaa aoee (Iinoaiiaeaiea io 20 oaa aey 2001 a. 3-I) ii aei-aa CAI «Ainoieiaooa ano n», ii ao neo eou i eia ii oiai, eae i aaii eiaieoaeuiua i aaiu ia ianoao, iieucoynu ia aoeinou ii iu iaeiaiaiai caeiiiaaoaeunoaa, ac aoa o aaei oaeoe anee i iecaieuii, ii naiaio oniio aie . I e eiie oaeiai i iecaiea ii

Не знает ли кто
как это всё профиксить ???
( оригинал pdf-документа был по - русски )

Автор: vserd
Дата сообщения: 01.06.2002 08:43
4567
1. Попробуй выделить текст и назначить русский шрифт.
2. Посмотри чем создавался документ. Если pdfWriter то, ой. Он русские буквы картинками делает.
Автор: 4567
Дата сообщения: 01.06.2002 20:05
vserd
1. Попробуй выделить текст и назначить русский шрифт.
2. Посмотри чем создавался документ.
------------------------------------------

Что надо сделать я понял !
("назначить" + "чем создавался документ")


Но как это "назначить" ?
Где посмотреть "чем создавался документ" ?
Автор: DiCH
Дата сообщения: 01.06.2002 22:27

Цитата:
Adobe Acrobat (ne Reader). В меню файл выбираешь сохранить как... в списке типов файлов выбираешь rtf. Картинки тоже можно отдельно вытащить. В чем проблема??

А если есть только reader и rtf меня не устраивает?

Может есть какие-то утилиты?
Автор: 4567
Дата сообщения: 02.06.2002 13:30
DiCH
>>>Может есть какие-то утилиты?

---
Плагины для Adobe Acrobat

http://www.pdfzone.com/products/software/toolinfo_extract.asp


BCL Drake v.5.0
Инструмент для конвертации PDF в RTF.
Запуск программы из меню Plugins Acrobat'а.

BCL Freebird v.5.0
Инструмент для конвертации PDF в TIFF, JPEG и BMP.
Запуск программы из меню Plugins Acrobat'а.

BCL Jade v.5.0
Инструмент вытаскивания содержимого PDF файла в любой текстовый процессор.
Запуск программы из меню Plugins Acrobat'а.

BCL Magellan v.5.0
Инструмент для конвертации PDF в HTML.
Запуск программы из меню Plugins Acrobat'а.
http://www.epublishstore.com/details.asp?ProdID=24

Crackerjack v.3.2
Плагин для цветной печати.


CreoScitex PDF Seps2Comp v.1.5 with S2C Plateview
Плагин для трансформации разрозненных PDF файлов в один.


Image Solutions Icopy v.1.2.01
Плагин для работы с графическими PDF файлами.


Image Solutions ISI Toolbox v.3.1.05
Набор инструментов для создания гипертекстовых ссылок и закладок, копирования текста, таблиц и
графики из PDF файлов.



PDF Librarian v.1.01
Плагин превращает PDF документ в архив


PDF-iT v.4.020
Программа предлагает уникальное решение конвертации большого количества сканированных документов
в набор PDF файлов.


Quite A box of tricks v.1.2h
Плагин для работы с графикой: трасформация в SMYK, градации серого, обрезка и многое другое.


Quite Imposing Plus v.1.2j
Плагин для конвертирования отдельных страниц в книгу, брошюру и так далее.


StampPDF v.2.3
Плагин для печати PDF файлов. Водяные знаки, нумерация страниц, ориентация, шапки и многое другое.



Автор: Klirik
Дата сообщения: 02.06.2002 14:38
Вот здесь ftp://ftp.ogo.ru/pub/cooler.irk.ru/pdftohtml031.zip прога PDF в HTML. Сам не пробовал...
Автор: Dust
Дата сообщения: 02.06.2002 14:47
Самый лучший конвертер - гугль.
Находишь нужный пдф, а хатем кликаешь - открыть как HTML
Автор: 4567
Дата сообщения: 03.06.2002 19:17
Klirik

>------------------------------------------
Вот здесь ftp://ftp.ogo.ru/pub/cooler.irk.ru/pdftohtml031.zip прога PDF в HTML. Сам не пробовал...
>------------------------------------------

Ссылка дохлая или пароль надо !
тут рабочая (ссылка , а не прога) - первая точно :

http://www.filesearch.ru/cgi-bin/s?t=n&q=ftp.medcity.ru/pub/software
ftp://cooler.irk.ru/pdftohtml031.zip
http://www.filesearch.ru/cgi-bin/s?t=n&q=ftp.ssc.nsu.ru/pub/Mirrors/cooler.irk.ru

Скачал ... запустил инсталляцию ... чё-то она пропала после этого куда-то
(антивир проверял - всё ок ) бред короче ... или под XP не катит ...



Dust
--------------------------------------------------------------------------------
Самый лучший конвертер - гугль.
Находишь нужный пдф, а хатем кликаешь - открыть как HTML

--- Ага , лучшая , если PDF на рабочем столе лежит .....
Автор: Klirik
Дата сообщения: 03.06.2002 20:56
4567
Да, умерла уже... Но когда постил, я ее проверил, живая была.
А прога досовская, ее с ключами запускать надо, разбираться неохота...
Автор: vserd
Дата сообщения: 04.06.2002 08:53
4567



Цитата:
Что надо сделать я понял !
("назначить" + "чем создавался документ")

Открываешь в Word сконвертированный RTF, выбираешь весь текст, назначаешь ему новый шрифт (Надеюсь как поменять шрифт пошагово объяснять не надо?).


Цитата:
Где посмотреть "чем создавался документ"

В Acrobat (неважно каком) FIle->Document info -> General
строчка Producer.
Автор: 4567
Дата сообщения: 04.06.2002 20:32
vserd
(Надеюсь как поменять шрифт пошагово объяснять не надо?).

---- все шрифты подряд что ли перепробовать :( ?
их там штук 30 - 40


>>>Где посмотреть "чем создавался документ"
--- посмотрел : Acrobat Distiller 4.05 for Windows
--- это чем - нибудь может помочь ? (ни*ига не понимаю )
Автор: rammstein
Дата сообщения: 04.06.2002 21:23
FineReader 6.0 могет распознавать PDFины...
Автор: vserd
Дата сообщения: 05.06.2002 08:18
4567

Цитата:
их там штук 30 - 40

Ну поставь Timies new Roman Cyr, главное чтобы Сyr было.
Либо в свойствах шрифта выставь Кирилица.

Цитата:
Acrobat Distiller

Это значит, что символы в нем как символы, а не как картинки.
Автор: naPmu3aH
Дата сообщения: 05.06.2002 21:24
Короче, всем кому это надо...
PDF2HTML (возможно не тот о котором шла речь выше, а другой) я брал на сайте автора sourceforge.bla-bla-bla.
Я столкнулся с той же самой проблемой со шрифтами и при копировании/выдираниями другими программами получались закорючки, причем никак в русский не конвертируемые (шрифтами, установкой языка и т.п.).
Эта прога конвертировала все в HTML без всяких проблем очень быстро, ну разве что в конце каждой строки воткнула <BR>, что конвертировалось в "ручной конец параграфа", когда я открыл этот HTML в Word'е. Вроде у нее есть режим конвертирования с доставанием картинок, но у меня был PDF чисто текстовый, так что я не совсем в курсе...
Вот ссылка: http://prdownloads.sourceforge.net/pdftohtml/pdftohtml_0_33a-win32.zip, но все же советую сходить на сайт - возможны новые версии (о которых кстати можно тут и сообщить)

Автор: 4567
Дата сообщения: 06.06.2002 20:27
naPmu3aH


Цитата:
Короче, всем кому это надо...

-- Мне очень-очень надо ...
я УЖе ненавижу PDF !!!


Цитата:
>>>>Вот ссылка: >>> http://prdownloads.sourceforge.net/pdftohtml/pdftohtml_0_33a-win32.zip

--- вот результат :


архив - битый ...



Цитата:
все же советую сходить на сайт - возможны новые версии

--- И чё тут скачать ??? (см ниже )
-- ближе к делу я по указанному адресу ничего не смог открыть ...



Цитата:
Current Directory: http://prdownloads.sourceforge.net/ pdftohtml/
File Name Size Date
-- Parent Directory -- - Jun 06, 2002 11:04
horde.zip 134 kb Feb 21, 2002 21:03
pdftohtml-0-32.tar.gz 250 kb Feb 22, 2002 00:19
pdftohtml-033.zip 229 kb Apr 20, 2002 18:19
pdftohtml032a-win.zip 201 kb Mar 05, 2002 13:14
pdftohtml032b-win.zip 349 kb Mar 21, 2002 15:06
pdftohtml033.zip 220 kb Apr 20, 2002 18:17
pdftohtml_0.32b-1_i386.deb 346 kb Apr 13, 2002 12:11
pdftohtml_033.zip 229 kb Apr 20, 2002 18:22
pdftohtml_0_32.tar.gz 250 kb Feb 21, 2002 23:59
pdftohtml_0_32a.exe 372 kb Feb 25, 2002 14:13
pdftohtml_0_32a.tar.gz 234 kb Feb 22, 2002 12:54
pdftohtml_0_32b.tar.gz 234 kb Mar 17, 2002 00:38
pdftohtml_0_33.tar.gz 233 kb Apr 20, 2002 18:15
pdftohtml_0_33a-win32.zip 230 kb Apr 21, 2002 20:02
pdftohtml_0_33a.tar.gz 232 kb Apr 21, 2002 15:35




rammstein
--------------------------------------------------------------------------------
FineReader 6.0 могет распознавать PDFины...
--------------------------------------------------------------------------------

--- Ну один раз распознает ... ну другой .. а дальше ?
---Да и не люблю я Файн редер из реестра после удаления выковыривать ....
---Нет , хочется проще чего - нибудь , универсальное , независимое от исходного шрифта в оригинальном документе .



Добавлено
Вот нашёл онлайновый конвертер :
http://access.adobe.com/simple_form.html

&'$ департамента налогов и права фирмы &'$
 !"#$%&'$
()*+,-     . '  ' /&    
&&   /      0&/1 / 2  /3 .................................


но даже он глючит со шрифтами ... видно не судьба ...
Автор: naPmu3aHka
Дата сообщения: 07.06.2002 00:54
4567

Цитата:
архив - битый ...

Уупс... Извини. Этот линк - на самом деле страница по выбору зеркала для скачки (такая вот у них там дебильная система)
Правильный линк (и ответ на второй вопрос) вот:
http://telia.dl.sourceforge.net/sourceforge/pdftohtml/pdftohtml_0_33a-win32.zip
Автор: 4567
Дата сообщения: 07.06.2002 18:08
naPmu3aHka


Цитата:
>>>Правильный линк (и ответ на второй вопрос) вот:


скачалось за март 2002 ... рабочее

брось в мой ПМ мыл адрес , расскажи как пользовать прогу ....
Я сам не разберусь ...


Цитата:
naPmu3aHka
naPmu3aH

-- Это одни и те же люди ?
Автор: naPmu3aHka
Дата сообщения: 09.06.2002 02:49
4567

Цитата:
Я сам не разберусь ...

Там и разбираться то нечего...
pdftohtml.exe <pdf_file> <html_file>

Но... Я обнаружил, что он у меня не на всех PDF'ах работает (русские буквы не понимает - они просто пропадают).
Но несколько раз раньше, когда мне надо было - все получалось...


Цитата:
Это одни и те же люди

Ты хотел сказать человек?
Сейчас да(жена в больнице), а вообще - нас вполне пока двое..
Автор: VicNic
Дата сообщения: 03.07.2002 03:01
Klirik

Цитата:
Вот здесь ftp://ftp.ogo.ru/pub/cooler.irk.ru/pdftohtml031.zip прога PDF в HTML. Сам не пробовал...

Я попробовал - тяжёлая, фреймы толком не сохраняет, да и русским, помоему не дружит

Добавлено
4567

Цитата:
или под XP не катит ...

"катит" и под ХР, да толку-то...
Автор: rf711
Дата сообщения: 03.07.2002 05:30
http://konvertor.free.fr/konvertore_pdf2xxx.zip
ковертер PDF-TXT хоть и шароварный, но работает. На этом же сайте (адрес можно вытащить из ссылки) есть клёвый конвртор (~ 7 Mb) позволяет конвертировать PDF в графические форматы и др.
Автор: VicNic
Дата сообщения: 04.07.2002 08:13
rf711
На каком он языке? А то я принялся качать, не зная что

Добавлено
Мда, на французком... Ну, поэкспериментирую, хотя, конечно, хочется хотя-бы по аглицки

Добавлено
я про
Цитата:
На этом же сайте (адрес можно вытащить из ссылки) есть клёвый конвртор (~ 7 Mb)

Автор: vjick
Дата сообщения: 06.09.2002 06:57
ЕЩЕ один вопрос?

Существует ли в природе конвертор
pdf------>chm
я как понял используя то что прописано выше
можно пдфку конвертнуть в html
конвертер html-->chm тоже существует
а так чтобы сразу?
Автор: LevT
Дата сообщения: 15.12.2002 18:39


vjick

С ума сошел? Не было у бабки проблем... Что конвертилки pdf в html толком не умеют русский, что навороченные программы для производства chm. Настраивать любую отдельно взятую байду гиморно, причем гиморно по-своему, причем сильно все зависит от исходного PDF, на чем да как он сделан...

А простенькую тебе дай конвертилку - ты ведь скривишь рожу и продолжишь поиски. Да и я сам, собсно, такой же Или тебе вражьеязычные pdf-ки конвертить надоть?

Автор: Yo_Yo
Дата сообщения: 09.01.2003 13:07
ну и что так до сих пор никто не знает конвертилки из Pdf в Html с поддержкой русского? а в Txt ? ну оч. надо! акробат и файнридер не предлагать.
Автор: gera serg
Дата сообщения: 10.01.2003 15:47
Yo-Yo
Почитай про Click to Convert в Варезнике
Автор: Excell
Дата сообщения: 24.03.2003 12:38
после установки Acrobat 5 в Word'e не появились значки "convert to pdf" & "convert to pdf & email", как было всегда. Как теперь восстановить эту функцию?? нужно сконвертировать doc -> pdf обязательно Adobe Acrobat'ом

Страницы: 1234

Предыдущая тема: Редактор для CDшной полиграфии


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.