Ru-Board.club
← Вернуться в раздел «Программы»

» Как перевести PDF файл в ТХТ формат?

Автор: DoXeR
Дата сообщения: 29.05.2010 13:58
Задача - есть pdf файл - сборник анекдотов
вес файла 15 мб
Около 4 000 страниц.

Нужно перевести в txt формат..
КаК?

Перепробовал уже более десятка разных конверторов..

Или ошибку выдает или не читает, или на конечно этапе выдает завершение программы, ни 1 из десятка не смог конвертировать файл...

Так же пробовал просто "сохранить как текст" он сохраняет - но на выходе между слов отсутствуют пробелы! ВЕЗДЕ!

Еще Пробовал "выделить текст" потом его в буфер скопировать..
Текст выделает, минут через 15, сжирая пару гигов оперативы,
Но вот когда нажимаю копировать в буфер - долго думает и в итоге опять ошибку выдает не копирует..

Помогите плиз
Автор: sasherb
Дата сообщения: 29.05.2010 15:04
Adobe Reader пробовали?
Автор: thelamb
Дата сообщения: 29.05.2010 16:25
DoXeR
А эти?: PDF2Word 3.0 Ru
Утилита предназначена для конвертирования текста, изображений и другого содержания из любого PDF документа в MS Word или RTF форматы, что даёт возможность редактировать pdf файл. Поддерживается пакетное преобразование.
Size: 4.25 МВ
или PDF-XChange Viewer Pro 2.0.49.0 Ru
Удобная и многофункциональная программа для работы с PDF документами. Полная замена неповоротливого Adobe Acrobat Reader. Позволяет смотреть и печатать PDF документы, экспортировать из них текст и графику, создавать всплывающие подсказки, добавлять комментарии, делать пометки и многое другое. Основные возможности: добавляет, редактирует, перемещает закладки, удаляет страницы, умеет масштабировать при печати, перемещает страницы при помощи Drag&Drop в режиме Thumbnails, делает штампы (текст и изображения), вставляет и импортирует страницы (из существующих PDF-файлов), разрезает страницы (файлы), конвертирует тексты и изображения в формат PDF, редактирует гиперссылки и т.д. Есть функция экспорта страниц или всего документа в графические файлы BMP, JPEG, TIFF, PNG и др. В папке с программой есть очень подробный Manual (на английском).
Size: 28.5 МВ
Автор: sasherb
Дата сообщения: 29.05.2010 16:30
А если выпрыгивают ошибки то наверняка файл не корректно сформирован,можно тогда например открыть в фотожопе и заново сохранить
Автор: Rustamer
Дата сообщения: 29.05.2010 17:59
DoXeR
В этом случае имхо нужно сначала выложить файл если есть возможность.
Здесь штука обычная на мой взгляд - все зависит от степени паршивости файла.
В первую очередь имхо стоит попробовать Solid PDF Converter. Также была пара успешных юзаний PDF-XChange Tools - там есть такая функция.
На самый худой конец - OCR через ABBY FineReader или ABBY PDF Transformer. 4000стр - это отнюдь немного.
Автор: zhe_zho
Дата сообщения: 29.05.2010 18:06

Цитата:
можно тогда например открыть в фотожопе и заново сохранить

Причём тут фотожоп к текстовым PDF

DoXeR конвертёры в ТХТ очень капризные, смотря какой программой сделан этот PDF. Выложите хотя-бы одну страничку из файла.


Автор: DoXeR
Дата сообщения: 29.05.2010 20:45

Цитата:
На самый худой конец - OCR через ABBY FineReader или ABBY PDF Transformer. 4000стр - это отнюдь немного.

вот сейчас им как раз закончил сканировать как Word сохранить..
И что в итоге ушло около 6 часов на это и выходной файл в 100 мб ворда..
который думается мне не откроется ...
( в данный момент пытаюсь открыть )...



Добавлено:

Цитата:
DoXeR конвертёры в ТХТ очень капризные, смотря какой программой сделан этот PDF. Выложите хотя-бы одну страничку из файла.

а как 1 страницу выложить?
могу весь пдф выложить куда-нибудь, вес 14 мб

Добавлено:


Цитата:
А эти?: PDF2Word 3.0 Ru
Утилита предназначена для конвертирования текста, изображений и другого содержания из любого PDF документа в MS Word или RTF форматы, что даёт возможность редактировать pdf файл. Поддерживается пакетное преобразование.
Size: 4.25 МВ
или PDF-XChange Viewer Pro 2.0.49.0 Ru
Удобная и многофункциональная программа для работы с PDF документами. Полная замена неповоротливого Adobe Acrobat Reader. Позволяет смотреть и печатать PDF документы, экспортировать из них текст и графику, создавать всплывающие подсказки, добавлять комментарии, делать пометки и многое другое. Основные возможности: добавляет, редактирует, перемещает закладки, удаляет страницы, умеет масштабировать при печати, перемещает страницы при помощи Drag&Drop в режиме Thumbnails, делает штампы (текст и изображения), вставляет и импортирует страницы (из существующих PDF-файлов), разрезает страницы (файлы), конвертирует тексты и изображения в формат PDF, редактирует гиперссылки и т.д. Есть функция экспорта страниц или всего документа в графические файлы BMP, JPEG, TIFF, PNG и др. В папке с программой есть очень подробный Manual (на английском).
Size: 28.5 МВ

первый пробовал - на выходе создает текстовый файл в котором квадратики и ничего более...
второй нет вроде, но как я уже написал около 10 разных попробовал..думается что с этим тоже самое будет..
Автор: Rustamer
Дата сообщения: 29.05.2010 21:11
DoXeR
Вытащить одну страницу можешь через PDF-XChange Viewer или PDF-XChange Tools
Последняя может и в текст конвертануть. Там еще какая-то опция есть:
http://s56.radikal.ru/i151/1005/70/8165ca413799.png
Ну или сам файл залей
Автор: zhe_zho
Дата сообщения: 29.05.2010 21:27
DoXeR выкладывайте весь.
Автор: thelamb
Дата сообщения: 29.05.2010 23:42
Не знаю, что у Вас за версия Adobe? Я сейчас открыл мануал к игре в 10 Мб в Adobe Rd 9.3.2 Щёлкнул сохранить как .txt он мне за 10 сек. всё сделал. Получил в BERD3.0.3U файл в 151 Кб без картинок. Текст нормальный никаких искажений нет. Правда там всего 59 стр. или листов...
Автор: zhe_zho
Дата сообщения: 29.05.2010 23:56
thelamb давайте подождём когда DoXeR выложит свой файл, вот тогда вы и его попробуете сохранить как .txt Один PDF может нормально конвертироваться, другой нет.

Автор: Chemst
Дата сообщения: 15.06.2010 18:24

Цитата:
Не знаю, что у Вас за версия Adobe? Я сейчас открыл мануал к игре в 10 Мб в Adobe Rd 9.3.2 Щёлкнул сохранить как .txt он мне за 10 сек. всё сделал.

Спасибо, thelamb! В шестой версии этой опции я почему-то не нашел, а в девятой - действительно есть, и без фокусов работает. Спасибо!
Автор: natasha187
Дата сообщения: 22.07.2010 09:22
Ребята, подскажите, плиз ..
скачала PDF Xchange tools, но при создании документов появляется пометка о коммерческом использовании. Подскажите как и куда вводить crack ???

Спасибо!
Автор: vapod
Дата сообщения: 22.07.2010 09:37
natasha187

Цитата:
Подскажите как и куда вводить crack ???


http://forum.ru-board.com/topic.cgi?forum=35&topic=21324#1
Автор: clark40
Дата сообщения: 22.10.2010 10:14
HH0-120
1z0-007
117-201
650-621
Автор: krserv
Дата сообщения: 13.10.2014 02:16
подскажите пжс можно ли что сделать: исходный файл pdf состоит из картинок, в картинках нужный мне текст. Файл защищен паролем на изменения и т.д. Пробовал его открыть в виртуальном сканере в Soda PDF Pro - выдает везде запреты - на конвертацию в doc; txt - не разрешено, в загрузку в виртуальный сканер - тоже запрещено.
Проблема в том, что фон у страниц черный, а написано на картинках белым шрифтом, если я буду их распечатывать, чтобы отсканировать печатные копии, то я посажу картридж, это видно тоже дополнительная защита от копирования файла сделана, чтобы не распечатывали.
OCR - распознавание - распознает только изображения, текст не распознает. Fine Reader тоже требует ввода пароля.
Если файл защищен, то его не конвертирует никакая программа, отключить эту защиту есть возможность?
Автор: shadow_member
Дата сообщения: 13.10.2014 08:04
krserv
Advanced PDF Password Recovery в шапке и далее.
Защита PDF может быть двух типов- user (запрос пароля на запуск и чтение файла) и owner (скрытый, запроса не будет, что-то в этом роде)- копирование, печать, изменение. Похоже, у вас owner. Первый сбрасывается легко, а второй- не все проги в состоянии его сбросить. Пробуйте, а там видно будет.
PDF Decrypter Pro
Самый тяжелый случай- наделайте скриншотов и скомпилируйте что требуется.

Страницы: 1

Предыдущая тема: Joy Play


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.