Ru-Board.club
← Вернуться в раздел «Программы»

» Из pdf в текст (doc, txt, html)

Автор: irobot4
Дата сообщения: 15.10.2007 11:52
Есть бесплатная тулза для преобразования PDF файлов в текст.

<a href="http://ru.text-mining-tool">Text Mining Tool</a>
Автор: Z_I
Дата сообщения: 23.10.2007 14:59

Цитата:
Попробовал было pdf файл с кириллицей (счёт от Билайн) конверитровать в txt.
Получил крякозяблики и читаемую муть.

Что посоветуете, кроме Acrobat CS СE?


Что касается счёта от Beeline, то для его конвертации в чистый текст я использовал простое копирование через клипбоард из Adobe Reader во встроенный текстовый редактор Far Manager'а.

Нкаких крякозябов!
Автор: valerio
Дата сообщения: 06.12.2007 14:13
Тут вот в тему такая статейка нарисовалась по PDF
http://gigatran.ru/adobe-pdf-converters-to-word-doc-rtf-txt
борьба с ПДФ, так сказать
Между прочим, это теперичи стандарт ISO
Автор: toturvator
Дата сообщения: 15.12.2007 21:08
Кто нибудь решал задачу пакетного преобразования xls в pdf - в консольном режиме через командную строчку?
Автор: seva1
Дата сообщения: 11.05.2008 13:47
Народ при сохранении в текстомов формате PDF который состоит из русского текста, кодировка бьеться... как быть?*
Автор: FatFREE
Дата сообщения: 17.05.2008 07:50
Решил написать сюда, чтобы не создавать новую тему.

Итак, у меня скопилось огромное количество pdf файлов, что принесло немало путаницы и дизорганизации. Нет ли программ для систематизации, типа как ACDsee или Faststone ImageViewer, только для работы с pdf?
Автор: bredonosec
Дата сообщения: 17.05.2008 18:06

Цитата:
Нет ли программ для систематизации, типа как ACDsee или Faststone ImageViewer, только для работы с pdf?

так каталогизаторов куча - вопрос в том, какие фичи нужны..
каталогизаторы
Автор: Romano
Дата сообщения: 10.07.2008 08:06
из всех мини-конвертилок, русский язык распознал только PDF Grabber
Автор: Romanych11
Дата сообщения: 22.07.2008 09:24
А из pdf в rtf и так чтобы таблицы оставались возможно перевести? Желательно не файнридерами с адобами
Автор: Sharki1
Дата сообщения: 30.07.2008 18:09
В этой теме видел множество криков о помощи, перевести pdf в текст или еще что-то… Могу предложить достаточно универсальный конвектор, как говорит само его название(Universal Document Converter) -) Сам перепробовал множество бесплатных «варезных» конвекторов, но ни один не прокатывал под мои нужды… а там девушка знакомого решила купить эту софтину и понеслось…Можно конвертировать файл любого формата, в любой из 8ми доступных форматов (pdf;. .doc; .tiff и другие). Хоть стоит денег, но это сущие копейки, которые сразу окупаются универсальностью этой проги… Вполне можно попользоваться вначале демкой, доступоной по адресу: [url] http://www.print-driver.ru[/url]

Автор: Vikonder
Дата сообщения: 30.07.2008 20:23
Камрады!!
Вопрос коллективному разуму...
Имеется в наличии отсканненный файл в формате pdf. Проблема в том, что скан произведен коряво, и поэтому при чтении данной документации (на пару тысяч страниц) через любой редактор, понимающий pdf, невозможно производить поиск.
Что в данном случае, является необходимой функцией, для поиска нужной информации.

Имеется ли возможность в автоматическом режиме переделать этот файл в формат doc??
Или любой другой формат, позволяющий определить и настроить фунцию поиска внутри файла!!
Автор: MorSe
Дата сообщения: 30.07.2008 20:34
Vikonder

Цитата:
невозможно производить поиск.

Скорее всего, там нет текстового слоя, одни только картинки. Поэтому и поиск не работает.

Цитата:
Имеется ли возможность в автоматическом режиме переделать этот файл в формат doc

Например, с помощью ABBYY PDF Transformer.
Автор: Vikonder
Дата сообщения: 02.08.2008 17:11
MorSe
PDF Transformer делает работу частично, создавая doc, в котором часть- это норальный текст на английском (что мне и надо), а вторая- это текстовые объекты.
Поиск я могу делать только в тексте, не сканируя внутренность объектов, либо наоборот внутри одного отдельно взятого объекта.
Автор: Chukcharin
Дата сообщения: 13.01.2009 18:22
http://depositfiles.com/files/68dneuqi0
Хороший конвертер пдф конвентирует в ворд ексель и тд и обратно тоже
Автор: vitaly1
Дата сообщения: 13.01.2009 18:54
И как же он называется?
Автор: trigliff
Дата сообщения: 16.05.2009 10:48
Ищу утилиту для перевода pdf в txt, желательно консольную под windows.
Требования такие:
возможность сохранения в юникоде
корректная работа с диакритическими знаками
замена лигатур обычными символами
удаление переносов

Из того что мне попадалось, всё работает криво или просто не поддерживаются нужные требования. Короче, самостоятельно я уже отчаялся найти такую софтину среди мириады существующих конвертеров.

Автор: bredonosec
Дата сообщения: 09.12.2013 01:38
какой наиболее корректный онлайн конвертер из пдф в док?
Интересует возможность таблицы конвертить, остальное неважно.
Автор: krserv
Дата сообщения: 05.02.2016 22:03
для текста, сохраненного в виде картинок в PDF использую Solid PDF tools в режиме OCR или ABBYY PDF Transformer под ОС Windows. Но что использовать для этого под ОС Linux?

Страницы: 1234

Предыдущая тема: Редактор для CDшной полиграфии


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.