Ru-Board.club
← Вернуться в раздел «Программы»

» Конвертация Word-TXT

Автор: vse
Дата сообщения: 24.04.2003 15:23
Кто знает как быстро сконвертировать много файлов из word 2000 и xp в обычный текст. Обычный способ "Сохранить как" не подходит так как файлов очень много!!!
Автор: Widok
Дата сообщения: 24.04.2003 15:40
vse
http://forum.ru-board.com/forums.cgi?action=filter&forum=5&filterby=topictitle&word=doc
Автор: vse
Дата сообщения: 24.04.2003 16:11
Извини, ничего не нашел.
Автор: gera serg
Дата сообщения: 24.04.2003 17:02
Макрос напиши в ворде и повесь на копку
Автор: stass10
Дата сообщения: 30.12.2003 17:48
У меня около 300 файликов в формате *.txt

существует ли способ их слить в один
не открывая каждый...?
Автор: tumber
Дата сообщения: 30.12.2003 18:13
stass10
В командной строке командой copy file1 + file2 + file3 + file4 + ... outfile
Например, в FAR или NC имя файла сбрасывается в строку клавишами Ctrl+Enter.
Так как длина командной строки ограничена, придется делать это в несколько приемов.
Например, сливаешь по 20 файлов, а потом сливаешь получившиеся файлы-результаты.

Добавлено
А еще проще - в WinRAR указать Метод сжатия - Без сжатия, а потом подчистить начало и конец получившегося архива.
Правда, порядок следования файлов в первом случае ты сам задаешь, а как это сделает WinRAR - не знаю.

И еще - чтобы каждый файл начинался с новой строки, надо, чтобы предыдущий заканчивался переводом строки.

Добавлено
Насчет WinRAR - к сожалению, не пройдет, для архивации многих файлов придется править еще и стыки между ними. Остается - copy.
Автор: Dinxor
Дата сообщения: 04.01.2004 00:16
stass10
Кроме copy можно применить команду type
Сначала формируешь список файлов, например командой
dir /b /on | find /i ".txt" > list.bat
потом редактируешь полученный файл чтобы в каждой строке было
type filename.txt >> output.txt
Редактировать батник удобно в текстовом редакторе поддерживающем поиск/замену сразу по всему файлу (я использую UltraEdit)
После запускаешь батник и получаешь файл output.txt
Могут быть проблеммы с кодировкой, но это легко решается. А так метод наиболее быстрый.
Автор: gera_serg
Дата сообщения: 05.01.2004 13:03
vse
поищи ABC Text Converter

Автор: MetroidZ
Дата сообщения: 05.01.2004 16:49
vse
В TC выделяешь все txt файлы.
Меню Файл Групповое переименование
добиваешся того, чтобы
все файлы имели название

anekdot.001
anekdot.002
anekdot.003
anekdot.004
...
anekdot.996

далее выбери anekdot.001 и
Меню Файл/Склеить файлы
получится один большой файл.
Затем этот файл хоть в Word...
Автор: gera_serg
Дата сообщения: 05.01.2004 17:52
Может поговорим о преимуществах шипованной резины?
Вопрос же был:
>Кто знает как быстро сконвертировать много файлов из word 2000 и xp в обычный текст
Так какая утилита обработает папку с сотнями вордовых файлов в обычный текст?
Автор: MetroidZ
Дата сообщения: 05.01.2004 22:32

Цитата:
Так какая утилита обработает папку с сотнями вордовых файлов в обычный текст?


_http://www.metroidz.narod.ru/DOC2TXT.rar

DOC2TXT
Программа конвертирования файлов Word в текст.
Просто бросайте нужный файл (или группу файлов)
на нижнюю часть формы. Должен быть установлен Word.
Тестировалось на W2000Rus SP3 + WordXP

Если что не работает или ещё что нибудь пишите.
Автор: gera_serg
Дата сообщения: 06.01.2004 12:45
Тем кто любит немного напрячь мозги - есть такой проект - Antiword
http://www.winfield.demon.nl/index.html
версии (кроме прочих операционных систем) для DOS и Win из коммандной строки, bat- файла, скрипта, своей программы ... позволяют сконвертировать вордовый файл в простой текст с минимальными потерями (сам WORD не нужен!)
Немного о потерях. Например сам Word, выгружая в простой текст, напрочь забывает о тексте в колонтитулах страниц.
Перед использованием любого конвертора стоит проверить, не теряется ли текст из примечаний, колонтитулов, рамок с текстом, сносок... А потом решить - не оставить ли все как есть
Автор: MetroidZ
Дата сообщения: 06.01.2004 13:39
gera_serg
конвертация DOC файлов естественно приведёт к некоторым потерям. Например рисунки уж точно вылетят. Но иногда DOC файлы простые и легко переносятся в текст.
DOC2TXT обрабатывает хоть сотни файлов сразу. Она только для этого и предназначена. Пока она конвертирует в txt и очень простая.
Но есть возможность переделать и в html rtf dostext и другие, которые есть в Word.
Автор: gera_serg
Дата сообщения: 06.01.2004 17:52
MetroidZ
Я понимаю, что работа неблагодарная разгребать все навороты ворда, а использованием стандартных библиотек MS не обойдешься без потерь.
Теряется ли текст из примечаний, колонтитулов, рамок с текстом, сносок, объединенных ячеек таблиц, таблиц в таблице...?
Получается ли (при твоей возможности) на выходе html, который реально далее редактировать простыми редакторами?

Хотелось бы найти утилиту, которая могла бы выгрузить, не теряя из ворда отдельно ВСЮ текстовую информацию в txt, а все внедренные картинки, например, в tiff.

Автор: MetroidZ
Дата сообщения: 06.01.2004 18:02
gera_serg

Цитата:
ВСЮ текстовую информацию в txt, а все внедренные картинки, например, в tiff.


случаем не в полиграфии работаешь :)
А по идее html должен получится редактируемый другими редакторами. Не знаю только как удобнее сделать. Сейчас просто все файлы Word конвертируются в TXT с названием которое получается из исходного , с прибавлением ".txt".
Утилитку за короткое время сделал. Особо не смотрел сложные тексты. Но она точно так же всё делает, как и Word.


Цитата:
Теряется ли текст из примечаний, колонтитулов, рамок с текстом, сносок, объединенных ячеек таблиц, таблиц в таблице...?

что то не вижу, для чего может такое пригодится. Может на самом деле оставить тогда Doc/Rtf ?
А разве ABC Text Converter нельзя для этого приспособить?
Автор: gera_serg
Дата сообщения: 06.01.2004 18:45
MetroidZ
> случаем не в полиграфии работаешь
бывают работы связанные с ней
вот нашел утилиту которая максимально пытается выдрать зажатые картинки (лучше чем принтскрин с ворда)

Антиворд старается максимально выгрузить текст, но не любит имен файлов с пробелами в имени, а DOS версия требует имена 8+3, что неудобно для современной пакетной обработки

HTML выгруженный средствам 97 винворда и 2000 ворда очень различен для дальнейшего подредактирования.
у 2000 приоритет внешний вид документа, у 97 более простой код html

ABC Amber Text конвертеру тож не плохо заранее сказать с каким форматом ворда он имеет дело

Я не отметаю все эти решения, просто стараюсь относиться к ним с заметной степенью острожности
Автор: surgutfred
Дата сообщения: 20.02.2007 12:03
MetroidZ
DOC2TXT - робит по принципу drag@drop, а шоб из консоли запускалось? Знает кто?
Нихочу мышкой таскать. Хочу батник сделать, что бы в текущий папке из всех doc и rtf
сделал тхт с такими же именами.
Автор: eshil
Дата сообщения: 20.02.2007 12:49
surgutfred
Попробуй программу ZD2T консольная, сделает все, что хочешь. Автор Zmiy.
Автор: domo22
Дата сообщения: 19.01.2009 16:28
Подскажите, какой программой сконвертировать файл DOC или RTF в EXE - т.е. чтобы было постраничное слайд-шоу без использования других сторонних программ. Или хотя бы сначала файл DOC или RTF в картинки, а картинки уже можно как-то потом собрать в слайд-шоу.
Автор: Liya
Дата сообщения: 01.02.2009 11:46
Ultra_Document_Text.Converter извлекает простой текст из файлов - даже пакетно.

Ultra Document To Text Converter converts PDF, Rich text (*.RTF),
Word document (*.DOC), Powerpoint file (*.PPT), Excel spreadsheet
(*.XLS), Web pages (*.HTML, *.HTM) and MHT files to text in batch.

You don't need to have PDF reader or Office application installed.
Just add the PDF, RTF, DOC, PPT, XLS, HTML and MHT files to the list
and click "Convert" button. The text will be automatically extracted
quickly

Добавлено:
Возможно, к этой программе придется добавить другую: TXT Collector прекрасно объединяет все txt-файлы в указанной папке.
Автор: Ajaja
Дата сообщения: 29.03.2010 14:44
Что-нибудь аналогичное ZD2T для docx есть?
Автор: kiyaker
Дата сообщения: 26.12.2010 14:23

Цитата:
DOC2TXT
Программа конвертирования файлов Word в текст.
Просто бросайте нужный файл (или группу файлов)
на нижнюю часть формы. Должен быть установлен Word.
Тестировалось на W2000Rus SP3 + WordXP

Если что не работает или ещё что нибудь пишите.

не работает,пишет:"Метод или свойство Open2000 недоступно,потому что разрешение для работы с документом ограничено"...
Автор: crackcrack
Дата сообщения: 25.11.2014 03:13
как Word конвертировать в презентацию?

Страницы: 1

Предыдущая тема: Stop 0xC5 and Win XP ENG SP1


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.