Ru-Board.club
← Вернуться в раздел «Программы»

» TextPipe

Автор: evoroz
Дата сообщения: 29.01.2014 08:43
D1D1D1D
Можно. Replace -> Replace list.
Можно самому написать список, а можно использовать файлы .XLS, .CSV и т.п.
Автор: D1D1D1D
Дата сообщения: 29.01.2014 17:27
Спасибо, здорово. Но жаль что больше восьмиста с лишним вхождений не поддерживает, выводит сообщение.
Автор: XPerformer
Дата сообщения: 29.01.2014 17:48
D1D1D1D
возьмите TextCrawler, он поддерживает неограничено
Автор: D1D1D1D
Дата сообщения: 29.01.2014 19:21
XPerformer
Спасибо, протестировал -- но лучше "Advanced Replace Tools" для этой задачи пока ничего не нашёл.
Автор: XPerformer
Дата сообщения: 29.01.2014 19:25
D1D1D1D
дык если знаете решение, чего спрашивать

Добавлено:
ну и 25 баксов супротив бесплатного, за банальную замену, оно как-то многовато-то будет
Автор: sikemo
Дата сообщения: 29.01.2014 21:33
а где "Advanced Replace Tools" взять? (не офсайт)
Автор: D1D1D1D
Дата сообщения: 29.01.2014 22:16
XPerformer
дык ведь лучшему нет предела)) мне она пару дней назад показалась медленной (нужно сделать более 100тыс замен в 35тыс файлах) -- а оказалось это вполне ничего. И её не обязательно регистрировать, ограничений в работе (кроме выскакивающих окон) нет.

sikemo
Использую версию 4.3 без регистрации -- если нужна, дайте знать.
Автор: XPerformer
Дата сообщения: 29.01.2014 22:22
D1D1D1D
1) 100тыс замен в списке замен или это вообще по всем файлам?
2) сколько времени заняла обработка 35 тыс файлов? хоть примерно 10 мин - 1час - полдня?
3) в регулярных выражениях русские буквы поддерживаются? типа ([а-яА-я]*?)
Автор: sikemo
Дата сообщения: 29.01.2014 22:58

Цитата:
дайте знать.


if you please
Автор: D1D1D1D
Дата сообщения: 29.01.2014 22:58
XPerformer
1) по всем файлам. Хотя, всё таки цифру я занизил -- дойдет до миллиона.
2) пока только собираюсь, но предварительно, судя по всему минимум сутки.
3) да
Автор: XPerformer
Дата сообщения: 29.01.2014 23:03
D1D1D1D
это у вас разовая акция или будете регулярно такие объемы обрабатывать?
если регулярно, интересно сравнить разные проги по скорости
Автор: D1D1D1D
Дата сообщения: 29.01.2014 23:14
XPerformer
Боюсь, пяток оборотов сделать придётся, но для проверки достаточно ведь обрабатывать определенное количество тестовых файлов.
Автор: XPerformer
Дата сообщения: 29.01.2014 23:16

Цитата:
3) в регулярных выражениях русские буквы поддерживаются? типа ([а-яА-я]*?)

регулярки вообще не поддерживаются, не то что русские диапазоны
Так что сравнивать смысла нету
Автор: D1D1D1D
Дата сообщения: 29.01.2014 23:18
Там их нужно обрамлять вот так: #[А-Яа-я]#
смотрите help

Добавлено:
кстати в моих заменах не используются регулярки
Автор: XPerformer
Дата сообщения: 29.01.2014 23:26
D1D1D1D
там какой-то свой синтаксис, урезанный, элементарные вещи ввожу
#(the )?Diagrams#
пишет недопустимый синтаксис
Разбираться в доке не вижу смысла, т.к. импортировать тысячи замен в эту программу не получится

Добавлено:
D1D1D1D
Если у вас обычный текстовые замены, то думаю, будет гораздо быстрее чем сутки
Автор: D1D1D1D
Дата сообщения: 29.01.2014 23:32
Знак вопроса тоже надо было обрамить: #?#



Добавлено:

Цитата:
импортировать тысячи замен в эту программу не получится

На счёт регулярок не знаю, но другие уже импортировал.
Автор: XPerformer
Дата сообщения: 29.01.2014 23:36
D1D1D1D
поздно, уже снес ))
выглядит несколько старомодно, у меня все элементы интерфейса разъехались
Автор: D1D1D1D
Дата сообщения: 30.01.2014 19:36
Насчёт TextPipe оказался неправ: сейчас ещё раз попробовал задействовать список и всё пошло. Единственный минус -- процесс программы в Диспетчере показывает 800mb, хотя обрабатываемых файлов всего 50.
Автор: D1D1D1D
Дата сообщения: 31.01.2014 16:31
Нужно ещё сказать, что в случае, если в заменяемых строках присутствует кириллица, а обрабатываемый файл в Юникоде -- то в результаты кириллич. символы не попадают. Только в PowerGrep обработка нормально пошла (кстати: раздолье для регекспов и морда модная)))
Автор: XPerformer
Дата сообщения: 31.01.2014 17:22
D1D1D1D
вижу, вы уже с десяток программ перепробовали
по сравнению скорости что-то доложите общественности?
Автор: evoroz
Дата сообщения: 31.01.2014 18:35

Цитата:
Нужно ещё сказать, что в случае, если в заменяемых строках присутствует кириллица, а обрабатываемый файл в Юникоде -- то в результаты кириллич. символы не попадают.

Не удивительно. В Textpipe есть перекодировка.
Автор: DollHack
Дата сообщения: 30.05.2014 11:35
9.7
[more=Changelog]May 29th, 2014
· Mainframe copybook filter now allows pass-thru EBCDIC data ie BINARY data
· e.g. using PIC X(48) USAGE IS BINARY.
· Mainframe copybook filter now does not insert a null (\x00) character after
· fields in Fixed Width mode.
· Invalid copybooks now send errors to log when running from command line.
New EasyPatterns:
· [Drive] e.g. C: E: -> returns drive letter in @drive@
· [Folder] e.g. \My Documents\ -> returns 'My Documents' in @folder@
· [Path] e.g. d:\My Documents\ -> returns 'd:\My Documents' in
· @drive@ and @path@
· [UNCPath] e.g. \\server\share\path\filename -> returns @server@,
· @share@ and @path
· [Filename] e.g. testdocument.doc -> returns @filename@
· Unicode conversion filter did not retain the Error Character if the Input or
· Output encodings were not changed.
· Hidden worksheets are now ignored by the Excel to Text filter.
· Split filter now cleans up its temporary files.[/more]
Автор: D1D1D1D
Дата сообщения: 29.09.2014 20:13
Во весь рост встала задача перекодировать множество юникодных HTML-файлов с арабско-кириллическими символами в ANSI. Нужно это, потому что в CHM (предполагается упаковка в него) не получится осуществлять поиск по кириллице, если страницы в юникоде.
Пробую с TextPipe, но по результатам арабские символы теряются, вместо того чтобы конвертироваться во что-то подобное: ѐѝќѐ
Может знает кто?
Автор: evoroz
Дата сообщения: 08.12.2014 16:14
DrAlexMD

Цитата:
Просьба, кто подскажет, алгоритм фильтра.
Задача:
1. Найти определенный участок текста между метками: [text1] и [text2]
2. добавить к названию файла найденный фрагмент текста.

1. Поиск идет по фильтру: \[text1\](.*)\[text2\]
2. Замена: @fullInputFilename$1 или $1@fullInputFilename
$1 - это то, что будет найдено между тегами.
Автор: DrAlexMD
Дата сообщения: 08.12.2014 22:34

Цитата:
2. Замена: @fullInputFilename$1 или $1@fullInputFilename


Большое спасибо, но не работает. Это ставится в том же фильтре "Replace" или из категории "Add"? (в любом случае, ни в том, ни в другом случае, это макрос почему-то не работает).
Автор: evoroz
Дата сообщения: 08.12.2014 23:10
DrAlexMD
Фильтр работает и в Add и в Replace, просто ты не объяснил, что надо получить: куда пойдет результат.
Имя нового файла? Или ты его сразу хочешь переименовать? Или?
Простенький вариант http://sendfile.su/1058524
Автор: DrAlexMD
Дата сообщения: 09.12.2014 19:28

Цитата:
ты не объяснил, что надо получить: куда пойдет результат.

Переименовать сам файл - "добавить к названию файла найденный фрагмент текста".

Просто я с файлам в TextPipe не работал, поэтому не могу пока уяснить механизм.
Автор: evoroz
Дата сообщения: 09.12.2014 22:41
DrAlexMD

Цитата:
Просто я с файлам в TextPipe не работал, поэтому не могу пока уяснить механизм.

Механизм прост. При выполнении фильтр производит необратимые изменения в файле-(ах).
Решая аналогичные задачи, я предпочитаю получать на выходе bat-файл с командами
REN старое_имя новое_имя
а потом их выполнять.
Среди готовых фильтров sysadmin есть фильтр "rename files according to contents".
Ну или "split files and rename".
Автор: DrAlexMD
Дата сообщения: 10.12.2014 18:28

Цитата:
"rename files according to contents".


Уже что-то, но там какая-то рыба, заточенная под какую-то специфическую задачу с удалением запятых. Ковырялся, ковырялся, но так и не добил.

Еще раз, более детально:
1. имею массив html файлов;
2. в файлах нужный текст заключается между словами 'Тема:' и 'Время';
3. Нужно переименовать исходный файл: добавить к названию найденный текст из п.2.

Спасибо.

Добавлено:
P.S. А где в меню находится "rename files according to contents" и остальные? Нашел их только в папках программы.
Автор: evoroz
Дата сообщения: 10.12.2014 20:52
DrAlexMD

Цитата:
Нашел их только в папках программы.

Правильно. Это готовые фильтры ну или учебный пример использования фильтров.
Рассматривай как нравится.
Вопрос еще в том, находятся ли эти слова на одной строке?
Впрочем - ерунда.
Дело в том, что работая, программа модифицирует файлы, или проще, уничтожает их содержимое.
Разумеется, используя программирование, этого можно избежать.

Я предложил бы лобовой вариант:
1. скопировать файлы на отдельную директорию и применить фильтр как у меня в примере
2. получить bat-файл со строками типа REN имя_файла имя_файлаТоЧтоМежду
3. запустить его и на нужных файлах

http://sendfile.su/1059701

Страницы: 12345678

Предыдущая тема: Программы для решения уравнений


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.