Ru-Board.club
← Вернуться в раздел «Программы»

» MetaProducts Offline Explorer™ / Portable Offline Browser™

Автор: 842
Дата сообщения: 17.10.2007 18:09
Подскажите, как решить задачку.
Есть частично скачанный сайт, качал через teleport и закончил ограничением на количество страниц, т.е. у меня есть половина сайта - два гига, а остальное невозможно докачать... Как я понял, Offline Explorer может обработать весь сайт, но у меня не получается затянуть скачанные файлы в проект Offline Explorer-а. Посоветуйте, как мне решить эту задачку.
Спасибо
Автор: mazafaka
Дата сообщения: 21.10.2007 20:57
Добрый вечер!
Буду благодарен за решение следующей проблемы..
Есть известный всем сайт udaff.com, и никак не получается заставить Offline Explorer вытащить оттуда версии для печати (и только) различных креативов.. Т.е. обычные страницы с кучей рекламы мне нафег не нужны, и траф жалко на них.
Адрес каждой страницы имеет вид http://udaff.com/print_c/creo/78363.html и вместо 78363 - порядковый номер статьи.

Спасибо!
Автор: Zakkazak
Дата сообщения: 22.10.2007 09:25
mazafaka

Пропиши эти правила в Замене адресов, будет заменять на принт-версии:

http://*udaff.com/*/[0-9]*.html .com/**/*.html .com/print_c/**/*.html
Автор: HurtSania
Дата сообщения: 22.10.2007 14:17
MetaProducts Offline Explorer Enterprise 4.8.2650 SR1
сдесь


Password/Пароль: www.softinki.net
Автор: mazafaka
Дата сообщения: 22.10.2007 20:25
Zakkazak
спа-си-бо! а-гро-мна-е!
серьезно, агромнае шпосибо! буду пробовать!

// Разработчикам
Случайно не планируется акция (как была для Inquiry Pro) для руборда? Я бы с удовольствием купил OE Pro.
Автор: Zakkazak
Дата сообщения: 23.10.2007 20:26
mazafaka

Всегда пжалуста!

Добавь еще /creo/ в Урл фильтры (включить в директориях).
Автор: kselur
Дата сообщения: 25.10.2007 08:45
Здравствуйте

Когда то помогли мне справиться с задачей
http://forum.ru-board.com/topic.cgi?forum=5&topic=1455&start=1720

=============================
kselur
задача -- скачать все найденные поисковиком по запросу страницы, при этом с самого сайта пооисковика скачивать ничего не нужно
Если поставить глубину закачки 1 скачаются результаты только с 1й страницы, если 2 -- будут качаться страницы, на которые есть ссылки на страницах из 1й страницы результатов поиска. Поставить "на другой сервер глубина=1" -- невозможно запретить скачку страниц с самого поисковика (которых вельми много -- речь идёт о spam_detected) и вообще использовать кустом конфигурэйшн. Можно ли всё-таки как то так настроить, чтобы выполнить задачу?

ответ
Вот тебе пример для твоего поисковика spam_detected.
Например ищет фразу мама родная.
Набираем в этом поисковике эту фразу. Получаем ссылку вида
http://spam_detected/index.php?q=%EC%E0%EC%E0+%F0%EE%E4%ED%E0%FF&0=1&1=1&2=1&3=1&4=1&5=1&6=1&7=1
Плюем на нее Смотрим внизу страницы кол-во страниц для этого поиска. Смотрим ссылку на последнюю страницу (и ее номер - на всякий случай).
Ссылка на эту последнюю страницу для нашего поиска получилась такая:
http://spam_detected/index.php?action=show_results&ses_id=a4deaa83c43bf76fe1d6fcfcca85d9fa&request_str=%EC%E0%EC%E0+%F0%EE%E4%ED%E0%FF&search_id=1|1|1|1|1|1|1|1&cur_page=400
Выкидываем из нее кусок с &ses_id=... и создаем URL для OE.
http://spam_detected/index.php?action=show_results&request_str=%EC%E0%EC%E0+%F0%EE%E4%ED%E0%FF&search_id=1|1|1|1|1|1|1|1&cur_page={:0.. 400|20}
В свойствах проекта ставим:
Уровень - 1
Фильтры URL -> Сервер -> Произвольная конфигурация -> Маски исключения серверов -> Добавляешь spam_detected .

Все. Можешь создать из твоего проекта шаблон.
==================
Недавно нигму переделали и строка выглядит иначе Подскажите пожалуйста как теперь преобразовывать УРЛ?
Автор: Zakkazak
Дата сообщения: 25.10.2007 09:29
Там все очень просто. Надо просто разобраться в изменениях в синтаксисе:

http://spam_detected/index.php?action=show_results&ses_id=a4deaa83c43bf76fe1d6fcfcca85d9fa&request_str=%EC%E0%EC%E0+%F0%EE%E4%ED%E0%FF&search_id=1|1|1|1|1|1|1|1&cur_page=400

http://spam_detected/index.php?s=%D0%BC%D0%B0%D0%BC%D0%B0+%D1%80%D0%BE%D0%B4%D0%BD%D0%B0%D1%8F&gl=1&yh=1&ms=1&yn=1&rm=1&av=1&ap=1&nm=1&k=2Lup&startpos=140

красным - слова которые ищещь (мама родная)
зеленым - какие поисковики будут искать
синим - номера страниц с результатами (0, 20, 40, .., 140)
Автор: kselur
Дата сообщения: 25.10.2007 10:36
http://spam_detected/index.php?s=%D0%B2%D0%BE%D0%B7%D0%BD%D0%B8%D0%BA%D0%BD%D0%BE%D0%B2%D0%B5%D0%BD%D0%B8%D0%B5+%D1%80%D0%B5%D0%BB%D0%B8%D0%B3%D0%B8%D0%B8&gl=1&yh=1&ms=1&yn=1&rm=1&av=1&ap=1&nm=1&k=Ogap&startpos={:0.. 900|20}

так?
Автор: Zakkazak
Дата сообщения: 25.10.2007 11:26
kselur
Так точно...
Автор: mistdream
Дата сообщения: 01.11.2007 19:16
Помогите решить проблему. Пытаюсь скачать топик с forum.ru-board.com по приведенным выше настройкам. Страницы закачиваются, но на всех из них одно и то же -

Извините, гости не могут заходить в этот форум. Пожалуйста зарегистрируйтесь!.
Возможные причины:
Неправильный пароль
Неправильное имя пользователя
Незарегистрированный Пользователь

Что еще нужно настроить, чтобы страницы корректно закачивались?
Автор: Zakkazak
Дата сообщения: 01.11.2007 20:14
mistdreamКуки должны быть включенны. И перед закачкой обязательно залогинитьса следует.
Автор: mistdream
Дата сообщения: 01.11.2007 21:24
То есть на время закачки я обязательно должна быть на форуме? А никак нельзя сделать чтобы offline explorer сам зная мой логин и пароль закачаивал страницы?
Автор: Zakkazak
Дата сообщения: 01.11.2007 22:49

Так тоже можно, в поле урл прописываешь:

Cookie=amembernamecookie=mistdream; apasswordcookie=твойпароль
Автор: flashLAV
Дата сообщения: 02.11.2007 17:23
OlegChernavin

Вопрос о SetCookie= да и кукисах вообще (возможо, это стандартная проблема и не связана с OE):

Всё было хорошо, пока мой любимый сайт не перешёл на доступ по Cookie.
Это тоже не страшно - вхожу на сайт во встроенном броузере OE и всё нормально, но дальше сайт использует скрипты, которые начинают открывать отдельные окна (уже не в OE, но, наверное, дочерние).
Ладно и это, в конце всех этих "открываний" у меня есть ссылка - а как теперь мне узнать значение параметра SetCookie=хххххх (чтобы ввести эту строчку в проект?)

Спасибо
Автор: Zakkazak
Дата сообщения: 03.11.2007 12:14
flashLAV

Цитата:
а как теперь мне узнать значение параметра SetCookie=хххххх (чтобы ввести эту строчку в проект?)

Узнать можно из Журнала (Ctrl+W),
или же найти куки файл из :\Documents and Settings\***\Cookies\
Автор: mistdream
Дата сообщения: 03.11.2007 19:15
Zakkazak

Не поняла, это вписывать после ссылки того топика который я хочу закачать???
Автор: Zakkazak
Дата сообщения: 03.11.2007 21:46
Ага, прямо под ссылкой, вот так например:

http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=22165&start={:0..360|20}
Cookie=amembernamecookie=mistdream; apasswordcookie=твойпароль
Автор: mistdream
Дата сообщения: 03.11.2007 22:11
Zakkazak


Огромное спасибо, все получилось...
Автор: goddanbbs
Дата сообщения: 04.11.2007 20:26
Доброго вермени суток.

Прошу Ваше помощи в настроке этой замечательной программы.
Начальный адрес с которого нужно загрузить файлы .pdf:
http://springerlink.com/content/xg06831327v3/?p=3994a3c390264baa8cabfcf1bdb1ffa6&pi=0

Я хочу сделать шаблон для загрузки с этого сервера но не знаю как правильно настроить правило замены:

http://springerlink.com/content/*каждый раз новый*/нужно заменить на ?sortorder=asc&p_o={:0,10,20}

?p=3994a3c390264baa8cabfcf1bdb1ffa6&pi=0
тоже меняется каждый раз

Т.е. чтобы в проэкт я добавлял ссылку такого вида:
http://springerlink.com/content/xg06831327v3/?p=3994a3c390264baa8cabfcf1bdb1ffa6&pi=0

применял шаблон и она превращалась в
http://springerlink.com/content/xg06831327v3/?sortorder=asc&p_o={:0,10,20}

Заранее спасибо!!!
Автор: Zakkazak
Дата сообщения: 04.11.2007 23:43
Попробуй вот этот шаблон, думаю подойдет:

Нажми ссылку редактировать, скопируй проект, затем вставь в окне шаблонов
#

Добавь еще в шаблон правило замены
http://*springerlink.com/ ?p=*& ?
Автор: kselur
Дата сообщения: 05.11.2007 09:54
Доброго времени суток.

Прошу Ваше помощи в настройке этой замечательной программы.
Начальный адрес с которого нужно загрузить файлы
http://encycl.yandex.ru/search.xml?text=%D1%80%D0%B5%D0%BB%D0%B8%D0%B3%D0%B8%D1%8F
нужны все определения религии какие были найдены благо все они в каталоге dict находятся. Как это сделать?
Заранее спасибо!!!
Автор: Zakkazak
Дата сообщения: 05.11.2007 11:05
kselur
универсальный шаблон для Яндекс.Словаря:
Применяешь шаблон к проекту, затем F5.
#
Автор: goddanbbs
Дата сообщения: 05.11.2007 17:48

Цитата:
?p=*& ?

Цитата:
Добавь еще в шаблон правило замены
http://*springerlink.com/ ?p=*& ?

а добавлять вместе с пробелами?

Если да то что значат пробелы в данной строке?

Спасибо.
Автор: Zakkazak
Дата сообщения: 05.11.2007 18:18

Цитата:
а добавлять вместе с пробелами?

Без пробелов
По этому правилу из урл на лету будут удалятся, подобные части
p=3994a3c390264baa8cabfcf1bdb1ffa6&
Автор: goddanbbs
Дата сообщения: 05.11.2007 19:01
Zakkazak
Ваш шаблон качает все подряд, а мне нужно только пдф.

Попытаюсь еще раз обрисовать ситуацию.
Для закачки номера журнала я копирую ссылку в проэкт
она имеет такой вид:
http://springerlink.com/content/m11230658096/?p=533ec739dbf749d98e2075f4bac1297b&pi=1

далее я меняю в свойствах проэкта адрес урл -
http://springerlink.com/content/m11230658096/?sortorder=asc&p_o={:0,10,20}

Ставлю только архивы(пдф), далее имя файла в фильтрах - пдф.
Все работает отлично. В номере журнала 20 статей - скачивается 20.

Но охота для экономии времени и сил сделать шаблон который бы изменял сам первоначальную ссылку на:
http://springerlink.com/content/*/?sortorder=asc&p_o={:0,10,20}

Сейчас экспериментирую с правилом замены
URL
http://springerlink.com/content/*/?p=533ec739dbf749d98e2075f4bac1297b&pi=1

заменить
?p=*
чем
?sortorder=asc&p_o={:0,10,20}

Но почемуто скачивается старница по ссылке
http://springerlink.com/content/m11230658096/?sortorder=asc&p_o=

Почемуто макрос в замене строки не хочет работать или я чтото делаю неправильно.
Направте меня.

Спасибо.
Автор: Zakkazak
Дата сообщения: 05.11.2007 22:28

Цитата:
чем
?sortorder=asc&p_o={:0,10,20}

Цитата:
Почемуто макрос в замене строки не хочет работать или я чтото делаю неправильно.
Направте меня.

в этом поле этот макрос не работает с правилами замены. Да и эксперементы неправильны. Вспоминаю себя, когда я маялся с этими правилами . Попозже объясню как все там работает.

Цитата:
Попытаюсь еще раз обрисовать ситуацию.

ситуация итак понятна. Я вам предлагаю более простой вариант


Цитата:
далее я меняю в свойствах проэкта адрес урл -

Ненужно ничего менять в свойствах . Вам просто надо применить шаблон к проекту.

Этот шаблон ничего лишнего не качает, пусть проект докачает файлы доконца:
1. пдф
и мелкие файлы для нормального отображения страницы, без все безобразно будет выглядеть:
2. css, js для оформления заголовков, таблиц итд
3.gif файлы (меньше 3кб)

Добавлено:
добавил знак конца ($) в урл маску, будет точнее качать. Скопируйте проект еще раз



Добавлено:

Цитата:
Сейчас экспериментирую с правилом замены
URL
http://springerlink.com/content/*/?p=533ec739dbf749d98e2075f4bac1297b&pi=1

заменить
?p=*
чем
?sortorder=asc&p_o={:0,10,20}

А я тем временем поясню в чем ошибки.
1-я ошибка

?p=*
будет "захватывать"
http://springerlink.com/content/m11230658096/?p=533ec739dbf749d98e2075f4bac1297b&pi=1

а надо
?p=*&
будет "захватывать" только меняющуюся часть

http://springerlink.com/content/m11230658096/?p=533ec739dbf749d98e2075f4bac1297b&pi=1

2-я ошибка


Цитата:
Сейчас экспериментирую с правилом замены
URL
http://springerlink.com/content/*/?p=533ec739dbf749d98e2075f4bac1297b&pi=1

этот урл урл например не подпадет под ваше правило, как и большинство других
http://springerlink.com/content/чтоугодно/?p=533ec739dbf749d98e2075f4bac1298b&pi=1

Первое поле означает "начинающиеся с"
Правильней будет так:
http://*springerlink.com (даже знак * не нужен в конце)


3-я ошибка

Цитата:
?sortorder=asc&p_o={:0,10,20}


Как и выше я написал, в Замене адресов макросы диапозона и перечисления не поддерживаются. Да и по логике вещей они там не кчему.

Автор: flashLAV
Дата сообщения: 06.11.2007 08:58
Zakkazak

Цитата:
Узнать можно из Журнала (Ctrl+W),


Спасибо за ответ, но по каким причинам в журнал может ничего не добавляться?
Зашел на сайт во встроенном броузере, походил по сайту - журнал девственно чист
Автор: Zakkazak
Дата сообщения: 06.11.2007 11:21
После того как зайдешь на сайт, скачай какую нибудь страницу (только текст), на нуловом уровне. Затем посмотри в Лог.

Для рубода например такая строка появляется.

Cookie: cookie=set; lastvisit=5-1194339867--; amembernamecookie=Zakkazak; apasswordcookie=пароль; daysakapage=90%3B40

Из них в проект вставляю только имя и пароль:
Cookie=amembernamecookie=Zakkazak; apasswordcookie=пароль



Цитата:
Зашел на сайт во встроенном броузере, походил по сайту - журнал девственно чист

Онлайн-просматривания программа не записывает, только закачку и оффлайн-просмотр.

Автор: kselur
Дата сообщения: 08.11.2007 10:28
извините за ламерский вопрос -- как шаблон из текстового файла импортировть в программу?

когда-то мне написали
выделяете его содержимое, копируете. Затем переходите в ОЕ, раскрываете Файл>Шаблоны, там нажимаете Ctrl+V. Всё, экспортировали в ОЕ.

тогда получилось, а сейчас другая версия, пытаюсь но не выходит

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364

Предыдущая тема: Unreal Commander


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.