Ru-Board.club
← Вернуться в раздел «Программы»

» MetaProducts Offline Explorer / Portable Offline Browser

Автор: shveicar
Дата сообщения: 27.09.2011 14:34
Taran2ul

Цитата:
Помогите с проектом для www.wallpapers.ru
Какие проблемы? Если нужны только картинки можно по выбору воспльзоваться 1)firefox+scrapbook -выкачает все. 2) данный сайт со всеми скриптами прекрасно качается бесплатной качалкой httrack 3) самый примитивный вариант поставить HandyCache и в ручную просмотреть нужные страницы например через internet explorer а потом забрать информацию из кеша. Удачи.
Автор: Taran2ul
Дата сообщения: 29.09.2011 19:26
shveicar
Спасибо. Действительно WinHTTrack Website Copier помог. Но к своему удивлению обнаружил что разрабы www.wallpapers.ru на днях сделали рестайлинг сайта и он подхватился OE.
Автор: kselur
Дата сообщения: 07.10.2011 22:20
Здравствуйте

Когда то помогли мне справиться с задачей
http://forum.ru-board.com/topic.cgi?forum=5&topic=1455&start=1720 [?]

=============================
kselur
задача -- скачать все найденные поисковиком по запросу страницы, при этом с самого сайта пооисковика скачивать ничего не нужно
Если поставить глубину закачки 1 скачаются результаты только с 1й страницы, если 2 -- будут качаться страницы, на которые есть ссылки на страницах из 1й страницы результатов поиска. Поставить "на другой сервер глубина=1" -- невозможно запретить скачку страниц с самого поисковика (которых вельми много -- речь идёт о spam_detected) и вообще использовать кустом конфигурэйшн. Можно ли всё-таки как то так настроить, чтобы выполнить задачу?

ответ
Вот тебе пример для твоего поисковика нигма
Например ищет фразу мама родная.
Набираем в этом поисковике эту фразу. Получаем ссылку вида
http://нигма/index.php?q=%EC%E0%EC%E0+%F0%EE%E4%ED%E0%FF&0=1&1=1&2=1&3=1&4=1&5=1&6=1&7=1
Плюем на нее Смотрим внизу страницы кол-во страниц для этого поиска. Смотрим ссылку на последнюю страницу (и ее номер - на всякий случай).
Ссылка на эту последнюю страницу для нашего поиска получилась такая:
http://нигма/index.php?action=show_results&ses_id=a4deaa83c43bf76fe1d6fcfcca85d9fa&request_str=%EC%E0%EC%E0+%F0%EE%E4%ED%E0%FF&search_id=1|1|1|1|1|1|1|1&cur_page=400
Выкидываем из нее кусок с &ses_id=... и создаем URL для OE.
http://нигма/index.php?action=show_results&request_str=%EC%E0%EC%E0+%F0%EE%E4%ED%E0%FF&search_id=1|1|1|1|1|1|1|1&cur_page={:0.. 400|20}
В свойствах проекта ставим:
Уровень - 1
Фильтры URL -> Сервер -> Произвольная конфигурация -> Маски исключения серверов -> Добавляешь нигма.

Все. Можешь создать из твоего проекта шаблон.
==================
Недавно нигму переделали и строка выглядит иначе Подскажите пожалуйста как теперь преобразовывать УРЛ?
Автор: nsktravel
Дата сообщения: 10.10.2011 09:29
Привет. Качаю простой оффлайновый ресурс http://archive.travel.ru/portugal/ Поставил глубину 3 ссылки и не качать ничего окромя данного каталога. Там файлов-то всего, по прикидкам, порядка двухсот, включая все скрипты и стили.
Почему мне уже час выдаются тысячи говна вида

Цитата:

33758 .travel.ru@sid=32555&bn=1&bt=22&pz=0&w=240&h=400&rnd=
33767 .travel.ru@sid=32555&bn=1&target=blank&bt=22&pz=0&w=240&h=400&rnd=
33767 .travel.ru@sid=32555&bn=2&bt=22&pz=0&w=240&h=400&rnd=
33767 .travel.ru@sid=32555&bn=2&bt=8&pz=2&w=240&h=120&rnd=
33767 .travel.ru@sid=32555&bn=2&target=blank&bt=22&pz=0&w=240&h=400&rnd=
33767 .travel.ru@sid=32555&bn=2&target=blank&bt=8&pz=2&w=240&h=120&rnd=
43306 106136.html@sid=32555&bn=1&bt=22&pz=0&w=240&h=400&rnd=
43306 106136.html@sid=32555&bn=1&target=blank&bt=22&pz=0&w=240&h=400&rnd=

Т.е. один и тот же файл с кучей ебучих GET-ов.

Как этого избежать?
Автор: shveicar
Дата сообщения: 11.10.2011 00:48
nsktravel- Offline explorer - софтина глючная, по всей видимости ссылки он находит в скачанных файлах, а их в свою очередь генерит сервер. Ради интереса перейди на страницу по любой из этих ссылок и посмотри исходный код, если данных ссылок ненайдешь, значит это глюк offlina если ссылки есть - тогда удивлятся не чему. Как вариант можно попробовать загрузку с неизмененными ссылками (их если что всегда можно потом поправить). Ну а если и этот вариант не устраивает тогда попробуйте воспользоваться WinHTTrack Website Copier. Он точно поможет.
Автор: nsktravel
Дата сообщения: 11.10.2011 06:23
Спасибо, попробую. Надо было раз в жизни что-то снять - и такое разочарование.
Ссылки вот в таком виде:

Цитата:
<li><a href="http://archive.travel.ru/portugal/geo/" title="Географическое положение Португалии">География</a></li>
<li><a href="http://www.travel.ru/weather/portugal/" title="Погода в Португалии">Погода</a></li>
<li><a href="http://archive.travel.ru/portugal/people/" title="Жизнь людей в Португалии">Жизнь людей</a></li>
<li><a href="http://archive.travel.ru/portugal/money/" title="Деньги в Португалии">Деньги</a></li>
<li><a href="http://archive.travel.ru/portugal/communications/" title="Коммуникации и связь в Португалии">Связь</a></li>
<li><a href="http://archive.travel.ru/portugal/formalities/" title="Формальности и правила въезда в Португалию">Въезд</a></li>

Убил бы - для статичного ресурса такое.
Автор: Taran2ul
Дата сообщения: 13.10.2011 13:06
nsktravel
Попробуй бету новую в ней много чего исправили, может и поможет.
Автор: Gideon Vi
Дата сообщения: 13.10.2011 13:53

Цитата:
в ней много чего исправили

угу. и поставили ограничения, как у триала.
Автор: Taran2ul
Дата сообщения: 13.10.2011 15:40
Gideon Vi
Для проверки подойдет. Подождем до 01.11, а там глядишь и лекарь найдется
Автор: Gideon Vi
Дата сообщения: 14.10.2011 12:56
триальные ограничения в бете были ошибкой. Если скачать новую редакцию, то можно снова тестировать без ограничений. Не забывайте сообщать Олегу о ошибках на официальном форуме. По большей части он все оперативно фиксит.
Автор: Drorli
Дата сообщения: 27.10.2011 01:06
На сайте имеются jpeg-и по адресу вида:
blabla.com/bla/katalog/000 (*от 001 до 400)/0001.jpg (*от 0001 до 0500).jpg
можно ли как-то задать шаблон для ОЕ чтобы он прокачал от 0001.jpg до 0500.jpg?

а также шаблон для каталога "000 (*от 001 до 400)" и будет ли он ложить все это в разные папки, чтобы не получилась куча jpg c одинаковым именем в одной папке?
Автор: Molt
Дата сообщения: 27.10.2011 01:15

Цитата:
blabla.com/bla/katalog/000 (*от 001 до 400)/0001.jpg (*от 0001 до 0500).jpg

Диапазон задается так, для примера (если я правильно понял условия)

Код: blabla.com/bla/katalog/{:001..400}/0{:001..500}.jpg
Автор: Drorli
Дата сообщения: 27.10.2011 09:42
Molt
Спасибо, но я забыл упомянуть об одной особенности
адреса имеют вид:
/katalog/043/043-0001.jpg... до 0300.jpg
/katalog/044/044-0001.jpg... до 0300.jpg
/katalog/045/045-0001.jpg... до 0300.jpg

Обратите внимание, что номер папки повторяется в имени файла через дефис. Можно как-то задать в шаблоне, чтобы номер папки дублировался в имени файла?

Иначе ОЕ скачивает
katalog/043/043-0001.jpg... до 0300.jpg
и потом качает
katalog/044/043-0001.jpg... до 0300.jpg
вместо /044/044-0001.jpg

Добавлено:
Сначала написал ошибочное сообщение, просьба подписчиков перечитать пост
Автор: Molt
Дата сообщения: 27.10.2011 11:59

Цитата:
Обратите внимание, что номер папки повторяется в имени файла через дефис. Можно как-то задать в шаблоне, чтобы номер папки дублировался в имени файла?

Да легко.


Код: katalog/{:001..400#1}/{:#1}-0{:001..300}.jpg
Автор: Drorli
Дата сообщения: 27.10.2011 15:41
Molt оно!!! дай я тебя расцелую, налью пива... вобщем спасибо большое!
Автор: JHeavy
Дата сообщения: 30.10.2011 15:42
Здравствуйте такой вопрос, при скачивании ветки форума можно ли как то указать чтобы качались новые страницы ветки без указания последней страницы, ведь они прибавляются? Большое спасибо за ответ.
Автор: Valeriu
Дата сообщения: 04.11.2011 23:48
Подскажите как решить проблему ??? При переходе на любую страницу или ссылку во внутреннем браузере в Offline Explorer выскакивают ошибки :
1) Во время выполнения произошла ошибка.
Запустить отладку ?

2) Строка: 40 (иле разные номера)
Ошибка: Предпологается наличие ')' в регулярном выражении

Пробовал разные версий программы ну никак не пропадают эти ошибки !!!!
Не хочется скачать опять сайт с более чем с 1 000 000 файлов !

Версия Offline Explorer enterprise edition 5.3.2908 c кайгеном от tPORT
Автор: Kristian
Дата сообщения: 09.11.2011 12:16
Помогите, плз! У меня не получается скачать сокр.ру целиком. Качается нормально первый час, а потом, где-то после 12 000 страниц, они кончаются! А так ведь не может быть, сокращений-то как минимум там 120 000, и даже больше. Причем каждое сокращение имеет свою уникальную страницу, находящуюся там в папке /cards. Что я делаю не так? Задача ведь довольно простая, надо скачать только содержание папки cards и всё. У кого получается, напишите правильные параметры. Можно и в личку. Заранее спасибо!

OE Enterprise 6.0.3658
Автор: Vesdaris
Дата сообщения: 14.11.2011 00:50
Вот что происходит,если нажать мышкой на раздел-появляются подразделы (это я смотрю ОНЛАЙН через offline explorer
http://i29.fastpic.ru/big/2011/1114/13/f3827730bf478eb2a10c94247d3c3a13.jpg

Когда же я открываю сохраненную версию оффлайн,то нажав на название раздела страница эта просто перезагружается и все.

Для того,чтобы это проверить не надо никуда логинится,там это руководство бесплатно доступно(но не полностью).

Не могли бы вы подсказать, почему ОЕ не сохраняет эту возможность раскрытия подразделов?

http://www.primagames.com/games/elder-scrolls-v-skyrim/primaguides/232
Автор: gstorm
Дата сообщения: 17.11.2011 00:08
Доброго времени суток!

Прошу знатоков помочь в скачивании базы судебных решений Украины по адресу http://reyestr.court.gov.ua
"Вручную" решения можно сохранить без проблем: поисковый запрос = список решений с ссылками в виде
http://reyestr.court.gov.ua/Review/XXXXX , где XXXXX - номер дела.
"Автоматом" же OE тянет только заглавные страницы, а сами решения нет.

Заранее благодарю!
Автор: Drorli
Дата сообщения: 17.11.2011 08:40
А вот можно при помощи ОЕ решить такую задачу:
katalog/(а)-(в)-(с)/(с1)-0{:001..300}.jpg
где
а=от 0 до 2000
в=римские от I до X
с=четырехзначная от 0000 до 2500
с1=таже самая "с" но чистое число, то есть если с=0000, то с1=0, если с=0007, с=7, если с=0451, с1=451






Добавлено:
По идее, хотелось бы, конечно, задать конкретные 500 значений для "а-в-с", чтобы ОЕ не перебирал миллион вариантов... но не знаю возможно ли такое. Потому как всего в "а-в-с" 500 конкретных вариантов, а не тысячи.
Автор: DzOOMer
Дата сообщения: 20.11.2011 13:43
умеет ли эта софтина получать дату и время создания файла с сервера?
если да то как это настроить?
Автор: biko3
Дата сообщения: 21.11.2011 09:52
ни как не получается сграбить этот сайт http://base.lol-game.ru/champions/

всё что скачивается это одна строчка (© 2010 Riot Games Inc. All rights reserved. | © 2010-2011 Gorby | Language: ru | ) , и всё
Это сайт конструктор и хотелось бы пользоваться им оффлайн.
Помогите разобраться с проблемой
Может какие нибудь настройки нужно ввести?
Автор: dcupsbimbo
Дата сообщения: 22.11.2011 12:30
Offline Explorer Enterprise 6.0.3658 Release (патченая версия с этого форума). Создаю проект, пишу ссылку (любую, например http://boingboing.net) и жму ОК (никаких дополнительных настроек не делаю). Не качает вообще ничего. До этого ставил триальную версию с сайта, она все качала нормально. Проблема вероятно уже имеет решение, но в "версии для печати" ничего подходящего не нашел. Кто-нибудь справлялся с такой бедой?
Автор: Alexandriiskii
Дата сообщения: 23.11.2011 06:17
dcupsbimbo
Не знаю, мне вот кажется, что Вам в варезнике бы спросить. У меня все работает.

У меня другая, но тоже вполне определенная проблема. Хотел использовать прокси. Пробовал и на версии 5.8 и на 6.0. Захожу в "Настройки"-"Прокси-сервер" ставлю там адрес анонимного прокси (пытался разные ставить, но что рабочие - 100%), сохраняю. Пытаюсь использовать встроенный браузер и захожу на сраницу проверки своего ай-пи - выдает мой реальный, а не прокси. Для чистоты эксперимента, пробую в Опере и ИнетЭксплорере - выдает адрес прокси. Пробовал также элитный прокси - встроенный в программу браузер ни в какую не хочет использовать настройки прокси самой программы. Как проверить анонимность закачки - я не представляю в таком случае. Для закачки проекта использовал из мануала команду Proxy=1,proxy.mycompany.com:3128, указал ее в проекте после адреса. Вот думаю теперь как оно работало, определился ли мой ай-пи или нет на сайте, откуда загружал... Кстати, сейчас заметил, была версия 5.8, потом поставил обновленную версию 6.0. В программе была куча проектов. До этого открывал программу все было на месте. Сегодня открыл - ничего нет, пустое окно, нет ни одного проекта, хорошо, что есть бекап. Кто-нибудь с подобной проблемой сталкивался?


Добавлено:
Возможно буду баян, но нашел ответ на последний вопрос - про очистку окна. Все проекты исчезли потому, что я в последний раз в Настройках в Дополнительно, в Размещении изменил место положение Каталога проектов, шаблонов и карт проектов, собственно они благополучно остались в старом месте - программа сама их не перенесла, это нужно сделать было в ручную. Вот сейчас нашел все это и скопирую, посмотрим что будет.... Да, проверил, все на своих местах.

Вопрос про прокси остался открытым, прошу помочь.
Автор: Alexandriiskii
Дата сообщения: 24.11.2011 15:02
Похоже помощи никакой, как в лесу... может кто-нибудь все таки подскажет?
Автор: asdf8
Дата сообщения: 24.11.2011 15:37
Alexandriiskii
Попробуйте, перед запуском ОЕ, поменять настройки прокси в IE. У меня раньше прокатывало.
Автор: Alexandriiskii
Дата сообщения: 24.11.2011 16:59
asdf8
Я конечно попробую, но очень как то сомнительно, чтобы... хотя кто его знает, попробую, может их браузер реально к ИЕ обращается.
Автор: Drorli
Дата сообщения: 26.11.2011 13:46
Alexandriiskii не знаю, когда я ставлю прокси, у меня качает через прокси и в поле "статус" надпись коннектинг/даунлоудинг виа 655.34674.4477 то есть указанный прокси.
Автор: Alexandriiskii
Дата сообщения: 28.11.2011 15:58
Drorli
Скажите пожалуйста, я вас правильно понял, это когда Вы ставите в проекте строку
Proxy=1,адрес:3128
то программа обращается через прокси и появляется надпись "виа адрес прокси"
у меня тоже такое есть, если указываю именно адрес в проекте.
Иными словами, то что Вы описали - вписываете в проекте или в настройках программы в разделе "Прокси-сервер"?

Страницы: 123456789101112

Предыдущая тема: PHP RapidGet Pro VI


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.