Ru-Board.club
← Вернуться в раздел «Программы»

» Рекурсивная загрузка веб-сайтов; оффлайн-браузеры (OfflineExplorer, TeleportPro, HTTrack)

Автор: roman78
Дата сообщения: 03.08.2007 11:57
юзаю оффлайн експлорер, но при попытке скачать "дубликат" сайта он делает default.html вместо index.html... а как остальные?
Автор: ventblanc
Дата сообщения: 03.08.2007 12:05
попробовал скачать сайт сделанный на Флеш.
неудачно
юзал и Офлайн Эксплорер и Телепорт.

а вообще сайты на флеш можно скачать?
если да то чем
Автор: w0mbat
Дата сообщения: 03.08.2007 14:14
alkis
Там попробуй пойми как браузером скачать.. ссылок так и не смог найти)) Можно ссылку на адрес исходной страницы где размещены ссылки на сами тексты?

roman78
дык если заходишь например на ya.ru, ты же не видишь чего тебе выдают, index.htm или .html или default.htm ит.д. - это настройки веб-сервера, файл с каким именем считать главной страницей. А как (под каким именем) эту страницу сохранять - это твое личное дело, по-моему в каком-то сабже видел настройку, ответственную за это..

ventblanc
поддерживаю вопрос, интересует какой из сабжей лучше всего справляется с флеш-сайтами, и такими, где большинство контента генерится javascript'ом
Автор: Kiev78
Дата сообщения: 08.08.2007 03:18
У меня возник такой вопрос:
Допустим, я знаю что на сайте есть исполняемые файлы (но не знаю их имён).
Чем лучше прошерстить сайт на поиск всех файлов определённого типа?
Пытался в Офлайн Эксплорер сделать полный сайт мап, но он показывает только структуру папок, сами екзешники не видны. Например, сайт http://www.teksoft.com - я точно знаю, что есть файл http://www.teksoft.com/files/CW/FlexLM/CWFlexLM_20060828.exe ,
есть и другие, так вот я например хочу узнать ссылки на все файлы на этом сайте.
Подскажите, пожалуйста, как лучше это сделать (и чем?).
Автор: w0mbat
Дата сообщения: 08.08.2007 11:22
Kiev78
если на страницах сайта нет ссылки на этот экзешник и там запрещен просмотр содержимого каталогов (как сделано почти везде) то имхо никак
Автор: OlegChernavin
Дата сообщения: 13.08.2007 23:26
roman78

У каждого свои настройки. У Offline Explorer это можно изменить через реестр. Только какая разница.

Такое имя файла назначается в случае закачки ссылок, заканчивающихся на /, т.е. когда имя файла невозможно узнать.

ventblanc

С флешем немало проблем. Можно попробовать выбрать проект закачанный Offline Explorer-ом, нажать кнопку автосохранения на панели встроенного браузера и потом нажать на просмотр в оффлайне. Недокачанные файлы будут сохранены и добавлены к проекту.

Автор: Shigal
Дата сообщения: 24.08.2007 20:26
Долго выбирал, остановился на TeleportPro - большего мне не надо.
Автор: bacardi
Дата сообщения: 04.09.2007 12:45
Teleport - просто удобно
Автор: OffSpEEd
Дата сообщения: 07.09.2007 16:47
люди как телепортом можно скачивать определенный топик например на руборде и регулярно чтобы он подзакакчивал новые сообщение и потом их читать в оффлайне.


а вообще - есть ли специализированная прога, чтобы скачивать и читать нужные темы в оффлайне? (наподобия фидошного голдеда)
Автор: OlegChernavin
Дата сообщения: 18.09.2007 16:13
В топике (шапке) оффлайн-эксплорера есть такая простая идея - задать адрес:

http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=1455&start={:0..2240|20}

и все.
Автор: azbax
Дата сообщения: 27.10.2007 07:12
WinHTTrack - поставил где-то с год назад, временно. Потом оставил постоянно и не разу не пожалел.
Автор: klif22
Дата сообщения: 14.11.2007 02:21

Цитата:
OlegChernavin


Цитата:

У каждого свои настройки. У Offline Explorer это можно изменить через реестр. Только какая разница.

Такое имя файла назначается в случае закачки ссылок, заканчивающихся на /, т.е. когда имя файла невозможно узнать.



А нельзя ли настроить OE так, чтобы он, увидев директорию, просто копировал оттуда все что есть? А то бывает так, что в папке, к примеру, php файл, а ОЕ его переименовывает в htm.
Автор: OlegChernavin
Дата сообщения: 19.11.2007 19:19
Есть такая настройка, но не всегда сервера позволяют просмотреть список всех файлов в каталоге и их оттуда скачать. Тем более не получится взять PHP-скрипты. Они в любом случае будут выполнены сервером и отданы в виде чистого HTML.
Автор: cuneiform
Дата сообщения: 02.12.2007 01:44

Цитата:
WinHTTrack - поставил где-то с год назад, временно. Потом оставил постоянно и не разу не пожалел.


Поддерживаю. Очень тонкие настройки. - Варианты настроек обхода запрета на скачивание сайтов. --- Б е с п л а т н а я !!! прога. Загрузил с ее помощью около 20 тыс. страниц с сайтов также под запретом на скачивание.




Добавлено:
Teleport Pro, Offline Explorer, WebCopier Pro - каких только коммерческих продуктов не сыщешь в Сети для копирования сайтов на жесткий диск компьютера. Все они функциональные, красивые и... дорогие.

Однако существует альтернатива в виде с в о б о д н о (бесплатно!) распространяемой утилиты Wget.

_http://www.gnu.org/software/wget/wget.html

Пришедшая из мира Linux, она позволяет скачивать как отдельные файлы из интернета, так и сайты целиком, следуя по ссылкам на веб-страницах. Остановимся на последней возможности чуть подробнее. Погружаться в конкретику не будем, так как её всегда можно извлечь из документации к программе, набрав команду man wget в Linux или wget.exe --help в Windows.

Итак, допустим, мы хотим создать копию сайта www.site.com на своем диске. Для этого открываем командную строку (Wget - утилита консольная) и пишем такую команду:

wget.exe -r -l10 -k http://www.site.com
Данная инструкция заставит приложение рекурсивно (параметр -r) обойти каталоги и подкаталоги на удалённом сервере с максимальной глубиной рекурсии равной десяти (-l), а затем заменить в загруженных HTML-документах абсолютные ссылки на относительные (-k) для последующего локального просмотра скачанного сайта.

Если предполагается загрузка с сайта какого-либо одного каталога (со всеми вложенными в него папками), то логичнее будет включить в командную строку параметр -np. Он не позволит утилите при поиске файлов подниматься по иерархии каталогов выше указанной директории:

wget.exe -r -l10 -k http://www.site.com -np
Если загрузка данных была случайно прервана, то для возобновления закачки с места останова, необходимо в команду добавить ключ -с и нажать Enter:

wget.exe -r -l10 -k http://www.site.com -c
По умолчанию всё сетевое добро сохраняется в рабочей директории утилиты. Определить другое месторасположение копируемых файлов поможет параметр -P:

wget.exe -r -l10 -k http://www.site.com -P c:\internet\files
Наконец, если сетевые настройки вашей сети предполагают использование прокси-сервера, то его настройки необходимо сообщить программе. Для этого зайдите в рабочую директорию Wget, найдите там файл sample.wgetrc, переименуйте его в .wgetrc и редакторе пропишите в поле http_proxy характеристики вашего прокси-сервера, не забыв раскомментировать строку (удалить знак #).

Автор: cuneiform
Дата сообщения: 14.12.2007 16:22
Приведу пример, когда мне помогли без долгиx поисков возможностей только HTTrack , особенно wget.

Надо загрузить 40 000 страниц книг, 2 энциклопедии по 17 томов. Но они не лежат доступно копированием директории на сайте. Каждая страница вызывается через запрос на яве. Получается такая загрузка постранично:

http://www.retrobibliothek.de/retrobib/faksimile_504491.jpeg
http://www.retrobibliothek.de/retrobib/faksimile_504492.jpeg
http://www.retrobibliothek.de/retrobib/faksimile_504493.jpeg
.........................................................................................

так ---- 40000 ссылок...

wget потребовал только составить список в (тxт) File. - Попробуйте сделать это в другом.

Стало интересно. А другие кроме этиx двуx могут спискок адресов ввести?

Впечатление такое, что только 1 адрес все принимают!



Автор: MrPerfect
Дата сообщения: 14.12.2007 18:23
cuneiform
В Offline Explorer вы можете задать одним URL загрузку всех ваших 40000 страниц.

http://www.xxx.xx/retrobib/faksimile_{:504491..544490|1}.jpeg

504491 - начальный URL
544490 - конечный URL (начальный плюс число 39999)
1 - шаг изменения
Всего - загрузка 40000 страниц.

Читайте справку к Offline Explorer, раздел URL Macros. Изменяться в URL может куча элементов, не только числа. Генерировать и вставлять кучи URL вам не придётся, всё гораздо легче.
Автор: cuneiform
Дата сообщения: 14.12.2007 20:28
Это действительно потрясно! Ибо сменить 40 000 номеров страниц вручную... очень большое спасибо за помощь! - Главное --- это описание проги!

Добавлено:
Надо отдать должное этой программе: 1500 файлов-страниц около 500 Кб каждый загрузила за 10 мин --- при скорости в 4 раза !!! большей чем консоль в ДОСе --- около 1-2 Мб/с, другие как и консоль --- только около 270 Кб/с! За 3-4 ч можно скачать все 17 томов! Потрясно! Сильно! Круто!
Автор: kenttj
Дата сообщения: 16.02.2008 17:01
Такой вопрос: надо скачать картинки с одного сайта, который продаёт картинки. Я знаю в какой директории находятся эти картинки, вот только скачать их не могу, так как все подобные проги сразу же начинают ругаться, что мне нужно ввести правильный логин и пароль на сайт.

Кто-нибудь может подсказать, возможно хоть одной прогой скачать их?

Ссылка содержит, что-то вроде http://название_сайта/photo_000004816968Medium.jpg?id=4816968&ConcreteTypeID=3&Token=597557589&downloadAction=RegularLicense

Этот файл скачивается таким образом уже с платного аккаунта, но логин и пароль должны быть введены заранее.

Понравились пару картинок с сайта.
Автор: Donatello
Дата сообщения: 16.02.2008 18:12
kenttj

Подобные проги... это какие? Телепортом я скачивал с защищенных узлов (Basic авторизация), OfflineExplorer скачивал. OfflineExplorer пробовал? Можно попробовать войти на сайт-авторизоваться с пом. встроенного браузера в OfflineExplorer, если простой ввод логин-пароля не помогут.
Автор: OlegChernavin
Дата сообщения: 25.02.2008 16:55
kenttj

Будут проблемы - пишите мне на личный ящик. Буду помогать.
Автор: OlegChernavin
Дата сообщения: 13.03.2008 19:28
Новая бета-версия Offline Explorer Pro 5.0:

http://www.metaproducts.com/download/betas/opsetup5.exe
Автор: Wisent
Дата сообщения: 29.03.2008 23:05
OlegChernavin
Помогите скачать форум
http://www.vashdom.by/component/option,com_smf/Itemid,36/
ПОЖАЙЛУСТА!
Автор: OlegChernavin
Дата сообщения: 30.03.2008 16:39
Нормально качается. Ссылки там простые, проблем не заметил. Что именно не так при закачке?
Автор: Wisent
Дата сообщения: 31.03.2008 18:37
OlegChernavin
Чем пробовали качать?

ВРОДЕ КАК ПОШЛО
Автор: vitaly1
Дата сообщения: 31.03.2008 20:38
Wisent

Цитата:
Чем пробовали качать?

Улыбнуло OlegChernavin - разработчик Offline Explorer
Автор: OlegChernavin
Дата сообщения: 01.04.2008 13:44
Это была ранняя шутка на 1-е апреля!
Автор: OlegChernavin
Дата сообщения: 06.04.2008 17:47
На iXBT появилось очень подробное рассмотрение разных оффлайн-браузеров в нескольких частях:

http://www.ixbt.com/soft/offline-browsers-1.shtml
http://www.ixbt.com/soft/offline-browsers-2.shtml

В 3-й части упомянут Offline Explorer Enterprise с ценой 10000 руб, но не остальные варианты (стандартный - 400 руб и Про - 800 руб). И только версия 4.9, хотя 5-я уже доступна:

http://www.ixbt.com/soft/offline-browsers-3.shtml

http://www.ixbt.com/soft/offline-browsers-4.shtml
http://www.ixbt.com/soft/offline-browsers-5.shtml
http://www.ixbt.com/soft/offline-browsers-6.shtml

Автор: Vladlenputin
Дата сообщения: 06.04.2008 22:48
а вот в возможности данных программ входит,чтоб весь серф в браузере(например Opera) он скачивал к себе(оффлайн браузер),чтоб потом просматреть в оффлайне?
Автор: OlegChernavin
Дата сообщения: 07.04.2008 09:39
Это вряд-ли. У нас для этого есть другая программа - MetaProducts Inquiry:

http://forum.ru-board.com/topic.cgi?forum=5&topic=18207&start=820#lt

Можно сохранять целиком страницы или включить автосохранение, тогда все посещенные страницы будут на вашем диске. Сортировка по датам, полнотекстовый поиск и т.д.
Автор: Aganel
Дата сообщения: 12.04.2008 01:24
Vladlenputin, ScrapBook + ScrapBook autosave в файрфоксе автоматически сохранят все просмотренные тобой страницы.

Страницы: 1234567891011121314151617181920

Предыдущая тема: AutoCAD помогите с установкой


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.