» Offline Explorer

Автор: nicka
Дата сообщения: 21.02.2004 02:43

OlegChernavin

...это опять про www.allmusic.com...

я ...

Цитата:

искал оффлайн менеджер, которий смог бы скачать с www.allmusic.com страницы конкретных исполнителей с ссылками на их альбомы.

и ...

Цитата:

нужны ссылки ТОЛЬКО на альбомы.

всё сделал как вы советовали:

1.

Цитата:

Это очень просто - возьмите 3-ю версию Offline Explorer - в Свойствах Проекта есть секция Дополнительно (Advanced) - там есть возможность разрешить вычисление выражений в скриптах (Evaluate Java script expressions). И программа без проблем возьмет эти ссылки.

2.

Цитата:

Довольно просто - в URL Filters | Filename выберите Custom Configuration и добавьте в разрешенные имена файлов следущее:

amg.dll

Добавлено
Вернее, надо добавить:

sql=A

Похоже, именно ссылки с такими частями указывают именно на альбом.

всё прекрасно работает...

...но ,

программа пытается (и с успехом это делает) скачать ссылки после сохраненных страниц с альбомами , всяких там Similar/Related albums ... проще , как будто я в проекте указывал - уровень=2

даже сделал уровень=0 но итог тот же...

как программу огородить от ненужных мне ссылок?

Автор: bredonosec
Дата сообщения: 22.02.2004 02:35

OlegChernavin

Цитата:

запустить его по Ctrl-F5 и практически сразу остановить

- Пасиб!

Автор: OlegChernavin
Дата сообщения: 23.02.2004 11:45

Цитата:

как программу огородить от ненужных мне ссылок?

Это из-за того, что в скриптах очень трудно понять, ведет ли ссылка на элемент страницы (картинка, стили, флеш и т.д.) или на другую страницу. Постараюсь улучшить, но трудно что-то обещать. Уж слишком неочевидные вещи в скриптах.

Автор: nicka
Дата сообщения: 24.02.2004 00:04

Цитата:

Постараюсь улучшить, но трудно что-то обещать.

должен отметить, что если у испольнителя альбомов мало (так, 5-6), то никаких проблем...

Автор: bredonosec
Дата сообщения: 24.02.2004 06:12

Прошу прощенья, но не допираю, как шаблон загнать по такого рода ссылам?

http://www.paratype.com/ru/library/newstyles.asp?fontcode=PT_ACD
http://www.paratype.com/ru/library/newstyles.asp?fontcode=PT_ADN
http://www.paratype.com/ru/library/newstyles.asp?fontcode=PT_BNK

или тут только методом указания "filename includes" http://www.paratype.com/ru/library/newstyles.asp?fontcode=
?

Автор: Horbak
Дата сообщения: 24.02.2004 18:34

Offline Explorer v.3.0.1507 SR1
Offline Explorer v.3.0.1507 SR1 (1,8 Мб)
_http://www.metaproducts.com/download/oesetup.exe
Offline Explorer Pro v.3.0.1508 SR1 (2,0 Мб)
_http://www.metaproducts.com/download/opsetup.exe
Offline Explorer Enterprise v.3.0.1508 SR1 (2,2 Мб)
_http://www.metaproducts.com/download/eesetup.exe

Автор: OlegChernavin
Дата сообщения: 25.02.2004 21:45

Цитата:

Прошу прощенья, но не допираю, как шаблон загнать по такого рода ссылам?

Да, именно так и можно сделать:
http://www.paratype.com/ru/library/newstyles.asp?fontcode=

или еще проще:
newstyles.asp?fontcode=

Автор: TCPIP
Дата сообщения: 01.03.2004 01:17

Хочу загрузить содержимое следующего каталога: h**p://www.wolframscience.com/nksonline/ Что-то не пойму, как это сделать, чтобы OE не пускался "во все тяжкие", а скачал то и только то, что находится в каталоге nksonline/?
Спасибо.

Автор: albel
Дата сообщения: 01.03.2004 01:21

TCPIP
а настройка "загружать файлы с начального каталога и ниже" не помогает?
Если добавить в Мастер url типа h**p://www.wolframscience.com/nksonline/index.html, то как раз начальным каталогом будет /nksonline.
Так?

Автор: OlegChernavin
Дата сообщения: 01.03.2004 19:25

Цитата:

а настройка "загружать файлы с начального каталога и ниже" не помогает?

Должно помочь. Честное слово!

Автор: vladmir
Дата сообщения: 02.03.2004 08:29

OlegChernavin
Опять про справку.
Почему Вы не используете формат .chm ?
Может это опять субъективно, но .hlp по-моему менее удобный формат:
- про дизайн вообще говорить не приходится - .hlp (на win98 во всяком случае) выглядит убого
- не работает прокрутка колесом и на постепенное перемещение полосы прокрутки курсором реакция дёрганная
- нет дерева файлов, постоянно находящегося перед глазами - список страниц существует где-то по отдельности
==
Кстати, не переведена на русский "хронология вызовов"

Автор: OlegChernavin
Дата сообщения: 02.03.2004 11:03

Цитата:

Почему Вы не используете формат .chm ?

Пока по привычке - проще редактировать один .RTF файл в MS Word, чем кучу HTML.

Цитата:

Кстати, не переведена на русский "хронология вызовов"

А что за хронология?

Автор: bredonosec
Дата сообщения: 04.03.2004 03:43

Такой вопрос появился:
Есть ли в проге встроенная фича поиска странички в проекте по тому или иному признаку(там, по тайтлу/особо интересно/, имени файла /меньше/, или еще чему)?
// чесс-гря, верится слабо, но для очистки совести.. авдруг

//

Конкретный пример - скачал, допустим, я один из местных форумов, а чтоб найти нужную тему, надо или пролистать все страницы индекса или... есть или?

Автор: vladmir
Дата сообщения: 04.03.2004 07:56

OlegChernavin
В окне с текстами
Параметры -> Показать окно хронологии...
список уже прсмотренных страниц справки - для быстрого перехода

Автор: OlegChernavin
Дата сообщения: 04.03.2004 12:19

Цитата:

Есть ли в проге встроенная фича поиска странички в проекте

Есть конечно - меню Правка - Найти содержимое.

Цитата:

Параметры -> Показать окно хронологии...
список уже прсмотренных страниц справки - для быстрого перехода

Ясно. Постараемся перевести. Спасибо.

Автор: GaDiNa
Дата сообщения: 07.03.2004 12:19

Доброго времени суток.
У меня - OE Ent 3.0.1508 Service Release 1.

Может я неправильно чтото делаю, но вот допустим хочу скачать сайт:

thinstation.sourceforge.net ~ 300Kb

В новом проекте ввожу этот адрес, уровень загрузки = 1, и он начинает мне качать с РАЗНЫХ сайтов всякие банерв, картинки, непонятный мусор...
Причем в папке thinstation.sourceforge.net не хватает папки Docs и куча какихто файлов Descr.WD3

А если пользуюсь wget - аккуратно в папке создается копия сайта и Docs и текстовиками появляется...

Вот попробуйте скачать этот сайт - там всего 300 кб , у кого он нормально скачается ?

Автор: albel
Дата сообщения: 07.03.2004 12:36

GaDiNa
вроде как по умолчанию в проекте стоит "Load images from any Location"

Цитата:

Причем в папке thinstation.sourceforge.net не хватает папки Docs

можно попробовать поставить Try to explore all possible subdirs

В общем, попробовал - у меня всё нормально скачалось

Добавлено
OlegChernavin
ктстаи, а экспортировать статистику по проекту в текстовый файл можно?

Автор: nicka
Дата сообщения: 07.03.2004 23:58

есть список сайтов , которых я посещаю каждый день. В основном это блоги, которые обновляются раз в день. Вот я бы хотел автоматизировать процесс посещения , например так:

1.устанавливается соеденение ночью

2.заходит программа на конкретные сайты

3.СКАЧИВАЕТ СУЩЕСТВУЮЩИЕ ОБНОВЛЕНИЯ С ПЕРЕХОДАМИ ОТ НОВЫХ ЛИНКОВ (уровень=1), ТОЛЬКО ТЕКСТ И ГРАФИКА , НИКАКИХ АРХИВОВ ВРОДЕ EXE,ZIP,RAR...

4.отменяется соеденение

5.просматрываются обновленные сайты в оффлайне на другой день

как настройть программу?

пожалуйста ,
поделитесь советом,
ну очень надо,
перешёл на night unlimited...

Автор: albel
Дата сообщения: 08.03.2004 00:07

nicka
1. Выбираешь проект, устанавливаешь в свойствах Расписание, какое тебе нужно. В графе "Типы файлов" оставляешь только текст и графику.
2. В настройках программы, п. Интернет - настраиваешь под свои нужды Дозвон и Отсоединение.

Цитата:

5.просматрываются обновленные сайты в оффлайне на другой день

это, как я понимаю, всё же пользователь делать должен

Автор: nicka
Дата сообщения: 08.03.2004 01:43

albel

это всё понятно, но важно скачать ТОЛЬКО ОБНОВЛЕНИЯ

например _http://anfrax.ru/

хотелось бы чтоб программа скачала всё что идёт посередине сайта (то что обновляется каждый день) и НЕ шла по линкам, которые находятся по краям (то что НЕ обновляется каждый день - главная,архив,о проекте...)

всё то же самое на

_http://dirty.ru/
_http://rupor.net/
_http://www.freeware.ru/present_start_0.html

может быть нужно поиграть с настройками?
Фильтры URL -> Протокол -> Загружать файлы со следующих протоколов...
или
Фильтры URL -> Сервер...

там у меня всё по дефолту, и как советовали оставляю только текст и графику, но программа упорно пытается загрузить *.exe файлы. Я даже добавил -exe- в список расширении и снял галку с "Архивы" но это не дала результата. Как вообще исключить не нужные мне расширения, например *bin;*.dat;*.exe?

Автор: bredonosec
Дата сообщения: 09.03.2004 08:07

Цитата:

Есть конечно - меню Правка - Найти содержимое

- Ага, пасиб!

так-с.. потестил - ищет в той папке или проекте, который выделен, правильно? Отдельно внутри подкаталогов проекта не ищет, так?
И еще, поиск идет по словам (неважно, где: варианты только "во всех, в текстовых, в недавно загруженных), т.е., слово отыщется независимо от того, в названии ли оно, или просто в тексте. Распознавания тайтла нет, так?

Добавлено

Цитата:

но программа упорно пытается загрузить *.exe файлы.

- А если убрать галку с пункта "другие" (файлы)? Или в урл-сеттингах выбрать кастом конфигурацию файлов и в исключаемые(excluded) добавить ".exe"?
Цитата:

Я даже добавил -exe- в список расширении и снял галку с "Архивы" но это не дала результата.

- Не понял, для чего это действие? Или ты .ехе" добавил в список типов архивов и тогда убрал с них галку?

Автор: OlegChernavin
Дата сообщения: 09.03.2004 08:55

Цитата:

так-с.. потестил - ищет в той папке или проекте, который выделен, правильно?

Ага.

Цитата:

Отдельно внутри подкаталогов проекта не ищет, так?

Нет. А нужно?

Цитата:

И еще, поиск идет по словам (неважно, где: варианты только "во всех, в текстовых, в недавно загруженных), т.е., слово отыщется независимо от того, в названии ли оно, или просто в тексте. Распознавания тайтла нет, так?

Поиск идет просто - убираются все теги из HTML файлов и в оставшемся чистом тексте ищутся слова.

Цитата:

но программа упорно пытается загрузить *.exe файлы.

Проверьте, нет ли .exe расширения в других категориях Фильтров Файлов.

Цитата:

СКАЧИВАЕТ СУЩЕСТВУЮЩИЕ ОБНОВЛЕНИЯ С ПЕРЕХОДАМИ ОТ НОВЫХ ЛИНКОВ (уровень=1)

Мне кажется, что лучше вего использовать режим обновления "Не закачивать существующие файлы на уровнях выше 0" - Т.е. первая страница будет скачана, а с нее будут грузиться только ссылки, которые до сих пор не были скачаны - т.е. только новые.

Добавлено

Цитата:

ктстаи, а экспортировать статистику по проекту в текстовый файл можно?

А в каком формате и, если не секрет, для чего?

Автор: TCPIP
Дата сообщения: 10.03.2004 02:39

Господа, подскажите, что делать с загрузкой сайтов следующего типа:
Хочу скачать статью w*w.flexbeta.net/main/articles.php@action=show&id=17&perpage=1&pagenum=1
Так как она 3-х сраничная, использую URL-макрос
w*w.flexbeta.net/main/articles.php@action=show&id=17&perpage=1&pagenum={:1..3}
В Advanced поставил флажок Evaluate Script Calculations (правда, не занаю, так ли он нужен в данном случае). Запустил закачку и... OE пошул скачивать лишнее --- накачал кучу ссылок на новости (которые присуствуют на заданных страницах) вида _www.flexbeta.net/main/comments.php@id=6533&catid=6 и прочее и прочее. Как указать OE, чтобы он ограничился только указанными тремя страницами (плюс загрузил все приведенные в статье рисунки)?!

Автор: OlegChernavin
Дата сообщения: 10.03.2004 08:02

Во-первых, надо использовать

w*w.flexbeta.net/main/articles.php?action=show&id=17&perpage=1&pagenum={:1..3}

Т.е. не @, а ?.

Во-вторых, уровень должен быть 0. Тогда будут закачиваться только стили, скрипты и картинки (ну и фреймы, если используются). Уровень больше 0 разрешает закачку всех остальных ссылок на другие страницы.

Добавлено

Цитата:

thinstation.sourceforge.net ~ 300Kb

В новом проекте ввожу этот адрес, уровень загрузки = 1, и он начинает мне качать с РАЗНЫХ сайтов всякие банерв, картинки, непонятный мусор...
Причем в папке thinstation.sourceforge.net не хватает папки Docs и куча какихто файлов Descr.WD3

Скачал этот сайт. Папка docs без проблем скачалась (даже без проверки всех возможных подкаталогов). Судя по всему, был задан слишком маленький уровень - нужно не меньше 2, лучше - 10.

Насчет мусора - нужно запретить картинкам скачиваться откуда угодно - это в Фильтрах Файлов | Картинки - Расположение.

Descr.wd3 - эти файлы хранят информацию и реальном MIME типе каждого скачанного файла в папке и дату последней модификации файла. Нужны для правильного отображения файлов при оффлайн-просмотре и для корректного обновления сайта.

Автор: qwqw
Дата сообщения: 10.03.2004 18:52

ВОПРОС К OLEGCHERNAVIN'У

Возможно ли сделать и планируете ли Вы в следующих версиях чтобы Offline Explorer мог просканировать сайт и показать его древовидную структуру со всеми директориями до начала закачки, тогда появляется наглядная возможность выбрать определенные директории для закачки, а также возможность перейти сразу к определенным страницам минуя все предыдущие уровни?

Автор: Tim72
Дата сообщения: 10.03.2004 19:41

qwqw
в правом верхнем углу станицы, в этой теме или в этой:
http://forum.ru-board.com/topic.cgi?forum=5&topic=1621&start=80#lt
щелкаем "Версия для печати", юзаем поиск - получаем ответ

Автор: qwqw
Дата сообщения: 10.03.2004 21:45

Tim72

По твоему совету прочитал всю ветку http://forum.ru-board.com/topic.cgi?forum=5&topic=1621&start=80#lt

Ответа не нашел. Вопрос у меня к автору проги не о том умеет ли прога строить карту сайта, а планирует ли он сделать такую функцию.

Автор: Tim72
Дата сообщения: 10.03.2004 21:58

qwqw

Цитата:

Автор: OlegChernavin, Отправлено:19:00 27-02-2004

Цитата:
Ну а в Offline Explorer мне очень не хватает "Retrieve only file names" (есть в Teleport) - только список имён файлов без загрузки самих файлов. Хочу!

Я одного не понимаю - зачем это нужно, ведь все-равно придется скачивать весь сайт, все HTML, JS, CSS, Flash, etc. - чтобы вытащить все ссылки. И после этого если захочется сайт все-таки скачать, придется скачивать все заново - практически двойная работа.

Я пытался обсудить это с несколькими людьми и так и не получил внятных объяснений, зачем это нужно. Может обсудим здесь, как это можно применить, плюсы и минусы? Мне бы не хотелось делать фичу только потому что ее попросили, не понимаю ее сути и необходимости. Мне хочется самому понимать что к чему, тогда я могу ее сделать намного удобнее для применения.

Автор: qwqw
Дата сообщения: 10.03.2004 23:06

Tim72 Спасибо.

Цитата:

Я одного не понимаю - зачем это нужно, ведь все-равно придется скачивать весь сайт, все HTML, JS, CSS, Flash, etc. - чтобы вытащить все ссылки. И после этого если захочется сайт все-таки скачать, придется скачивать все заново - практически двойная работа.

Black Widow ничего не скачивая за несколько минут строит карту сервера небольшого сайта.
А удобно тем, что не надо пробираться на некоторых сайтах где много уровней и подуровней, что бы узнать что находится на них.

Автор: TCPIP
Дата сообщения: 11.03.2004 03:28

OlegChernavin
Спасибо. Только вот остается еще следующий вопрос:
Хорошо, мы сузили угол обзора OE до уровня 0. Но, что делать, если рисунки в загруженной статье являются миниатюрами, и ведут на увеличенные размеры самих себя. (то есть в тексте присутствует маленькая картинка, а хочешь ее хорошенько разглядеть --- щелкни на ней, получи ее увеличенную копию) Как сделать так, чтобы OE автоматически загрузил и все эти "увеличенные копии", не загружая при этом всю остальную требуху (ту, что получается, если тупо выставить уровень 1)?

Цитата:

Во-первых, надо использовать не @, а ?

так это я, сами понимаете, копировал из адресной строки самого OE, а он, если помните

заменяет ? на @ (не знаю, правда, зачем).

:BUGBUG:

При выборе в контекстном меню команды +Offline Explorer: Download The Current Page MyIE (впрочем, IE тоже) зависают и ничего в сам OE не передается.
Почему несмотря на то, что в свойствах проекта в списке фильтра типа Other присутствует расширение Sfw, файлы (картинки в статье) не загружаются и на месте их показывается просто белое поле.
Если в имени папки проекта содержатся недопустимые (в обычных случаях) символы (например двоеточие ":" или "?"), OE, несмотря на то, что он автоматически заменяет эти недопустимые символы в пути к папке на жестком диске, отказывается открывать загруженный проект для просмотра, сообщая, что документ не найден.
Например, хотим загрузить статью Does Everything Have To Be A Centrino? Intel says "No"! (h**p://www.tomshardware.com/mobile/20040309/index.html). Создаем папку проекта, задавая ей такое же имя, как и у статьи (то есть так, что в названии папки проекта присутствует "?"), аналогично, копируя, задаем такое же имя в качестве имени папки на жестком диске, куда будет сохраняться проект. OE любезно заменяет символ "?" на _. Казалось бы ура! Торжество "AI"... Ан нет! Загрузив проект и дважды щелбанув на нем, получаем сообщение:

Код:
Document not found

This page is not accessible offline. Possible reasons: either it was an invalid link on the server or Project settings do not allow the page to be downloaded. In some cases, increasing Project Level setting should help.

Click here to go online:
http://Does Everything Have To Be A Centrino? Intel says "No"! /www.tomshardware.com/mobile/20040309/default.htm

Download the missing link now and add it to the selected Project.

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

Предыдущая тема: X-Uploader программа для

Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.