Ru-Board.club
← Вернуться в раздел «Программы»

» MetaProducts Offline Explorer / Offline Browser (Часть 3)

Автор: OlegChernavin
Дата сообщения: 04.02.2016 10:57
muhaha

Большое спасибо за теплые пожелания!

Я думаю, сам экспорт и не нужен для этого. Насколько я понимаю, есть программа, которой скармливается папка с файлами от этого проекта (как результат экспорта).

В 7й версии есть меню Сервис - Извлечение Данных. Он помогает использовать внешние программы и инструменты, типа TextPipe. Может лучше было бы с помощью этого окна передавать список страниц?

Я также планирую сам сделать полноценный инструмент извлечения данных, чтобы можно было мышью указывать что со страницы выбирать и в какие ячейки складывать. Но это займет время.
Автор: Ghost Inets
Дата сообщения: 04.02.2016 12:06
Не могу скопировать сайт http://www.rhino-book.ru/info.php
Есть идеи?
Автор: OlegChernavin
Дата сообщения: 04.02.2016 12:33
Ghost Inets

Сайт скачивается и работает нормально оффлайн. Но есть три места в скриптах на странице, которые мешают просмотру.

Можно нажать кнопку редактирования на панели инструментов и найти три строчки. Их нужно закомментировать - поставить два слеша (//) перед:

// dc.href = '../rhino-book.ru';

// cukumncubhpwcrehpmfldewmq.replace('../rhino-book.ru')

и

//document.location.href = './';

// ekorkcnewekkd.href = emfdmRQclh("h")+emfdmRQclh("t")+emfdmRQclh("t")+emfdmRQclh("p")+emfdmRQclh(":")+emfdmRQclh("default.htm")+"/"+emfdmRQclh("r")+emfdmRQclh("h")+emfdmRQclh("i")+emfdmRQclh("n")+emfdmRQclh("o")+emfdmRQclh("-")+emfdmRQclh("b")+emfdmRQclh("o")+emfdmRQclh("o")+emfdmRQclh("k")+emfdmRQclh(".")+emfdmRQclh("r")+emfdmRQclh("u");


После этого сохранить и все начнет работать.
Автор: Ghost Inets
Дата сообщения: 04.02.2016 14:22
OlegChernavin
Спасибо, но я таких строк не нашел.
Автор: OlegChernavin
Дата сообщения: 04.02.2016 22:34
Ghost Inets

Возможно, каждый раз по-другому они называются, лучше не поиском пользоваться, а просмотреть редактируемый файл самому вручную. Судя по всему, сайт называет эти переменные по-разному для каждого посетителя.
Автор: Ghost Inets
Дата сообщения: 05.02.2016 22:15
OlegChernavin

Что искать?
Автор: OlegChernavin
Дата сообщения: 06.02.2016 00:47
Ghost Inets

Искать строки, похожие на то, что я привел выше. Они будут без символов //, которые означают комментарий - отключенный код.
Автор: Ghost Inets
Дата сообщения: 07.02.2016 21:33
Может, я перешлю default.html желающим помочь?
Автор: OlegChernavin
Дата сообщения: 08.02.2016 01:27
Ghost Inets

Да, кидайте на файлообменник и ссылку сюда.
Автор: AntikillerPM
Дата сообщения: 08.02.2016 10:05

за все время использования впервые пропали все проекты. Проекты не сохранял. Произошло после того как в настройках было установлено разовое выключение.
Возможно ли теперь как-то проекты восстановить? Каталоги на месте.

PS
извините, занервничал. в шапке всё описано. проекты восстановил. спасибо за описание.
Автор: Ghost Inets
Дата сообщения: 08.02.2016 13:49
OlegChernavin
Спасибо! Вот

Добавлено:
Ссылка

Добавлено:
Тут сайт полностью Ссылка
Автор: OlegChernavin
Дата сообщения: 08.02.2016 16:23
AntikillerPM

Это не сложно восстановить. Откройте диалог Настроек программы - секция Файлы. Нужно в Проводнике Windows открыть папку, которая указана как Проекты, Шаблоны и Карты.

В ней есть много копий файла webdown..

Нужно найти самую свежую, причем максимального размера и скопировать под именем webdown.dat - это актуальный файл с проектами.

На всякий случай до манипуляций с файлами, скопируйте все webdown.* файлы в другой каталог для резервной копии.
Автор: cuneiform
Дата сообщения: 08.02.2016 18:59
Доброго времени суток, Олег

Плиз подскажите можно ли теперь будет как-то скачивать книги здесь,
там страницы книг в графике подключаются через базу данных, а раньше можно
было напрямую адресовать страницы для закачки,
я например успел скачать 7 том словаря Лярусс в формате png,
а теперь при попытке скачивать далее начиная с 1 тома - уже не получается автоматом с макросами напрямую:

gallica.bnf.fr/ark:/12148/bpt6k1200532b/f1.item

если пытаться включить макросы как было раньше возможно:

http://gallica.bnf.fr/ ... /12148/bpt6k1200532b/f{:1..826#1}.png

Если сохранять каждую страницу вручную в обычном броузере, то это затратно по времени.

Как быть с закачкой из баз данных?
Автор: OlegChernavin
Дата сообщения: 09.02.2016 01:55
Ghost Inets

Ну вот смотрите, почти вначале страницы идут скрипты:

if (label=="../www.rhino-book.ru/404.shtml.htm" || label=="../www.rhino-book.ru/404.shtml.htm" ) {

} else {

dc.href = './';

}


Нужно закомментировать строчку таким образом:

// dc.href = './';


Потом идут:

if (oDfAGRCDEpHuDTJ=="../www.rhino-book.ru/404.shtml.htm" || oDfAGRCDEpHuDTJ=="../www.rhino-book.ru/404.shtml.htm" ) {

} else {

nzczfzrkouehpmp.replace('./')

}


Аналогично:

// nzczfzrkouehpmp.replace('./')

И, наконец:

var lzukroodmwkmeo=document.location
var CeeluqwQokKUYR=lzukroodmwkmeo.host;

var lzukroodmwkmeolzukroodmwkmeolzukroodmwkmeo=eqpkwcQwopwnn("w")+eqpkwcQwopwnn("w")+eqpkwcQwopwnn("w")+"."+eqpkwcQwopwnn("r")+eqpkwcQwopwnn("h")+eqpkwcQwopwnn("i")+eqpkwcQwopwnn("n")+eqpkwcQwopwnn("o")+eqpkwcQwopwnn("-")+eqpkwcQwopwnn("b")+eqpkwcQwopwnn("o")+eqpkwcQwopwnn("o")+eqpkwcQwopwnn("k")+eqpkwcQwopwnn(".")+eqpkwcQwopwnn("r")+eqpkwcQwopwnn("u");

if (CeeluqwQokKUYR!=lzukroodmwkmeolzukroodmwkmeolzukroodmwkmeo) {


if (CeeluqwQokKUYR!=eqpkwcQwopwnn("r")+eqpkwcQwopwnn("h")+eqpkwcQwopwnn("i")+eqpkwcQwopwnn("n")+eqpkwcQwopwnn("o")+eqpkwcQwopwnn("-")+eqpkwcQwopwnn("b")+eqpkwcQwopwnn("o")+eqpkwcQwopwnn("o")+eqpkwcQwopwnn("k")+eqpkwcQwopwnn(".")+eqpkwcQwopwnn("r")+eqpkwcQwopwnn("u")) {

document.location.href = '../www.rhino-book.ru/default.htm';

lzukroodmwkmeo.href = eqpkwcQwopwnn("h")+eqpkwcQwopwnn("t")+eqpkwcQwopwnn("t")+eqpkwcQwopwnn("p")+eqpkwcQwopwnn(":")+eqpkwcQwopwnn("default.htm")+"/"+eqpkwcQwopwnn("r")+eqpkwcQwopwnn("h")+eqpkwcQwopwnn("i")+eqpkwcQwopwnn("n")+eqpkwcQwopwnn("o")+eqpkwcQwopwnn("-")+eqpkwcQwopwnn("b")+eqpkwcQwopwnn("o")+eqpkwcQwopwnn("o")+eqpkwcQwopwnn("k")+eqpkwcQwopwnn(".")+eqpkwcQwopwnn("r")+eqpkwcQwopwnn("u");
}

}

Коменты:

// document.location.href = '../www.rhino-book.ru/default.htm';

// lzukroodmwkmeo.href = eqpkwcQwopwnn("h")+eqpkwcQwopwnn("t")

И сохранить после редактирования


Добавлено:
cuneiform

А почему бы и не как раньше? Я посмотрел, адрес картинки:

http://gallica.bnf.fr/ark:/12148/bpt6k1200532b/f7.highres

То есть макрос:

http://gallica.bnf.fr/ark:/12148/bpt6k1200532b/f{:1..826}.highres

Не получится так?
Автор: AntikillerPM
Дата сообщения: 09.02.2016 02:57
OlegChernavin, спасибо! всё уже сделал прочитав FAQ темы. Все работает.
Автор: Ghost Inets
Дата сообщения: 09.02.2016 12:35
OlegChernavin
спасибо, файл default.html грузится а далее - ой... Пишет ошибку
Firefox не может найти сервер default.htm.

Добавлено:
Раздуплил еще один файл.
Придется руками править все html - файлы.
Имена переменных там произвольные.
Автор: cuneiform
Дата сообщения: 09.02.2016 18:12

Цитата:
А почему бы и не как раньше? Я посмотрел, адрес картинки:

http://gallica.bnf.fr/ark:/12148/bpt6k1200532b/f7.highres

То есть макрос:

http://gallica.bnf.fr/ark:/12148/bpt6k1200532b/f{:1..826}.highres

Не получится так?


===========================

Получилось тогда так:



Справа мы видим как было раньше при загрузке.
Слева видим как стало теперь загружаться.
Есть файлы с расширением highres, у них всех одинаковое содержание:
<HTML><HEAD><META HTTP-EQUIV="Refresh" CONTENT="0; URL=bpt6k1200532b_089F3CE318.PNG"><TITLE>302 File moved</TITLE></HEAD></HTML>

Сами номера файлов в Png шифруются названиями в 16-ричной системе (?)
То есть, страницы загружаются, но 10-ричной записи номеров файлов нет.
КАк добиться нормальной записи номеров файлов?
Иначе нельзя упорядочить страницы по порядку.





Автор: OlegChernavin
Дата сообщения: 09.02.2016 18:26
Ghost Inets

Я думал, как можно сделать автоматическое отключение этого скрипта, но простого решения пока нет. Увы!

cuneiform

Быстрый вариант - добавить строчку в поле адресов проекта:

Additional=SkipDisposition
Автор: cuneiform
Дата сообщения: 09.02.2016 18:54
Получилось, спасибо, Олег.

А то что вместо 826 файлов загрузилось - как пишет и по времени - 1652 файла = нормально для данного случая, в смысле, так и должно быть? Или я что-то е так сделал?
Я вижу новых файлов загрузилось в директорию 826 штук, а счетчик считал все 1652 файла.
Следующий том счетчик отсчитал ровно 978 файлов, а не в 2 раза больше.
ПОэтому все вопросы снимаю и еще раз благодарю за помощь.
Автор: OlegChernavin
Дата сообщения: 10.02.2016 10:43

Цитата:
А то что вместо 826 файлов загрузилось - как пишет и по времени - 1652 файла = нормально для данного случая, в смысле, так и должно быть? Или я что-то е так сделал?


Я думаю, это после изменения настроек проекта, когда он перестал сохранять .png файлы дополнительно к .hires

Автор: muhaha
Дата сообщения: 13.02.2016 17:44
В закладке Queue было бы неплохо чтобы новые строки появлялись внизу, ибо там информация проносятся быстро и что-либо проанализировать или выполнить правый клик на нужном файле тяжело, ползунком пользоваться сложно (попробуйте сами). То же самое относится к закачиваемым в данный момент файлам - если вызвать правой кнопкой меню, то действие будет выполняться не с файлом, на который нажали, а с файлом, занимающим слот в момент нажатия на пункт из меню.

При экспорте пригодилась бы фунция удаления скриптов по шаблону <script type="text/javascript".*</script>. Они только рекламу грузят, а полезные скрипты (ниспадающее меню например) все равно ламаются при экспорте и требуют ручной правки. Если html с неработающим скриптом (OnMouseover например) скомпилировать в chm файл, то при просмотре будет выскакивать ошибка (которая не отображается, если файл просто открыть в браузере). Скрипты в офлайн версии часто не работают, а для большинства сайтов удаление скриптов никак не отражается на их функциональности.
Автор: OlegChernavin
Дата сообщения: 13.02.2016 22:24
muhaha

Очередь легко поставить на паузу - есть кнопка паузы загрузок или просто F9. Сам постоянно так пользуюсь.

Про скрипты. Можно их удалять с помощью функции Замена URL в свойствах проекта - секция Обработка. Там можно делать шаблоны модификации, удаления HTML кода во время загрузки.

Попробуйте. Если на большинстве сайтах оффлайн просмотр без скриптов не сломается, я постараюсь добавить эту функцию в экспорт одной галкой.

Но зачастую скрипты используются страницами активно, в них немало ссылок и даже оффлайн они полезны.
Автор: muhaha
Дата сообщения: 14.02.2016 10:04
Если скачать сайт подобный википедии:
http://avisynth.nl/index.php/Main_Page
То ссылка в навигационной панели "Main Page" ведет в никуда в экпортируемом проекте (avisynth.nl/index.php/main_page/default.htm). Внутри OE ссылка работает, из папки загрузки и из папки экспорта - нет. Возможно, что default.htm некорректно прописывается в ссылках.

Проект:

[Object]
Type=0
IID=8053
Caption=http://avisynth.nl/index.php/Main_Page
URL=http://avisynth.nl/index.php/Main_Page
MVer=5
Lev=1000000
Weekday=257
FMGroup=1
FTText.Exts=htmlhtmaspaspxjspstmstmlidcshtmlhtxtxttextxspxmlrxmlcfmwmlphpphp3cgi.
FTImages.Exts=gifjpgjpegtiftiffxbmfifbmppngipxjp2j2cj2kwbmplwfwebpico
FTVideo.Exts=mpgavianimpegmovflvfliflcvivrmramrvasfasxwmvm1vm2vvobsmilmp4m4vogv
FTAudio.Exts=wavriffmp3midmp2m3uravocwmaapeoggm4aaifkar
FTArchive.Exts=7zziparcgzzarjlhalayleirarcabtarpakacejarpdftgzexeiso
FTUDef.Exts=axdclasscssdtdentjsssiswfvbsxsl xxxxxxxxxx
FTText.B=ooxooo
FTImages.B=ooxooo
FTVideo.B=ooxooo
FTAudio.B=ooxooo
FTArchive.B=ooxooo
FTUDef.B=ooxooo
FTOther.B=ooxooo
FTSizes=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,3,3,3,0,3,0,0,0,0,0,0,0,0
NotIgnoreLogout=False
RSrvsBx=1
RPathEx=*special:**template:* xx
RFileEx=*=history*=edit*talk:**special:**&oldid=**&printable=**&redirect=**&diff=**&direction=**template:**.3f*&page* xxxxxxxxxxxx
RProt=255
S200=329
S304=5393
S400=1910
SPar=3329
SSav=329
SLast=404
SSiz=4413198
SMdf=21
SHTML=329
SSuccDowns=2
LFiles=7631
LSize=4901280
ImgDim=0,0,0,0
PrevURL=http://avisynth.nl/index.php/Main_Page
ConvertRSS=True
ConvertWWW=False


==================


При закачке ломаются onMouseOver скрипты:
http://www.aquilinestudios.org/avsfilters/spatial.html
Оригинал:
<p><a onMouseOver="blindppimg.src='blindpp2.png'" onMouseOut="blindppimg.src='blindpp0.png'">
Экспорт:
<p><a onMouseOver="blindppimg.src='blindpp2.png'src='blindpp2.png'src='blindpp2.png'src='blindpp2.png'" onMouseOut="blindppimg.src'blindpp0.png'blindpp0.png'blindpp0.png'blindpp0.png'">
Файл из папки закачки:
<p><a onMouseOver="blindppimg.src='blindpp2.png'src='blindpp2.png'" onMouseOut="blindppimg.src='blindpp0.png'blindpp0.png'">

Галка "Evaluate script calculations" не влияет на результат.


=================


При скачивании из web.archive.org часто нужно ограничивать год указывая его во включенных директориях:
Не работает:
*/2005*/http://www.webpage.net/subdir/*
Работает:
*/2005*/*www.webpage.net/subdir/*

OE почему-то не дает использовать http:// в фильтрах по директории.


=================

Если скачать страницу
http://web.archive.org/web/20051210033529/http://www.diabloii.net/items/quest/quest_main.shtml
и при экспорте поставить галку "Use standard extensions...", то ссылки на картинки портятся:
Оригинал:
<img border="0" src="quest_images/amulet-viper.gif" width="29" height="29">
Экспорт:
<img border="0" src="quest_images/amulet-viper.gif.htm" width="29" height="29">

К тому же эту страницу нельзя открыть после экспорта вообще. В браузере OE и из папки загрузки страница открывается.


=================

На некоторых страницах есть проблемы с кодировкой, после скачивания искажаются значки списка •:
http://web.archive.org/web/20051210041232/http://www.diabloii.net/items/map.shtml

Подобное происходит с апострофом ’:
http://web.archive.org/web/20030806115644/http://www.diabloii.net/strategy/x-guides/bowazon-rashalgar.php
Автор: OlegChernavin
Дата сообщения: 20.02.2016 13:23
muhaha

Цитата:
При закачке ломаются onMouseOver скрипты:


Цитата:
То ссылка в навигационной панели "Main Page" ведет в никуда в экпортируемом проекте


Исправил.


Цитата:
При скачивании из web.archive.org часто нужно ограничивать год указывая его во включенных директориях:


Просто ОЕ убирает это http:// из ссылок для простоты.



Добавлено:
muhaha

Картинки и кодировка не портятся в последней версии ОЕ. Если с кодировкой что-то не так, можно нажать на странице правой кнопкой в браузере и выбрать Unicode.
Автор: alens
Дата сообщения: 20.02.2016 15:46
OlegChernavin

А какие настройки нужно выставить чтобы на странице скачивать то что спрятано под спойлером



Таких страниц много на разных форумах, например на рутрекере. Пробовал разные настройки, разные форумы, но спойлер при скачивании все равно остается закрытым
Автор: OlegChernavin
Дата сообщения: 20.02.2016 15:51
alens

Кроме рутрекера есть примеры сайтов? Мне нуэны адреса страниц, чтобы проверить
Автор: alens
Дата сообщения: 20.02.2016 16:18
OlegChernavin

Например вот на этом форуме

http://forum.ovgorskiy.ru/viewtopic.php?f=22&t=3241

Сама страница с картинками скачивается без проблем, а вот то что скрыто под спойлером нет
Автор: OlegChernavin
Дата сообщения: 20.02.2016 20:41
alens

Спасибо за ссылку! Исправил эту ошибку. Если нужна обновленная версия, напишите, какую редакцию используете.
Автор: alens
Дата сообщения: 20.02.2016 21:36
OlegChernavin

Использую редакцию Enterprise
Автор: OlegChernavin
Дата сообщения: 21.02.2016 09:45
alens

Вот новая версия:

http://www.metaproducts.com/download/betas/eesetup.exe

Страницы: 12345678

Предыдущая тема: Редактор окон windows


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.