Ru-Board.club
← Вернуться в раздел «Программы»

» настройка Proxomitron

Автор: estimated
Дата сообщения: 01.02.2006 01:47
Подскажите, пожалуйста, каким образом лучше всего решать такую задачу:

Грузится страничка, относительно большая (50-100 кб).

Из нее меня интересует только небольшой кусочек размером 1-2 кб, который и должен оставаться видимым, все остальное должно удаляться (или, по крайней мере, не отображаться).

Причем, иногда этого нужного мне кусочка на странице может и не быть, в таком случае мне тоже не надо отображать всю страницу в исходном виде, а просто вывести короткое сообщение, что искомое не найдено.

Если я задаю фильтр в виде *искомое* - то у Proxomitron частенько едет крыша и он отбирает все процессорное время, парализуя броузер (кажется, это происходит как раз в тех случаях, когда искомой строки нет на страничке).


Нужен сам принцип решения такой задачи.

(На всякий случай, "Искомое" - это не статическая строка, а рег. выражение.)
Автор: unreal666
Дата сообщения: 01.02.2006 08:49
estimated
На примере этой страницы,чтобы оставить только одну твою фразу.


Код: [Patterns]
Name = "My filter"
Active = TRUE
Limit = 256
Match = "(<body*>)\1$SET(0=\1<span style='display:none'>)$SET(varDesired=Нет ни фига)|"
"(Подскажите, пожалуйста,*задачу)\1$SET(varDesired=\1)|"
"</body>$SET(0=</span>$GET(varDesired)</body>)"
Replace = "\0"

Автор: Dr Eam
Дата сообщения: 01.02.2006 09:03
Почему-то на домашнем компьютере очень часто стало происходить такое: после некоторого времени работы проксомитрон вдруг начинает отжирать 80% ресурсов, а то и более, вплоть до 100. Приходится закрывать и открывать его заново. В чём может быть дело?
Автор: unreal666
Дата сообщения: 01.02.2006 09:45
Dr Eam
У меня все нормально работает. Возможно какой-нибудь фильтр зацикливает. Посомтри страницы, на которых зацикливает, в режиме отладки.
Автор: Dr Eam
Дата сообщения: 01.02.2006 11:00
unreal666
Хорошо, попробую. Только у меня что на работе, что дома один набор фильтров (русская сборка + gzip informer), да и сайты примерно одни и те же посещаю.
Автор: estimated
Дата сообщения: 01.02.2006 11:44
unreal666
Большое спасибо!
Но некоторые вопросы/проблемы все же остались:

1. По идее, после фильтрации в броузере должен отображаться текст "Подскажите, пожалуйста, каким образом лучше всего решать такую задачу", но на самом деле отображается "Подскажите, пожалуйста,*задачу".

2. Как все-таки именно удалить текст из странички, а не просто добиться его неотображения?

3. Как в переменную 0 попадает весь тег body при лимите в 256 байт? Или что туда вообще попадает?! Что-то никак не могу логику понять. При повторном присваивании через $SET в переменной 0 ведь по идее должно быть только "</span>содержимое varDesired</body>" ?!

4. Как добиться отображения русских букв в диалоге редактирования фильтра?
(про "метод" с заменой .nls знаю, но пока не хочу его использовать)

Добавлено:
или вот еще идея:

я могу написать VB/JS скрипт (который будет запускаться из под WSH, а не внутри броузера), который отфильтрует страничку.

Но как заставить Proxomitron передавать определенные странички на обработку скрипту перед отправкой их в броузер?

(В саму страничку не хочу вставлять скрипт, т.к. все это должно работать при отключенных в броузере скриптах).
Автор: unreal666
Дата сообщения: 01.02.2006 23:34
estimated
1.
Цитата:
По идее, после фильтрации в броузере должен отображаться текст "Подскажите, пожалуйста, каким образом лучше всего решать такую задачу", но на самом деле отображается "Подскажите, пожалуйста,*задачу".

Это из-за того, что переменная varDesired выводит то, что в нее попало последним. А последним после моего поста попадало выражение в моем фильтре. Для соответствия сделай это выражение таким, чтобы не соответстсвовало моему.
3.
Цитата:
Как в переменную 0 попадает весь тег body при лимите в 256 байт? Или что туда вообще попадает?!

<body*> на примере данной страницы сответствует <body bgcolor="#ffffff" alink="#333333" vlink="#333333" link="#333333" topmargin="5" leftmargin="0">, что никак не больше 256 байт. Да и вообще, кол-во байт ставь столько, сколько будет длина твоего выражения.

Цитата:
При повторном присваивании через $SET в переменной 0 ведь по идее должно быть только "</span>содержимое varDesired</body>" ?!

В честь чего? $GET(varDesired) - это значит получить содержимое именнованной переменной varDesired.
4. У меня нормально отображается. Кажется эта фигня возникает, если ОС не WinXP.
2. Удалить можно, но только посимвольно. Наподобие

Цитата:
Соответствие:
(Твое соответствие)\1 | ?
Замена:
\1
.
Т.е. если выражение не соответствует, то удалится первый символ. Но такая процедура не хило сжирает процессрное время, потому что если 1-ый кусок не соответствует твоему выражению, то будет производиться сравнение с каждым символом.

Цитата:
Но как заставить Proxomitron передавать определенные странички на обработку скрипту перед отправкой их в броузер?

Понятия не имею. По идее должна быть программа посредник. Т.е. должно быть так.
Браузер -> Прога с обработкой скрипта -> Прокс -> Интренет
порт проги порт прокса
Автор: the7guest
Дата сообщения: 11.02.2006 19:55
Кто-нибудь знает, новые "русские" сборки намечаются или все заглохло?
Автор: pop2ROOT
Дата сообщения: 12.02.2006 10:34
the7guest
а чем тебе нынешние не нравятся? не так уж сильно в сети что-то изменилось, чтобы новые сборки собирать... я как поставил, так и пользуюсь, разве что пару правил своих добавил.
Автор: the7guest
Дата сообщения: 12.02.2006 14:56
Не вся реклама ловится, с рапидшарой проблемы, с гугло-майлом и еще кое-какими сайтами. Я догадываюсь, что где-то что-то можно самому подкрутить, но хотелось бы общее обновление.
Автор: unreal666
Дата сообщения: 12.02.2006 15:17
the7guest
Ради рапидшары и т.п. нет смысла создавать обновление фильтров, т.к. сам код на этих сайтах часто переписывается.
Автор: pop2ROOT
Дата сообщения: 12.02.2006 15:23
the7guest
на гугло-мэйл нужно ходить через игнорирование https в сабже - у меня проблем нет с ним никаких. Конкретные нужные тебе обновления (правила) можно попросить составить здесь или на форуме русского сабжа (ссылка в шапке)
Автор: Dr Eam
Дата сообщения: 13.02.2006 11:28
Гм. А какие проблемы с рапидшарой? У меня всё ок.
Автор: foilz
Дата сообщения: 13.02.2006 17:43
Согласен, у меня с рапидшарой тоже все нормально. Megaupload, по-моему не пашет, но просто лень покопать. Liveinternet на днях изменили - там ковырнул - все заработало. Просто ковырните текущую конфигурацию, и все будет пучком.
Автор: the7guest
Дата сообщения: 13.02.2006 19:18
у меня на рапидшаре начинает страница по кругу крутится, т.е. загрузится полстраницы, а дальше нишиша, коннекта нет, а загрузка страницы в опере начинается с бешенной скоростью, аж показывается что 100 и выше (пока не прервешь) мегабайт.

в принципе я все подобные проблемы лечу кнопкой bypass и перегрузкой страницы, но новую сборку все равно хочу
Автор: Dr Eam
Дата сообщения: 14.02.2006 09:00
the7guest
Подобная вещь с пустой скоростной загрузкой у меня тоже встречалась. Но не на рапидшаре, а уже и не помню, где.
Автор: unreal666
Дата сообщения: 15.02.2006 00:04
the7guest

Цитата:
а загрузка страницы в опере начинается с бешенной скоростью, аж показывается что 100 и выше (пока не прервешь) мегабайт.

Это означает, что у тебя какой-то фильтр вошел в цикл ("рекурсивное" соответствие). Посмтри страницу в режиме отладки - увидешь какой.
Автор: SELECONICS
Дата сообщения: 15.02.2006 03:37
а у меня на www.nnm.ru баннер с правой стороны ни как не хочет обрезаться, хотя в настрйках все баннеры поставлены галочки, что можно поделать?
Автор: Dr Eam
Дата сообщения: 15.02.2006 12:03
Не могу понять, что в русской сборке не даёт мне грузить www.kolobkov.net? В логе пишется, что срабатывают фильтры:
Match 897: Stop browser window resizing
Match 897: Kill pop-up windows
Match 897: Suppress all JavaScript errors
<end> 897: Reset page events {^sites} [RT]
<end> 897: Restore pop-ups after a page loads
+++CLOSE 897+++
Пробовал отключать их, чтоб понять, какой конкретно мешает - всё-равно не работает. А если отключить сразу все "Web Page Filters" - всё нормально грузится
Автор: unreal666
Дата сообщения: 15.02.2006 13:48
Dr Eam
У меня все нормально грузит.
Что у тебя там не загружает?
Автор: Dr Eam
Дата сообщения: 15.02.2006 14:56
unreal666

Цитата:
Что у тебя там не загружает?

Всё! Грузится 835 байт, и загрузка успешно завершается, вместо страницы - белый экран.
Автор: daMIR
Дата сообщения: 15.02.2006 15:09
Недавно видел сообщение одного товарисча, настроил сабж так, что все смайлы с ру-борды брались из папки, а не из интернета. Как сделать, не подскажите?
Автор: unreal666
Дата сообщения: 15.02.2006 16:28
daMIR
Для этого сначала надо скачать эти смайлы (а их до хрена - несколько сотен это точно).
Автор: daMIR
Дата сообщения: 15.02.2006 17:26
unreal666
Да что их скачаивать? Всю страницу сохарнил в одной папке и все (Они у меня и так лежат- полезно когда сообщения пишешь в оффлайне). Или каждый надо отдельно?
Автор: unreal666
Дата сообщения: 15.02.2006 17:47
daMIR
Это основные смайлы.
А полный список их http://smilies.ru-board.com/index.cgi?action=smile.


SELECONICS

Должен быть включен фильтр Flash banner blaster [ALX].
Автор: SELECONICS
Дата сообщения: 15.02.2006 23:14
unreal666
да он включен, а баннер все равно показывается.
да, еще и rambler.ru, что то с баннерами загружается, непонятно


Код: +++GET 22+++
GET / HTTP/1.0
User-Agent: Opera/9.00 (; U; ru)
Host: www.rambler.ru
Accept: text/html, application/xml;q=0.9, application/xhtml+xml, image/png, image/jpeg, image/gif, image/x-xbitmap, */*;q=0.1
Accept-Language: ru,en;q=0.9
Accept-Encoding: deflate, gzip, x-gzip, identity, *;q=0
Cookie: ruid=AQAAAF/VykM/TAEAAcL1FQB=
Cookie2: $Version=1
Connection: keep-alive
Accept-Charset: windows-1251, cp-1251
Referer: http://www.rambler.ru/

+++RESP 22+++
HTTP/1.0 200 OK
Server: nginx/0.3.27
Date: Wed, 15 Feb 2006 22:14:31 GMT
Content-Type: text/html; charset=windows-1251
Transfer-Encoding: chunked
Connection: keep-alive
Keep-Alive: timeout=50
Content-Encoding: gzip
+++CLOSE 22+++
Автор: unreal666
Дата сообщения: 16.02.2006 05:58
SELECONICS

Тогда опишу по порядку.
1. Должен быть включен фильтр Flash banner blaster [ALX]
2. В блок-файле AdKeys должна быть строчка (http(s|)://|)$LST(AdList)
3. В блок-файле AdList должна быть строчка (http(s|)://|)$LST(AdList-RE)
4. В блок-файле AdList-RE должна быть строчка
[^/]+\w[/.](ad(s|verts|log.pl)[0-9]+/|banner(s|)/|cookie.crumb|js_source|hitometer.js|index.cgi\?id=???).

И посмотри в режиме отладки, возможно на этом коде срабатывает какой-нибудь фильтр, у которого нет опции "Разрешить многократные совпадения".
Автор: SELECONICS
Дата сообщения: 16.02.2006 10:33
unreal666
ну или у меня руки растут не оттуда или я не знаю что....
все равно не работает.
Автор: GregoryPek
Дата сообщения: 16.02.2006 11:08
Чтобы не париться включи попробуй "Kill off-site resources {sites} [ALX]", я им пользуюсь постоянно, он весь офф-сайтный коннект режет.
Автор: Dante
Дата сообщения: 16.02.2006 17:01
У меня на nnm.ru слева флэшовый банер режется, а с правой - нет
И по центру вверху, под рубриками, здоровый банер висит. Как это всё убрать?


Цитата:
Чтобы не париться включи попробуй "Kill off-site resources {sites} [ALX]", я им пользуюсь постоянно, он весь офф-сайтный коннект режет.

Можно и так, конечно, но хотелось бы понять, почему специальные фильтры не срабатывают.

Страницы: 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162

Предыдущая тема: Режем баннеры без баннерорезалки


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.