Ru-Board.club
← Вернуться в раздел «Программы»

» WebSite-Watcher

Автор: MisterMyth
Дата сообщения: 08.05.2015 11:49
Сегодня буду добавлять огромное кол-во закладок "Бабочки" в программу. Причина: иногда есть ложные срабатывания и проверяет лишь 50 последних торрентов в куче, как результат чуть не пропустил нужный мне фильм.
Автор: vahhabit
Дата сообщения: 08.05.2015 15:14
MisterMyth

Цитата:
иногда есть ложные срабатывания и проверяет лишь 50 последних торрентов в куче

Что за ложные срабатывания? Я предполагаю из-за недостаточной конкретизации, например, у тебя было слово Фокус, оно сработает и на фильм и на фокусы :) Т.е. некоторые твои слова нужно дополнить, чтобы они срабатывали точно на то, что тебе нужно. Иных вариантов ложного срабатывания предположить не могу...
А по поводу 50 последних, я согласен - тебе либо надо ставить обновления каждую минуту, либо по рубрикам отдельно, так как за 5 минут могут все 50 торрентов замениться...
Автор: MisterMyth
Дата сообщения: 08.05.2015 16:26
vahhabit По поводу лжесрабатываний в самую точку. Самая проблема начинается тогда, когда после ночи включаешь ПК. Или когда комп выключишь на пару часов. Придется сесть и настроить закладки, либо плюнуть на это дело и посмотреть есть ли у бабочки специальная утилита проверки торрентов.
Автор: vahhabit
Дата сообщения: 08.05.2015 17:14
MisterMyth

Цитата:
Придется сесть и настроить закладки, либо плюнуть на это дело

Скорее плюнуть :) Я тут полазил и нашел один вариант 150 торрентов просматривать, но он жутко муторный и неудобно просматривать, так как километры прокручивать приходится :) Можешь проверить = ссылка. Импортировать так - скрин.

Обнаружил, что по рубрики отдельно просмотривать тоже печально, там сортировка по умолчанию по последнему комментарию стоит. А это значит, что если 100 летней давности софт или фильм или передачу прокомментят, она наверх поднимется и у тебя сработает маячок... Настроить по дефолту, чтобы по времени создания темы - не нашел настройку на NNM. Там под темами в самом низу - можно включить по времени создания, но перейдя в новую тему, все сбрасывается и снова становится по последнему комментарию. Печаль со всех сторон...
Автор: MisterMyth
Дата сообщения: 08.05.2015 19:45
vahhabit, а уходить на рутрекер не хочу. На Бабочке торренты появляются быстрее и они более мягкие по торрентам.
Автор: vahhabit
Дата сообщения: 08.05.2015 20:02
MisterMyth
Есть вариант, если не лень заморачиваться, зайди не на трекер, а на портал. https://nnm-club.me/
Далее там есть поиск по порталу. Берешь одно ключевое слово и вбиваешь, например CCleaner. Он выдает тебе результат, ссылка в браузере меняется в соответствии с введенным в поиск словом, можешь эту ссылку вбить в закладки. И так все слова, которые хочешь отслеживать Так ты раздробишь запросы и вероятнее отловишь изменения...К тому же можешь страницу перелистнуть, если выключал комп надолго и раздач наплодилось больше, чем на одну страницу...
Автор: SonatoX
Дата сообщения: 09.05.2015 08:17
И так.. )
Есть сайт
Следим привычным методом только за блоком с товарами: css(adds_cont clear) и хотелось бы игнорировать блоки со стикером "Премиум". Нюанс в том, что в отличии от предыдущего варианта, тут стикер графический, а не текстовый..
Какие будут идеи?
Автор: MrPerfect
Дата сообщения: 09.05.2015 09:13
SonatoX
Это невозможно. Но можно пытаться зайти с другой стороны. Там скорее всего сервак крепит по идентификатору объявления картинку премиум поверх изображения товара. Если в коде страницы можно будет найти концы, как это делается, то с помощью какого-нибудь удаляльщика рекламы, который может корректировать код страницы (например бесплатный AdMuncher + Internet Explorer не выше версии 10), можно настроить удалять со страницы все объявления с премиум-вхождениями, тогда этих объявлений вообще не будет существовать для WSW и визуально они не будут видны при просмотре во встроенном браузере. Здесь проблема только в установке и использовании дополнительной программы-баннерорезальщика с функцией редактирования кода страниц.
Автор: SonatoX
Дата сообщения: 09.05.2015 13:28

Цитата:
MrPerfect
Это невозможно. ... то с помощью какого-нибудь удаляльщика рекламы, который может корректировать код страницы ... можно настроить удалять со страницы все объявления с премиум-вхождениями

А WSW с кодом работать не умеет разве?
В коде вроде эти объявления можно идентифицировать. Там есть строки отвечающие за Premium.
Если я правильно понимаю, нужно как-то применить фильтр именно к коду..
Автор: MisterMyth
Дата сообщения: 09.05.2015 13:31
SonatoX
посмотрите парой страниц выше мне помогли настроить поиск серии симпсонов, может вам нечто похожее поможет.
Автор: vahhabit
Дата сообщения: 09.05.2015 13:58
SonatoX
Предварительно нужно снять галку - здесь.
Фильтр отслеживаемые - RegexToRegex(<div class="add_list add_type\d+([,\.]\d+)* " data\-position="\d+([,\.]\d+)*" data\-item\-id="\d+([,\.]\d+)*" > <div class="pic_wrap"> <a href="http:,\d+([,\.]\d+)*</p> </div>)

Увидел серьезный недостаток этого метода, по какой-то причине WSW визуально перечёркивает все объекты на странице, будто все они игнорируются, несмотря на то, что в фильтре явно показывает нужное количество отслеживаемых элементов. +к этому при изменениях - он не выделяет элементы, которые появились или изменились. Но как минимум он точно уведомляет, когда непремиум товар появляется.

Там, кстати, эти товары пачками по 150 штук выгружают в одну минуту, видимо автоматизированно...Целесообразно наверно конкретный товар отслеживать, а не все...

Добавлено:
Кстати пообновляй страницу по f5 в браузере, там фигня какая-то, вроде раздел телефоны, а по f5 частенько вылезают какие-то ботинки...
Автор: MrPerfect
Дата сообщения: 09.05.2015 16:09

Цитата:
А WSW с кодом работать не умеет разве?

Умеет. Но я хотел бы увидеть для вашего случая работоспособный во времени и пространстве фильтр (возможно, что и с баннерорезалкой я погорячился, представив это как рабочий вариант). Думаю, что там невозможно будет отделять перемежающиеся объявления. Да и очень скептичен вообще по отношению к задаче, где сотни и тысячи объявлений в день.
Автор: SonatoX
Дата сообщения: 09.05.2015 16:42
[more]
Цитата:
vahhabit
Фильтр отслеживаемые - RegexToRegex(<div class="add_list add_type\d+([,\.]\d+)* " data\-position="\d+([,\.]\d+)*" data\-item\-id="\d+([,\.]\d+)*" > <div class="pic_wrap"> <a href="http:,\d+([,\.]\d+)*</p> </div>)

Увидел серьезный недостаток этого метода, по какой-то причине WSW визуально перечёркивает все объекты на странице, будто все они игнорируются, несмотря на то, что в фильтре явно показывает нужное количество отслеживаемых элементов.

Ага.. как-то странно.


Цитата:
vahhabit
Кстати пообновляй страницу по f5 в браузере, там фигня какая-то, вроде раздел телефоны, а по f5 частенько вылезают какие-то ботинки...

Вроде бага такого не заметил.


Цитата:
vahhabit
Там, кстати, эти товары пачками по 150 штук выгружают в одну минуту, видимо автоматизированно...Целесообразно наверно конкретный товар отслеживать, а не все...


Цитата:
MrPerfect
очень скептичен вообще по отношению к задаче, где сотни и тысячи объявлений в день.

Ну да.. Данная страница лишь как пример. Так просто легче тестировать фильтр, потому что обновляется страница часто. Если будет придумано хорошее решение, конечно можно будет следить за любым разделом. [/more]

Добавлено:
блин.. может это можно решить через плагин.. В бэйсике кто-нибудь силён? )

Нужно что-то вроде:
Если
в коде найдено "add_premium"
То
игнорировать весь блок в котором находится этот "add_premium"
Конец Если

Автор: MisterMyth
Дата сообщения: 09.05.2015 19:28
Для торрентов программа не годится. Так и не смог настроить. Некоторые ссылки дублируются. И не все поисковые слова реально настроить.SonatoX
вы это писали для нового/измененного куска страницы?
Автор: vahhabit
Дата сообщения: 09.05.2015 21:19
MisterMyth

Цитата:
Для торрентов программа не годится.

У меня все отлично отслеживает...и на NNM и на рутор и на рутрекере...

SonatoX
То, что я написал выше, отслеживает отлично появление непремиум объявления, только не показывает что именно появилось нового визуально. Но я думаю при понимании что ищещь, быстро найдешь нужные обновленные товары. Есть вариант, убрать галку в разделе - подсветка только соотв.результатов из фильтра отслеженные. Таким образом будет показывать обновленные элементы, но при этом зацепит и неотслеживаемые изменения. Зато хоть как-то подсветит... Выглядит кстати более менее - скрин.
Автор: MisterMyth
Дата сообщения: 10.05.2015 10:53
vahhabit
У меня получается так, что необходимо очень хорошо все продумать: ссылки на некоторые разделы одинаковые. Например на Новинки игр и Зарубежные фильмы новинки. + Еще у меня режется ссылка в самой программе. Например вместо Microsoft office - Microsoft.
Автор: MrPerfect
Дата сообщения: 10.05.2015 15:40
SonatoX

Цитата:
может это можно решить через плагин

Там сложно составить рабочее регулярное выражение из-за множественной вложенности div-тэга в каждом объявлении, по-моему ничего не выйдет.
Автор: deltaone
Дата сообщения: 11.05.2015 10:34

Цитата:
SonatoX

Цитата:
может это можно решить через плагин

Там сложно составить рабочее регулярное выражение из-за множественной вложенности div-тэга в каждом объявлении, по-моему ничего не выйдет.


через XPath
https://github.com/deltaone/SCRAPPY
Автор: SonatoX
Дата сообщения: 11.05.2015 13:45

Цитата:
vahhabit
То, что я написал выше, отслеживает отлично появление непремиум объявления, только не показывает что именно появилось нового визуально.

ну в этом и суть.. нужно, что бы было видно визуально.


Цитата:
deltaone
через XPath

спасибо конечно, но честно говоря я ещё нуб даже в стандартных регулярках, не говоря про какие-то дополнения и связки с ними. )
Автор: Dimsokolov
Дата сообщения: 17.05.2015 10:58
aignes.com только у меня не работает?
Автор: vahhabit
Дата сообщения: 17.05.2015 11:01
Dimsokolov
у меня работает, но я через frigate его просмотрел, так как он у меня в hosts прописан. Если ты добавил его в hosts, тогда сайт только через анонимайзер можно просмотреть или через Frigate - расширение для мозиллы или хрома.
Автор: Dimsokolov
Дата сообщения: 17.05.2015 20:08
Я пробовал из хостов убирать на время, все равно не заходит
Автор: Engaged Clown
Дата сообщения: 17.05.2015 23:26
Dimsokolov
После этого нужно либо перезагружаться, либо делать ipconfig /flushdns.
Автор: Dimsokolov
Дата сообщения: 18.05.2015 00:56
А есть какой-нибудь автоматизированный метод для форумов переход на следующую страницу? Или надо каждый раз заново вручную инициализировать?
Автор: Dimsokolov
Дата сообщения: 21.05.2015 14:55
Гитхаб почему-то не инициализируется. Программа пшиет, нет такого файла. Вот к примеру это пробую

https://github.com/goldendict/goldendict/wiki/Early-Access-Builds-for-Windows
Автор: GCRaistlin
Дата сообщения: 21.05.2015 15:07
Dimsokolov
XP, небось? У меня тоже не инициализируется.
Автор: Dimsokolov
Дата сообщения: 21.05.2015 16:47
Да, она самая. И что, поэтому https не работает?
Автор: aybulat
Дата сообщения: 24.05.2015 16:44
Как убрать значок с глазом программы из браузера firefox, тот, что сайты в закладки добавляет?
Автор: MrPerfect
Дата сообщения: 24.05.2015 17:04
WebSite-Watcher > меню Опции > Конфигурация программы > вкладка Общие > подраздел Интеграция с браузером > Показывать кнопку (глаз)...
Автор: sis_terr
Дата сообщения: 07.06.2015 16:10
Подскажите где поправить. Сбилась одна закладка
Нажимаю кнопочку - новая версия, после проверки опять подсвечиваются старые изменения, ну и добавляются новые

Страницы: 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950

Предыдущая тема: как поставить пароль


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.