Ru-Board.club
← Вернуться в раздел «Тестирование»

» Браузерные войны: 2010 (Windows) [2]

Автор: LEX1
Дата сообщения: 19.05.2010 12:22
YuraH 03:07 19-05-2010
Цитата:
а физическое вырезание/изменение содержимого

А толку? Страница (GET /index.html) ведь всё равно полностью грузится, а потом из неё регулярками вырезаются куски текста.
Не путайте это с предотвращением загрузки картинок, флэша, фреймов и т.п, что естественно может и Adblock Plus.

ZlydenGL 11:25 19-05-2010
Цитата:
У регулярок есть проблемы со скоростью?!

Я бы не называл это проблемами, скорее плата за удобство и фичи. Зависит от реализации, но обычно они где-то на порядок медленнее простого сравнения.
Автор: YuraH
Дата сообщения: 19.05.2010 12:26
NONeTT
Цитата:
самый популярный плагин Анти-рекламы SiteListUpdater
Это не плагин антирекламы, а listupdater - импортирует подписки AdBlockPlus в список рекламных фильтров макса. Для ленивых.
Автор: ZlydenGL
Дата сообщения: 19.05.2010 12:38

Цитата:
обычно они где-то на порядок медленнее простого сравнения.

LEX1, а откуда цифирь? Сам наблюдал УВЕЛИЧЕНИЕ НАГРУЗКИ на CPU при переходе на регекспе, при очень круто завернутом правиле - как-то наблюдал даже в 2 раза больше увеличение, но на ПОРЯДОК? Да к тому же не нагрузки, а ВРЕМЕНИ?


Цитата:
Я про предпочтения пользователей говорил

NONeTT, т.е. фразой
Цитата:
Насколько помню , в Макс 1.хх - 2.ххх за образец именно Mозиловский был взят

Подразумевался сторонний плагин, а не встроенная система непосредственно банерорезки? Тогда все понятно Только ведь речь-то не про плагин, а про встроенную систему как таковую...
Автор: YuraH
Дата сообщения: 19.05.2010 12:40
LEX1
Цитата:
ведь всё равно полностью грузится
Но не полностью рендерится.
Цитата:
Не путайте это с предотвращением загрузки картинок, флэша, фреймов и т.п, что естественно может и Adblock Plus.
Как раз путают это ФФ-овцы и Хромовцы (эти в особенности), которые думают, что если спрятать рекламный блок, то реклама и скрипты с него перестанут грузиться. Я уже писал, что 'HidingHelper' предназначен только для текстовой рекламы и зачистки после обычной резалки, и не годится для блокирования ссылок. Текстовые фильтры макса же вырезают всё, что захочешь - для браузера этих частей уже не существует.
Автор: 0SHV
Дата сообщения: 19.05.2010 13:07
YuraH

Цитата:
текстовые фильтры макса же вырезают всё, что захочешь - для браузера этих частей уже не существует.

В IE7 pro это реализовано.

Автор: YuraH
Дата сообщения: 19.05.2010 13:30
0SHV
В IEPro реализована замена дивов на "display:none", так что это hider.
Автор: 0SHV
Дата сообщения: 19.05.2010 13:35
amr_now
Вы всеобщему любимцу предложите FF или IE6 использовать.
я же не даром писал, что у него с Оперной куклой проблемы в Ташкенте. )
Автор: OFFEND
Дата сообщения: 19.05.2010 14:32
YuraH
Цитата:
Как раз путают это ФФ-овцы и Хромовцы (эти в особенности), которые думают, что если спрятать рекламный блок, то реклама и скрипты с него перестанут грузиться.

Да я не думаю что кто то путает что то, подавляющему числу вообще начхать на тонкости эти. Грузить, или не грузить, это меньшее зло, речь то идёт о довесках в десятки- сотни Байт, пусть кБайт даже. Ну и что из того что блоки/фреймы окажутся на диске, это сущий пустяк по сравнению с необходимостью rendering'а/воспроизведения этого, не будь фильтров вовсе, а учитывая периодические проблемы с флешем у юзеров различных браузеров, так и display:none к месту даже, а в подписках не только сокрытие элементов, там разные фильтры применяются же, блокирование HTTP запросов например.

У меня вот другие вопросы, насчёт конфликтов AdblockPlus с тем же NoScript, по многим позициям они дублируют друг друга. И скандал ко всему в прошлом году, когда выяснилось, что NoScript умышленно фильтры спонсоров в Adblock отключал. Кое кто прав был всё же, выражая недоверие авторам подписок.
Автор: LEX1
Дата сообщения: 19.05.2010 14:46
YuraH 13:40 19-05-2010
Цитата:
что если спрятать рекламный блок, то реклама и скрипты с него перестанут грузиться

Если речь про картинки в диве, то да - будут и их придётся резать отдельным правилом. Но обычно подобные конструкции создаются скриптом и достаточно заблокировать только его загрузку.
А по сравнению с тем, что регекспами невозможно распарсить совсем произвольный html (хотя на практике с таким сложно столкнуться), это не выглядит серьёзной проблемой.

ZlydenGL 13:38 19-05-2010
Цитата:
а откуда цифирь?

Например отсюда.

Цитата:
Сам наблюдал

Речь про абсолютные цифры. Невооружённым глазом это может быть и незаметно
Автор: ZlydenGL
Дата сообщения: 19.05.2010 15:23
LEX1, не скажи, до сих пор реклама может погружаться во внешне безобидный див, запускаясь из не менее безобидного на вид скрипта (например, с именем jquery_addon.js), который к тому же может нести полезную нагрузку. Если ты вырежешь просто скрипт - имеешь шанс заполучить пустое невырезанное пространство на странице, где отобразилась БЫ реклама. С этой позиции проще грохнуть именно див - в этом случае реклама тоже не будет подгружена, даже при полной отработке скрипта (только браузер может "обидеться" сообщением о некорректной работе JS). Пример не надуман, а выдран из моего профиля баннерорезки для одного торрент-сайтика

Насчет цифири - ну да, тут 50\50 получилось, при 10 запросах по табличке разница во времени выполнения всего в два раза И потом, эта табличка сделана по интерпретатору php, который может из-за своих "косяков" (типа неструктурированных данных) regexp обрабатывать дольше, чем "чистый" regexp в MS-системах. В любом случае, даже при большом числе regexp запросов время на обработку будет исчезающе мало по сравнению со временем загрузки/рендеринга страницы, так что этим "провалом" можно пренебречь ИМХО

Добавлено:
Не говоря уже о том, что на деле один регексп может заменить десяток strpos, так что при грамотной реализации без разницы, что я буду прогонять список из 10 имен рекламных дивов через strpos (а ведь на выделение КАЖДОГО дива потребуется не меньше 3х strpos'ов - начало и конец открывающего и конец закрывающего тега) - очень часто имеет смысл применить один регексп вместо целой процедуры парсинга html кода.
Автор: speakerr
Дата сообщения: 19.05.2010 15:56
ZlydenGL

Цитата:
один регексп может заменить десяток strpos

но strpos на порядки быстрее работает. дело в ленивости программиста.
Автор: WatsonRus
Дата сообщения: 19.05.2010 15:59
0SHV
12:00 19-05-2010
Цитата:
Элитный унитаз с Оперой.

К слву о баннерорезках - унитаз не хочет отображаться ни в одном браузере - в адресе присутствует *ad*, и баннерорезки работают на ура...
Автор: speakerr
Дата сообщения: 19.05.2010 16:09
3xp0
respect. ты достойно выдержал и победил флейм.

ps. а народ соскучился за просто конструктивный разговор.
Автор: ZlydenGL
Дата сообщения: 19.05.2010 16:20

Цитата:
но strpos на порядки быстрее работает. дело в ленивости программиста.

Это все равно, что говорить, что обычный микроскоп на порядки быстрее работает, а медики, которые используют сложную аппаратуру, просто обленились вконец Вспомни про число итераций! Сам div блок ты выделишь только при помощи МИНИМУМ трех strpos, если ты смотришь список из 10 рекламых наименований дивов - это уже ТРИНАДЦАТЬ итераций вычисления. А регекспом ты эти 13 вычислений выполнишь за ОДИН проход, потратив на это те же 0.2 миллисекунды из вышепроцитированной таблицы ИМХО, замена более чем равноценная - ибо при двухкратном усложении регексп запроса требуется как минимум в ЧЕТЫРЕ раза усложнять парсер на базе strpos.

Добавлено:

Цитата:
3xp0
respect. ты достойно выдержал и победил флейм.

Кстати, присоединяюсь. Молодец, выдержка не просто на высоте, а на высоте недосягаемой просто
Автор: YuraH
Дата сообщения: 19.05.2010 16:36
LEX1 <<
Цитата:
Если речь про картинки в диве
Скрипты в них тоже выполняются.
Цитата:
Но обычно подобные конструкции создаются скриптом
Это уже следствие. Поэтому как раз и режутся блоки со скриптами. Но разговор не только о дивах. Текстовые фильтры потому и текстовые, что не привязаны к дереву. К чему прицепить фильтр - решаешь ты сам, хоть с середины какого-то слова. Хотя до возможностей Проксомитрона всё-таки не дотягивает.
Цитата:
что регекспами невозможно распарсить совсем произвольный html
И не нужно. Обычно фильтры пишутся под определённый ресурс, на котором часто бываешь. Хотя и общие есть. Да и если уже говорим о сложных случаях, то фильтр с тупо заменой <div id="ad"> на <div style="display:none"> никто не запрещал Но проку с этого минимум.

OFFEND <<
Цитата:
подавляющему числу вообще начхать на тонкости эти.
В общем-то да. Сколько уже перевидал ФФ без ABP и NoScript, и Опер с пустым urlfile, без флешблока и блокировки внешних ссылок. Им и IE "выше крыши", даже без IEPro.
Автор: LEX1
Дата сообщения: 19.05.2010 16:43
ZlydenGL 16:23 19-05-2010
Цитата:
С этой позиции проще грохнуть именно див

Ну так его и в ABP можно скрыть. И заблокировать, то что там грузится. Да потребуется два-три фильтра, но это нечастый случай.


Цитата:
чем "чистый" regexp в MS-системах

Относительная разница в компилируемых языках должна быть больше, потому что предварительный разбор регулярки достаточно сложен.


Цитата:
так что этим "провалом" можно пренебречь

Для страниц - да, но я писал про обработку адресов А тут и в макстоне используется ровно одна регулярка среднего размера.
Автор: amr_now
Дата сообщения: 19.05.2010 16:45
YuraH
Цитата:
ФФ без ABP и NoScript, и Опер с пустым urlfile, без флешблока и блокировки внешних ссылок.
Конфигурация установленных у меня браузеров
Помню, до появления безлимитки бензопила "Дружба" была любимым моим инструментом )))
Автор: speakerr
Дата сообщения: 19.05.2010 16:48
ZlydenGL
если ты не заметил, то повторюсь. речь идет о ПОРЯДКАХ в скорости. а ты говоришь о десятках. а с твоими доводами я согласен. это я и имел в виду под словом лень.

и разговор не о здравом смысле. я, наверное, про программирование как искусство.

Добавлено:
ZlydenGL

Цитата:
Молодец, выдержка не просто на высоте, а на высоте недосягаемой просто

угу.
Автор: ZlydenGL
Дата сообщения: 19.05.2010 16:57

Цитата:
Ну так его и в ABP можно скрыть.

Ну скроешь ты его, приписав style="display:hidden". А смысл, если отработавший скрипт туда все равно подгрузит рекламу, изображения, другие скрипты? Тут ИМХО надо именно вырезать этот див из кода страницы, только в этом случае ты не получишь лишний трафик на свою голову.

Вот скажи, что ты сможешь противопоставить фильтру вида

Код: <(div|td[^>]*?top.*?реклама.*?/(td|div)>
Автор: WatsonRus
Дата сообщения: 19.05.2010 17:43
ZlydenGL
17:57 19-05-2010
Цитата:
не лишая себя графической составляющей

amr_now
17:45 19-05-2010
Цитата:
Помню, до появления безлимитки бензопила "Дружба" была любимым моим инструментом

Баннеры они ИМХО разные бывают. Вот даже здесь на РуБорде - верхние меня не раздражают, и я их не вырезаю (хотя и не вижу - включен показ картинок "только из кэша") - без места под верхние баннеры страницы выглядят каким-то урезанными. А вот появившийся не столь давно длинный баннер после постов над формой ответа отвлекал даже не будучи отображаемым - его пришлось зарезать... а самый нижний баннер Аутпост режет без моего участия (хотя он в принципе мне не мешал - ибо тоже не отображался ).
Автор: LEX1
Дата сообщения: 19.05.2010 17:46
ZlydenGL 17:57 19-05-2010
Цитата:
туда все равно подгрузит рекламу

Которая с известной вероятностью будет заблокирована глобальными фильтрами, т.к. сайтов с рекламой не бесконечно много. Если нет, то придётся добавлять эти изображения и скрипты в блокер, делов то.


Цитата:
надо именно вырезать этот див из кода страницы

И кстати, что будет если в логике страницы используется «document.getElementsByTagName('div')[99]»?
Конечно, этот пример столь же теоретический, но то что принцип работы даёт ABP заметно лучшую совместимость (при изменениях на странице, в частности) должно быть понятно.


Цитата:
Вот скажи, что ты сможешь противопоставить фильтру вида

Страницу с «<div onclick="return a>b">» А в вышеприведённом регэкспе не хватает скобки

В свою очередь, а что вы сможете противопоставить фильтру «*$script,third-party», режущему левые скрипты?

Добавлено:
YuraH
Я собственно и не спорю, с тем что регэкспы дают некоторые уникальные возможности.
Но работа с готовым DOM надёжней и позволяет легко автоматизировать генерацию правил.

Добавлено:
А раз работает надёжно, то можно и глобальные правила использовать. См. в том же ru adlist фильтры вида «#advert» и по размеру баннера.

Ну а автогенерация правил по клику позволяет не ждать "у моря погоды", а почистить рекламу самому. Как это легко сделать в макстоне, к примеру на overclockers.ru , я лично не очень понял.
Автор: YuraH
Дата сообщения: 19.05.2010 18:55
LEX1
Да тут не столько в регэкспах дело, сколько в подходе к фильтрации. ABP Hiding (ну и вышеупомянутый IEPro) чистят за обычной резалкой. Работают с деревом, просто заменяя стиль блока на display:none. Видимо к плагу код страницы поступает уже после отображения браузером (отсюда эти "схлопывания" у хрома). У макса же наоборот - к блокировке ссылок дойдут только те части, которые остались после фильтров, потому что других не осталось. Плюс максовскому побоку на дом, он с текстом работает. Хотя обычную замену тоже можно сделать (вверху уже приводил).
Хотя в плане удобства выделения блоков ABP лучше. Но только если нужно за блок зацепиться.
Автор: MerSerVlad
Дата сообщения: 19.05.2010 19:45
Google, Mozilla и Opera представляют открытый кодек на основе VP8

http://habrahabr.ru/blogs/video/93999/
http://techcrunch.com/2010/05/19/webm-google-h-264/
http://labs.opera.com/news/2010/05/19/
http://habrahabr.ru/blogs/webdev/94002/
http://www.webmproject.org/


Добавлено:
Там же на конференции только что Адобовцы сказали, что флэш будет поддерживать VP8.
Автор: 0SHV
Дата сообщения: 19.05.2010 20:11
WatsonRus

Цитата:
унитаз не хочет отображаться ни в одном браузере

у вас браузеры не верные. )
Значит вам не судьба такой штукой пользоваться.

MerSerVlad

Цитата:
Google, Mozilla и Opera представляют открытый кодек на основе VP8

Особенно умиляет присутствие здесь проприетарной Оперы.

Так, может быть, вы, святой отец и партийный ? (с)

Гугл выигрывает лучше всех. Он единственный универсал на рынке.

Автор: ZlydenGL
Дата сообщения: 19.05.2010 20:19

Цитата:
Которая с известной вероятностью будет заблокирована глобальными фильтрами, т.к. сайтов с рекламой не бесконечно много

Ага, т.е. вместо одного регекспа будем гнать 4к+ strpos'ов? По мне так проще один раз грохнуть приемник, чем потом гоняться и отсеивать рекламные площадки. Кстати, именно поэтому SitelistUpdater у меня не прижился - толку от него оказалось ну совсем чуть.


Цитата:
что будет если в логике страницы используется «document.getElementsByTagName('div')[99]»?

Хм, вот сколько не режу рекламу - НИГДЕ еще не видел обращение к диву по его номеру Есть "боевые" примеры? Впрочем, даже если найду сам - никто не помешает мне тем же регекспом уменьшить это значение на единицу при необходимости


Цитата:
в вышеприведённом регэкспе не хватает скобки

Есть такое... Работа сказывается


Цитата:
а что вы сможете противопоставить фильтру «*$script,third-party», режущему левые скрипты?

А вот здесь сложнее - возьмите тот же ифолдер. Он грузит КУЧУ служебных скриптов с агавы! Без них просто не запустится авторизация. Оное надо? И ифолдер в этом далеко не одинок - просто его фильтр недавно правил, поэтому и привел как живой пример. Но вообще, если потребуется - отсеку все "левые" скрипты с той же легкостью


Цитата:
Ну а автогенерация правил по клику позволяет не ждать "у моря погоды", а почистить рекламу самому. Как это легко сделать в макстоне, к примеру на overclockers.ru , я лично не очень понял.

Да, в этом смысле стандартный мастер, даже вкупе с removeit, далеко не всегда спасает. Надеюсь, что в трешке его накрутят посильнее, чтобы регексп скрипты можно было на автомате генерить


Цитата:
Баннеры они ИМХО разные бывают. Вот даже здесь на РуБорде - верхние меня не раздражают

WatsonRus, не спорю, если сижу на витухе А если GPRS в роуминге? Там уж предпочту даже килобайт лишний не грузить, помимо полезной информации
Автор: 0SHV
Дата сообщения: 19.05.2010 20:34
не долго музыка играла >> Ссылка

h.264 vs vp8
Автор: NAATH
Дата сообщения: 19.05.2010 20:57
0SHV 21:34 19-05-2010
Цитата:
не долго музыка играла

Вота Вам:
Opera(v10.54.3390) - 3970 Points - с плугинами, скриптами и фсьем прочим добром
http://service.futuremark.com/peacekeeper/results.action?key=3Ytf
Chrome(v6.0.400.0) - 4178 Points - без плугинов
http://service.futuremark.com/peacekeeper/results.action?key=3V5x
Chrome(v6.0.401.1) - 4036 Points - без плугинов
http://service.futuremark.com/peacekeeper/results.action?key=3Yu3
Firefox 3.7а4 - 2207 - без плугинов
http://service.futuremark.com/peacekeeper/results.action?key=3Lty
- - -
Хром - даже без плугинов - на убыль пошел, еще один билдь и Опера даже с плугинами его обгонит, бо Опера - фсьё прибавляет и прибавляет, и это радует.
Для тех хто не в танке, Хром с плугинами - это без слез не взглянешь - больше 3500 не набирает.
Автор: LEX1
Дата сообщения: 19.05.2010 21:06
ZlydenGL 21:19 19-05-2010
Цитата:
Ага, т.е. вместо одного регекспа будем гнать 4к+ strpos'ов?

А куда деваться? Если мы хотим, чтобы реклама резалась везде, тогда следует проверять адреса всех картинок, флэшек, скриптов.
В ABP, впрочем, сделано несколько хитрее простой проверки.


Цитата:
Есть "боевые" примеры?

«пример теоретический», т.к. макстоном особо не пользуюсь и данной проблемой не интересовался.


Цитата:
никто не помешает мне тем же регекспом уменьшить это значение

Автоматизировать это дело будет сильно не тривиально


Цитата:
Оное надо?

На вебдванольных сайтах оно не надо, а вот на всех остальных, так грузят только рекламу и счётчики.
Так что, с возможностью отключения для сайта, а-ля Noscript оно было бы вполне практично и универсально.

YuraH 19:55 19-05-2010
Цитата:
Да тут не столько в регэкспах дело

Да, конечно. Я и имел в виду подход с предварительной обработкой vs DOM/css методы.

Цитата:
Видимо к плагу код страницы поступает

ABP Hiding просто применяет к странице стиль сгенерированный из правил.
Автор: WatsonRus
Дата сообщения: 19.05.2010 21:07
ZlydenGL

Цитата:
WatsonRus, не спорю, если сижу на витухе А если GPRS в роуминге? Там уж предпочту даже килобайт лишний не грузить, помимо полезной информации

Так у меня они тоже не грузятся - Опера берет картинки только из кэша, а баннерного хлама в кэше нет. Видны только места от верхних баннеров, потому что без них страницы РуБорда кажутся какими-то неестественными.
Автор: x25
Дата сообщения: 19.05.2010 21:15
Google Wave теперь открыт для всех
http://googlewave.blogspot.com/2010/05/google-wave-available-for-everyone.html
У оперы как обычно проблемы:
http://habrahabr.ru/blogs/wave/94003/

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869

Предыдущая тема: Получение бесплатных лицензий к KIS, KAV [2]


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.