Будущее адблокинга: незаметное распознавание рекламы компьютерным зрением
Команда исследователей из Стэнфорда и Принстона заявила о разработке принципиально новой концепции блокировки рекламы в интернете. Ключевые отличия от современных популярных сервисов — это скрытая работа и распознавание рекламы с помощью компьютерного зрения.
Задача инноваций — поставить точку в гонке вооружений между блокировщиками рекламы и технологиями обхода блокировщиков, которые используют сайты.
Для этого предлагается во-первых скрыть от сайта тот факт, что у пользователя стоит блокировщик. Способ заимствован у вредоносных программ, которые с его помощью прячутся от антивирусов. Он состоит в том, чтобы собрать все запросы к API браузера, которые может делать сайт, чтобы определить состояние отображения страницы на пользовательском устройстве, и подделать ответы на эти запросы так, чтобы сайт "думал", что отображается правильно. Другая технология подразумевает создание двух копий веб-страницы: с одной будет взаимодействовать код сайта и показывать на ней рекламу, а другую будет видеть пользователь, и рекламы на ней не окажется.
Что касается распознавания рекламы — традиционные блокировщики находят её в коде страницы по ключевым словам и формулировкам, которые постоянно меняются, заставляя разработчиков регулярно создавать новые фильтры. Авторы концепции "блокировщика будущего" предлагают использовать компьютерное зрение для симуляции того, как человек визуально распознаёт рекламу, видя пометки "спонсорский пост", кнопки "скрыть рекламу" и другие подобные надписи и элементы.
Залогом успеха этой стратегии исследователи считают тот факт, что законодательство обязует площадки маркировать рекламный контент. Распознаваться должны будут не только надписи, но и картинки. Кроме того, блокировщик сможет эмулировать действия пользователя — клик или наведение мыши, после которого, например, и появляется кнопка "скрыть рекламу".
Исследователи создали расширение для Chrome — демонстрационный прототип, реализующий концепцию частично, за исключением технологии скрытия блокировщика с помощью дублей веб-страниц. Расширение было протестировано на 50 сайтах, использующих антиблокировочные технологии, и рекламу на них распознало.
Сооснователь и CTO Adguard Андрей Мешков отмечает, что пока это расширение просто иллюстрирует идею, а не воплощает её полноценно. Сейчас оно распознаёт маркеры рекламных систем, которыми помечены объявления. Например, треугольный значок сервиса AdChoices, позволяющего пользователю настроить рекламные таргетинги в соответствии со своими предпочтениями и видеть более релевантные объявления, которые и маркируются этим треугольником.
Площадки и рекламные сервисы смогут легко обойти такое распознавание. Чтобы концепция работала полноценно, понадобится обучить нейронную сеть распознавать рекламный контент целиком, в единстве всех его элементов, как видит рекламу живой пользователь. Поначалу у такой технологии будет много ложноположительных (и отрицательных) срабатываний. Скорее всего, понадобятся отдельные нейросети для распознавания рекламы в разных языковых сегментах интернета, так как собственно разницей языков различия в рекламе не ограничиваются — на том, как она выглядит, сказывается менталитет, культурные особенности, региональная специфика дизайна и юзабилити сайтов. Иными словами, обучение нейронных сетей и борьба с эффектами недо- и переобучения потребуют ручного труда сообщества и профессионалов, так же, как требует его сейчас создание фильтров (и, возможно, это будет более трудозатратно).
Блокировщики рекламы несомненно придут к "визуальному" распознаванию контента на странице и определению рекламы с помощью компьютерного зрения, но до появления пользовательских продуктов на основе таких технологий пройдут годы. И это будет не окончательное решение и точка в гонке вооружений, а ещё одна дополнительная стратегия идентификации и блокировки рекламного контента. Более того, окончательной победы над рекламой и её внедрение, скорее всего, не обещает.