L'évolution des annonces sur le Web ces dernières 17 années
Il y a quelques jours, AdGuard a fêté son 17e anniversaire. Est-ce que 17 ans, c’est long pour un bloqueur de publicités ? Comment répondre à cette question ? Tout devient plus clair lorsqu’on replace les choses dans leur contexte ; alors pourquoi ne pas examiner les menaces auxquelles AdGuard a dû faire face au cours de ces dix-sept années ? Voici un retour sur l’évolution des menaces sur le Web depuis 2009 jusqu’à aujourd’hui — c’est parti.

Avant 2009: la nuit des temps publicitaires
🦕 Un aperçu de l'époque
- La menace principale : les bannières, les fenêtres contextuelles, des serveurs publicitaires simples
- La réaction des bloqueurs : les fichiers hosts, blocage précoce des URL, bloqueurs de fenêtres contextuelles, masquage esthétique
- À noter également : des publicités frauduleuses, faux boutons de téléchargement, barres d'outils de navigateur, premiers logiciels publicitaires
AdGuard a vu le jour en 2009 et a été conçu — oui, vous l’avez deviné — pour bloquer les publicités. Plus précisément, il a été conçu pour bloquer les publicités qui existaient en 2009. À cette époque, Internet avait déjà dépassé ses premières étapes des années 90, mais par rapport à ce qu’il est aujourd’hui, le Web était encore très différent. Et les publicités l’étaient tout autant.
Si vous étiez là à l’époque, vous nous comprenez : c’était l’ère des publicités « honnêtes », du moins selon les normes actuelles. Vous tapiez une URL dans la barre d’adresse de votre navigateur, vous appuyiez sur Entrée, et le site web se chargeait. Sur ces sites, il pouvait y avoir des bannières publicitaires pour tel ou tel produit ; si vous cliquiez dessus, elles vous redirigeaient vers le site annoncé, et c’était tout. On voyait exactement ce qu’on obtenait, avec parfois une publicité frauduleuse ici ou là, mais probablement pas sur les grands sites populaires.

Le site web de Cartoon Network dans les années 2000
Visuellement, ces bannières pouvaient prendre toutes sortes de formes, du simple affichage d'images statiques et de boutons « Télécharger » aux GIF animés et aux fenêtres contextuelles. Les publicités de cette époque étaient très variées, mais elles n'avaient rien de subtil ni de sophistiqué. À leur image, les bloqueurs de publicités de l'époque étaient eux aussi assez simples. En 2009, les fichiers « hosts » restaient encore un moyen populaire de lutter contre les publicités. HOSTS.TXT est essentiellement un fichier en texte brut qui associe des noms de domaine à des adresses IP, et qui passe outre les informations fournies par le serveur DNS. Cette méthode était populaire car elle fonctionnait bien : il suffisait de répertorier tous les « mauvais » domaines associés aux publicités et de les rediriger vers un « trou noir » 0.0.0.0 pour bloquer avec succès la grande majorité des bannières publicitaires.
Les bloqueurs de publicités de l’époque n’étaient pas trop différents à cet égard. Ils étaient bien sûr plus puissants que les fichiers hosts, car ils pouvaient effectuer des opérations plus avancées, comme un filtrage esthétique ou la distinction du contexte d’une page, mais la différence pratique n’était pas très perceptible pour un utilisateur lambda.
Et voici à quoi ressemblait le paysage publicitaire au moment où la première version d’AdGuard a vu le jour. Le blocage des publicités gagnait du terrain, mais restait une pratique très marginale réservée aux « initiés ». Andrey Meshkov, l’un des fondateurs d’AdGuard, l’a entièrement développé lui-même, et c’est ainsi que notre histoire a commencé.

Une capture d’écran de l’une des plus anciennes versions d’AdGuard
2009–2011 : La « Flashpocalypse »
⚡Un aperçu de l'époque
- La menace principale : les cookies Flash et le suivi via des plug-ins
- Pourquoi c'était nouveau : le suivi pouvait subsister après la suppression des cookies du navigateur et se dissimuler derrière du contenu Flash
- La réaction des bloqueurs : le blocage de Flash, des contrôles de type NoScript/Flashblock, des filtres anti-suivi
- À noter également : la publicité comportementale, les débuts du RTB, les failles de sécurité des plug-ins, la publicité malveillante via Flash
Tout le monde ne se souvient peut-être plus de Flash aujourd’hui, mais il s’agissait autrefois d’une plateforme logicielle multimédia extrêmement populaire, utilisée pour créer des animations, des applications web, des jeux sur navigateur et bien d’autres choses encore. Cela ne veut pas dire pour autant que Flash n’existait pas avant 2009, car à cette époque, Flash était déjà relativement ancien, puisqu’il existait depuis bien plus d’une décennie. Il avait été largement utilisé pour créer des publicités animées, mais l’année 2009 a marqué un tournant important. En ce qui concerne son rôle dans l’écosystème publicitaire, c’est à cette époque que Flash a commencé à passer du statut de « outil servant à afficher des bannières et des pop-ups agaçantes » à celui d’« outil utilisé pour créer une infrastructure de suivi et exécuter du code tiers lourd ».

Un message « Flash Player requis »
Flash disposait d’une fonctionnalité appelée Local Shared Objects, plus communément appelée cookies Flash. Ce nom n’est pas une coïncidence : leur fonctionnement était très similaire à celui des cookies classiques. Ils pouvaient être utilisés pour stocker les préférences des utilisateurs, enregistrer des données issues de jeux Flash, voire suivre l’activité des utilisateurs sur Internet. Contrairement aux cookies, ils pouvaient stocker beaucoup plus de données, jusqu’à 100 ko, et ne pouvaient pas être effacés simplement en supprimant l’historique du navigateur. En 2009, un groupe de chercheurs de Berkeley a découvert que plus de la moitié des 100 sites web les plus visités utilisaient des cookies Flash, qui pouvaient parfois même restaurer les cookies HTTP supprimés.
Au départ, le blocage des annonces publicitaires visait surtout à lutter contre l’encombrement visuel : faire disparaître cette énorme bannière, bloquer cette fenêtre contextuelle agaçante. Mais c’est à cette époque que la menace a commencé à devenir invisible, en grande partie à cause de Flash et de son système de suivi difficile à supprimer. Bloquer les éléments graphiques visibles ne suffisait pas à mettre fin à la couche de suivi sous-jacente. Le problème était suffisamment grave pour que des outils spécialisés comme NoScript et Flashblock deviennent particulièrement utiles : ils remplaçaient le contenu Flash par des espaces réservés et exigeaient un clic pour l’exécuter.
Les bloqueurs de publicités ont eux aussi commencé à s’adapter, avec des règles de filtrage visant à bloquer les scripts de suivi et des fonctionnalités spécialement conçues pour bloquer ou restreindre Flash. Quant à AdGuard, dès ses tout débuts, nous développions nos propres filtres, et la lutte contre le suivi en général (et le suivi Flash en particulier) en faisait partie. Un peu plus tard, nous avons ajouté une option dédiée permettant de bloquer Flash dans son intégralité, que vous pouvez toujours trouver dans les Paramètres avancés d’AdGuard pour Windows.

“Bloquer Flash” dans AdGuard
Flash n’était bien sûr pas la seule nouveauté de l’époque. La publicité comportementale et les enchères en temps réel existaient déjà, par exemple, mais nous aurons l’occasion d’en parler plus en détail dans les chapitres suivants. D’une manière générale, cette période s’est caractérisée par le rôle croissant du suivi par rapport à la publicité pure, et cette distinction allait devenir de plus en plus évidente par la suite.
2011–2013 : Le suivi sur les réseaux sociaux et le reciblage
🎯 Un aperçu de l'époque
- La menace principale : le reciblage et les widgets sociaux
- Pourquoi c'était nouveau : le suivi est devenu visible pour les utilisateurs : les annonces les suivaient partout, et les boutons des réseaux sociaux sont devenus des balises
- La réaction des bloqueurs : des filtres de protection contre le suivi, le blocage des widgets sociaux, des extensions spécialisées dans la protection de la vie privée
- À noter également : « Do Not Track », des débats sur les cookies tiers, des balises d'analyse, des outils de visualisation précoce des traceurs
Parmi les exemples les plus frappants de l’essor du suivi à cette époque, on peut citer le suivi par les widgets sociaux et, surtout, le reciblage. Le concept de reciblage publicitaire est désormais familier à tout le monde, même si le terme lui-même ne l’est pas forcément : vous naviguez sur le Web et tombez sur une brosse à dents électrique. Vous envisagez peut-être même de l’acheter et visitez le site du vendeur, mais vous décidez finalement de ne pas le faire. Or, le processus est déjà enclenché : désormais, où que vous alliez, cette brosse à dents vous suit partout, sur les sites d’actualités, les blogs, voire sur Facebook — et cela peut durer plusieurs jours. C’est à ce moment-là que le suivi, jusque-là invisible, est devenu perceptible pour les utilisateurs lambda, suscitant un sentiment étrange et inquiétant.
Le reciblage s’est avéré extrêmement efficace, et les bloqueurs de publicités ont donc dû réagir rapidement. Ce qu’ils ont fait : les anciens filtres ont été modifiés pour prendre en compte les traceurs, et de nouveaux filtres ont vu le jour, spécialement conçus pour bloquer le suivi. AdGuard a également créé à cette époque un nouveau filtre distinct pour les logiciels espions et les traceurs — il a évolué pour devenir le filtre de protection contre le suivi que nous maintenons encore aujourd’hui. En réponse aux exigences de l’époque, cette période a également vu apparaître des outils qui n’étaient pas du tout des bloqueurs de publicités classiques, mais qui se concentraient exclusivement sur la détection et le contrôle des balises JavaScript, des traceurs, du suivi par cookies, etc.
Un autre fléau de cette époque était un autre type de suivi : celui des widgets sociaux. Les boutons « J’aime » et « Partager », des barres de partage flottantes, des compteurs, etc. : ils étaient partout et vous suivaient sans cesse. Ces widgets n’étaient pas de simples boutons. Il s’agissait d’éléments intégrés par des tiers qui pouvaient indiquer à Facebook, Twitter, Google et d’autres quelles pages un utilisateur consultait, souvent indépendamment du fait que celui-ci ait cliqué ou non sur le widget.

Une multitude de widgets Facebook datant de 2012
Quant à la réponse apportée par les bloqueurs de publicités, il suffisait de bloquer le suivi derrière ces widgets, comme n’importe quel autre traceur, en utilisant des règles de filtrage anti-suivi et des listes de filtrage. Mais pour de nombreux utilisateurs, les widgets eux-mêmes sont devenus si agaçants que certains ont choisi de les anéantir. Pour ces personnes, AdGuard proposait le filtre Réseaux sociaux qui supprimait les intégrations des réseaux sociaux, et qui est d’ailleurs toujours disponible aujourd’hui.
2013–2016 : Le Web programmatique
🖥️ Un apercu de l'époque
- La menace principale : RTB et la publicité programmatique
- Pourquoi c'était nouveu : les impressions publicitaires sont devenues des enchères en temps réel alimentées par les profils des utilisateurs
- La réaction des bloqueurs : une syntaxe de filtrage plus avancée, des listes anti-suivi, le mode furtif / module de protection contre le suivi (propre à AdGuard)
- À noter également : Header bidding, Facebook Pixel, Universal Analytics, synchronisation des cookies, identifiants publicitaires mobiles, publicités malveillantes
À cette époque, la publicité sur Internet a commencé à s’éloigner progressivement du placement manuel d’annonces sur les pages web au profit d’un système d’enchères où l’espace publicitaire était attribué au plus offrant pour afficher l’annonce « parfaite », adaptée à chaque utilisateur. Le profilage des utilisateurs est devenu essentiel et le Real-Time Bidding (RTB), bien qu’il fût apparu bien plus tôt, s’est rapidement développé et est devenu le facteur déterminant du paysage de l’adtech de l’époque. Il reste aujourd’hui très pertinent, avec une valeur de marché totale estimée à 16,3 milliards de dollars en 2024 et qui devrait atteindre 39,6 milliards de dollars d’ici 2030. Alors, qu’est-ce que le RTB exactement et comment fonctionne-t-il ?
Le RTB est une méthode d’achat et de vente d’espaces publicitaires en temps réel à l’annonceur ayant soumis l’enchère la plus élevée. Imaginez que vous visitiez un site web et que le propriétaire du site (l’éditeur) dispose d’un espace publicitaire sur ce site qu’il souhaite vendre ; il lance donc une enchère. L’éditeur contacte l’Ad Exchange — la plateforme où se déroule l’enchère — et lui transmet votre profil. Ce profil peut inclure l’identifiant de votre appareil, des informations sur ses paramètres, sa localisation, des données telles que votre tranche d’âge, vos centres d’intérêt potentiels… Tout est bon à prendre ; plus il y en a, mieux c’est. L’Ad Exchange propose ensuite ces informations aux annonceurs, qui enchérissent sur le montant qu’ils sont prêts à payer pour vous présenter leur publicité. Le plus offrant remporte l’enchère, et c’est cette publicité que vous voyez sur le site web — le plus souvent, elle est très pertinente et ciblée spécifiquement sur vous.

Comment fonctionnent les enchères en temps réel. Crédit image : Adjust
En réalité, c’est un peu plus compliqué que cela : par exemple, les éditeurs et les annonceurs ont chacun leurs propres « représentants », appelés Supply Side Platforms (SSP) et Demand Side Platforms (DSP), qui ajoutent une toute nouvelle dimension à ce système. Mais malgré sa complexité, l’ensemble de ce processus est hautement automatisé et ne prend que quelques fractions de seconde du début à la fin. Et ces enchères ont lieu en permanence. Rien qu’en Europe et aux États-Unis, 178 billions d’enchères ont lieu chaque année.
Le RTB ne fonctionne pas en mode isolé : il se nourrit de l’infrastructure plus large de suivi d’identité qui l’entoure, et la renforce à son tour. L’un des aspects les plus inquiétants de tout cela est la facilité avec laquelle on peut obtenir des informations sur n’importe qui. Notez que dans toute enchère RTB, pour que les annonceurs puissent déterminer le montant de leur enchère, la plateforme publicitaire leur transmet toutes les informations vous concernant qu’elle a reçues de l’éditeur. Si vous êtes annonceur, vous pouvez recevoir des données précieuses même si vous ne remportez jamais l’enchère. En 2017, des chercheurs de l’université de Washington ont mené une expérience dans laquelle ils ont pu suivre les déplacements d’une personne spécifique en participant à des enchères RTB — il leur a suffi de dépenser environ 1 000 dollars.
Le RTB est allé de pair avec le développement de l’analyse de données, des pixels de suivi et des infrastructures d’identification. Plus un système publicitaire était capable d’en déduire sur un visiteur — ses centres d’intérêt, son appareil, sa localisation, son historique de navigation ou son potentiel de conversion — plus l’impression pouvait être évaluée et faire l’objet d’une enchère précise. Cette période a été marquée par une mesure intensive sur plusieurs appareils et canaux : Universal Analytics, la nouvelle version de Google Analytics à l’époque, a poussé ce modèle encore plus loin vers une approche « multi-écrans, multi-appareils », tandis que le pixel de suivi de Facebook, lancé en 2015, a transformé les sites web classiques en sources de données de conversion, de constitution d’audience et de reciblage. Dans l’ensemble, c’est à cette période que le paysage actuel de l’adtech a commencé à prendre forme — et, à bien des égards, il suit toujours la même logique.
Malheureusement, il n’est pas facile d’illustrer comment les bloqueurs de publicités en général, et AdGuard en particulier, ont réagi à ces nouveaux défis. Tout comme la menace elle-même était invisible pour l’utilisateur, la réponse l’était également. Les avancées en matière de syntaxe de blocage des publicités, les nouvelles règles de filtrage, les nouveaux filtres anti-suivi… À moins d’être un utilisateur invétéré de bloqueurs de publicités fréquentant les forums spécialisés, on ne savait pas grand-chose, voire rien du tout, de la lutte incessante qui se déroulait en coulisses.

Module « Mode furtif » dans l’une des anciennes versions d’AdGuard
L'ajout du module Mode furtif début 2016 a marqué une avancée majeure pour AdGuard : auparavant, le filtre de protection contre le suivi était la seule ligne de défense contre le suivi. Le Mode furtif a été conçu pour protéger la vie privée des utilisateurs de diverses manières, notamment en bloquant les cookies tiers, en empêchant les fuites WebRTC, et bien d’autres encore. Il est désormais simplement connu sous le nom de module Protection contre le suivi et s’est enrichi de dizaines de nouvelles fonctionnalités au cours de la dernière décennie, dont certaines seront abordées plus loin.
2016–2019 : La fête du fingerprinting
👉 L'aperçu de l'époque
- La menace principale : le fingerprinting des navigateurs et des dispositifs
- Pourquoi c'était nouveau : les outils de suivi pouvaient reconnaître les utilisateurs sans stocker d'identifiants évidents tels que les cookies
- La réponse des bloqueurs : le blocage des scripts de reconnaissance d'empreinte digitale connus, des filtres de confidentialité plus stricts, un contrôle des scripts, une protection anti-empreinte digitale au niveau du navigateur
- À noter également : des scripts Anti-adblock, des cryptomineurs, des annonces natives
Pendant des années, les sites web ont eu recours aux cookies pour collecter des informations sur les internautes. Mais à cette époque, les navigateurs et les bloqueurs de publicités étaient déjà devenus assez efficaces pour limiter ou bloquer les cookies ; les outils de suivi ont donc cherché des moyens d’identifier les utilisateurs sans stocker d’informations évidentes sur leurs appareils. C’est là que l’« empreinte numérique » entre en scène. Ce nom n’est pas le fruit du hasard : tout comme on peut identifier une personne grâce au motif unique de ses empreintes digitales, il est possible d’identifier un utilisateur grâce à une combinaison unique de facteurs : fuseau horaire, langue, paramètres du navigateur, extensions installées, polices, taille de l’écran, caractéristiques de l’appareil — la liste est loin d’être exhaustive . Aucun de ces indices n’est suffisant à lui seul pour identifier une personne de manière définitive, mais en combinant un nombre suffisant d’entre eux dans un profil utilisateur unique, on peut atteindre un degré de certitude très élevé.
L’idée de collecter des informations sur les navigateurs et les appareils des utilisateurs est apparue il y a longtemps, mais il a fallu un certain temps pour qu’elle se généralise. Par exemple, en 2013, sur les 10 000 premiers sites web du classement Alexa, seuls 40 utilisaient des scripts d’empreinte numérique. Cette méthode de suivi n’a toutefois pas tardé à connaître un essor fulgurant — et elle reste populaire aujourd’hui encore, car elle n’a pas été affectée par le renforcement des restrictions relatives aux cookies.
Il existe de différents types de « fingerprinting », et le plus emblématique est sans conteste le « canvas fingerprinting ». Le principe est étonnamment simple : un site web demande à votre navigateur de dessiner quelque chose de manière invisible, puis analyse les différentes nuances d’affichage dues au système d’exploitation, au processeur graphique, aux pilotes, aux polices et au navigateur. Cette technique s’est avérée si efficace que, selon une étude menée par Steven Englehardt et Arvind Narayanan de l’université de Princeton, dès 2016, la quasi-totalité des principaux outils de suivi avaient cessé d’utiliser le « canvas fingerprinting » en raison d’une vive réaction négative de l’opinion publique ; le nombre total de domaines y ayant recours avait toutefois considérablement augmenté par rapport à 2014 (mais son utilisation s’était déjà déplacée du suivi comportemental vers la détection des fraudes et des bots).

Exemple d’image générée pour l’empreinte digitale « canvas »
L’empreinte digitale ne consiste pas seulement à faire dessiner des images invisibles par votre navigateur et à mesurer le résultat. Le « canvas fingerprinting » n’est qu’un exemple parmi d’autres d’une technique bien plus vaste : collecter de petits détails sur votre navigateur, votre système d’exploitation et votre appareil, puis les combiner pour former un profil suffisamment distinctif pour vous reconnaître ultérieurement. Nous avons déjà mentionné de nombreux paramètres pouvant être mesurés ; en voici quelques exemples supplémentaires : votre pile audio, la résolution de votre écran, la prise en charge tactile, l’état de la batterie… Ces éléments, ainsi que d’innombrables autres signaux, peuvent tous devenir des pièces du puzzle.
Et à mesure que les appareils gagnaient en puissance, le puzzle s’enrichissait de nouvelles pièces. Les PC modernes, les ordinateurs portables et surtout les smartphones ont mis à la disposition des sites web davantage de capteurs, d’API, de fonctionnalités de rendu et de caractéristiques matérielles. Chaque nouvelle fonctionnalité a été introduite pour des raisons légitimes — graphismes plus riches, meilleure lecture multimédia, design adaptatif, interfaces optimisées pour les mobiles — mais beaucoup d’entre elles ont également offert aux scripts de « fingerprinting » un nouveau champ à exploiter. Même le simple fait d’utiliser un bloqueur de publicités spécifique pouvait devenir une ligne supplémentaire dans votre profil.
À ce propos, est-ce possible de lutter contre le fingerprinting à l’aide d’un bon vieux bloqueur de publicités ? Oui et non. Lorsqu’il s’agit de scripts de fingerprinting tiers identifiables, il suffit d’ajouter les règles nécessaires à la liste de filtrage. Mais les bloqueurs de publicités rencontrent des difficultés lorsque le fingerprinting est intégré dans du code propriétaire ordinaire. Il est possible de bloquer l’exécution des scripts ou de limiter JavaScript à l’aide d’un bloqueur de publicités — ce qui aiderait à lutter contre l’empreinte numérique — mais cela pourrait facilement entraîner des dysfonctionnements du site ; ce n’est donc pas une solution adaptée à tout le monde.

Un Agent utilisateur aléatoire imposé via le module de protection contre le suivi d’AdGuard
Quant à AdGuard, le module « Mode furtif / Protection contre le suivi » mentionné plus haut proposait (et propose toujours) un certain nombre de paramètres, comme Agent utilisateur personnalisé, qui pourraient en théorie atténuer le « fingerprinting » ; mais à vrai dire, c’est un domaine dans lequel les navigateurs sont bien mieux armés pour lutter, de par leur nature même. Ils pourraient beaucoup plus facilement mettre en œuvre des fonctionnalités telles que la randomisation des empreintes numériques — ce qui illustre bien pourquoi vous devriez considérer les bloqueurs de publicités comme l’un des outils de votre arsenal de protection de la vie privée, et non comme une solution miracle à tous les problèmes.
2019–2022 : Le suivi caché au grand jour
🕵️ L'aperçu de l'époque
- La menace principale : le masquage CNAME et dissimulation de première partie
- Pourquoi c'était nouveau : les traceurs pouvaient se dissimuler derrière des sius-domaines semblement propriétaires
- La réponse des bloqueurs : la protection du niveau DNS, le filtrage conscient du CNAME, des bloqueurs à l'échelle réseau, des règles avancées
- À noter également : suivi côté serveur, des identifiants de suivi mobile, ATT d'Apple, suivi sur les téléviseurs connectés et dans les applications
À ce stade, de plus en plus d’utilisateurs ont pris conscience des dangers liés au suivi. L’installation d’une extension de blocage des publicités dans son navigateur est donc devenue la norme. Des applications et des extensions davantage axées sur la confidentialité ont fait leur apparition, et même des logiciels historiquement « neutres en matière de confidentialité », comme les navigateurs, se sont de plus en plus orientés vers l’ajout de fonctionnalités de protection de la vie privée. Les outils de suivi ont dû faire face à une forte opposition et s’adapter à cette nouvelle réalité. L’une des façons d’y parvenir consistait à faire passer le suivi tiers pour du trafic de première partie en utilisant des techniques telles que le masquage CNAME.
Pour comprendre comment fonctionne le masquage CNAME, il faut savoir ce que signifient les termes première partie, ou propriétaire, et tierce partie dans le contexte des navigateurs. Normalement, les navigateurs traitent les sous-domaines d’un même site comme appartenant à la même partie. Par exemple, si vous visitez www.company.example, une requête vers stats.company.example est toujours considérée comme une requête de première partie. Elle peut recevoir les cookies du site et peut même installer des cookies appartenant à company.example.

Schéma illustrant le fonctionnement du cloaking CNAME
Le « CNAME cloaking » (CNAME signifiant « canonical name ») abuse de cette confiance. Le propriétaire d’un site web peut configurer un sous-domaine, tel que stats.company.example, de manière à ce qu’en coulisses, celui-ci pointe en réalité vers un service de suivi tiers. Pour le navigateur (et pour le bloqueur de publicités), la requête semble toujours être dirigée vers le site web d’origine. Mais en réalité, le traceur se cache derrière un sous-domaine qui semble appartenir au site lui-même, bénéficiant ainsi de nombreux privilèges que les navigateurs réservent normalement au site en question.
Le cloaking CNAME n’était pas dangereux parce qu’il inventait une nouvelle méthode révolutionnaire de collecte de données. Il était dangereux parce qu’il brouillait la frontière entre le site que vous visitez et les tiers qui y sont associés, alors que cette distinction était l’un des principes fondamentaux sur lesquels reposaient les outils de protection de la vie privée tels que les bloqueurs de publicités. Par exemple, les cookies propriétaires sont souvent nécessaires au bon fonctionnement des sites web, et les altérer peut s’avérer dangereux. Même si vous activez le module de protection contre le suivi d’AdGuard, vous verrez la mention « Non recommandé » en lettres rouges vives à côté du paramètre Supprimer les cookies propriétaires — rien de tel n’apparaît à côté du même paramètre pour les cookies tiers.
Un autre excellent exemple de suivi allant au-delà des méthodes traditionnelles est le suivi côté serveur. Au lieu de charger chaque traceur directement dans le navigateur, un site web collecte des données via son propre point de terminaison propriétaire et les transmet en arrière-plan. En effet, ce point de terminaison peut servir à des fins tout à fait légitimes, comme le chargement d’images ou de vidéos, et le bloquer complètement rendrait donc le site web inutilisable pour le visiteur.
En 2020, les bloqueurs de publicités et les annonceurs étaient bel et bien pris dans une course à l’armement sans fin. Comme vous pouvez le constater, ces nouvelles méthodes innovantes de suivi des utilisateurs et de diffusion publicitaire n’avaient plus rien à voir avec les bannières naïves des années 2000, et le simple fait d’installer une extension de navigateur ne suffisait plus. C’est à ce moment-là que le filtrage DNS s’est imposé au premier plan de la lutte contre les traceurs. Il permettait d’analyser la résolution des domaines, y compris les chaînes CNAME, et de protéger des appareils tels que les téléviseurs connectés et les routeurs, impossibles à protéger avec des bloqueurs de publicités classiques. AdGuard DNS a été officiellement lancé fin 2018, et dès 2020, il était intégré à toutes les applications AdGuard.

Tableau de bord d’AdGuard DNS
Les règles de filtrage avancées ont également joué un rôle important : elles ne se contentaient pas de bloquer les URL publicitaires, mais identifiaient également les traceurs dissimulés derrière des domaines semblant appartenir au site lui-même. Mais il est apparu plus clairement que jamais que les règles de filtrage seules ne suffisaient pas pour une protection complète ; votre bloqueur de publicités devait couvrir tous les fronts. C’est également à cette époque que les bloqueurs au niveau du réseau, tels que AdGuard Home, ont gagné en popularité, les utilisateurs étant devenus beaucoup plus informés et compétents sur le plan technique, et souhaitant exercer un contrôle total sur leur réseau plutôt que de le déléguer à quelqu’un d’autre.
À partir de 2022 : l’IA débarque sur la scène
🤖 L'aperçu de l'époque
- La menace principale : le ciblage et les publicités générées par l'IA
- Pourquoi c'était nouveau : l'IA a rendu la prédiction, le profilage et la génération de publicités plus évolutifs et plus précis
- La réponse des bloqueurs : les listes de filtrage restent importantes, mais la détection assistée par l'IA pourrait s'avérer utile face aux publicités natives ou générées
- À noter également : les publicités via chatbots, les créations publicitaires synthétiques, le profilage multiplateforme
L’IA a pris l’internet d’assaut et s’est rapidement répandue aux quatre coins du Web, y compris dans la publicité et le suivi. Cependant, ce n'est pas que l’IA ait du coup permis aux annonceurs de découvrir une nouvelle façon de suivre les utilisateurs. Elle leur a plutôt fourni de meilleurs outils pour interpréter, prédire, générer et optimiser les données qu’ils collectaient déjà.
Vous vous souvenez du reciblage et de la façon dont les mêmes annonces vous suivaient partout sur le Web en fonction de ce que vous aviez déjà vu et des liens sur lesquels vous aviez cliqué ? L’IA a fait passer ce concept au niveau supérieur grâce au ciblage prédictif. Au lieu de vous montrer sans cesse les mêmes publicités en fonction des centres d’intérêt indiqués dans votre profil, l’IA analyse des signaux tels que l’historique de navigation, les clics et les achats, et recherche des tendances dans ces données. Ensuite, en se basant sur ces schémas, l’IA prédit la probabilité que vous réagissiez à une publicité et va même jusqu’à personnaliser cette publicité spécialement pour vous. Cela concerne non seulement l’apparence de la publicité, mais aussi le moment où elle s’affiche et l’offre spécifique proposée. En bref, le ciblage ne repose plus sur ce que vous avez fait, mais sur ce que vous êtes susceptible de faire ensuite.
Un autre avantage que l’IA offre aux annonceurs : ils n’ont pas besoin de savoir grand-chose sur vous pour atteindre le même niveau de précision (voire meilleur). Ce qu’ils ignorent, ils peuvent désormais prédire avec un haut degré de certitude. Les traceurs utilisent le profilage multiplateforme pour se faire une meilleure idée de qui vous êtes : ils relient ainsi votre activité sur des différentes applications et différents sites web en s’appuyant sur vos identifiants de connexion, les signaux émis par vos appareils, les identifiants publicitaires et vos habitudes de navigation afin de déterminer quels signaux correspondent à une même personne. L’IA renforce l’efficacité de cette méthode, car elle permet de relier des signaux faibles provenant de différentes sources et de déduire des traits de personnalité cachés à partir de schémas qui peuvent sembler sans rapport à première vue. Il est désormais bien plus utile de disposer de nombreux signaux faibles que de très peu de signaux forts ; les plateformes dotées d’écosystèmes nécessitant une connexion profitent donc d’un avantage naturel.
En ce sens, l’IA n’a pas beaucoup changé la manière dont les bloqueurs de publicités gèrent les publicités et les traceurs eux-mêmes : les listes de filtrage restent le fondement du blocage publicitaire, le filtrage DNS et réseau conserve toute son importance, tout comme le filtrage « cosmétique ». Ce qui est devenu bien plus important qu’auparavant, c’est la quantité de données personnelles que vous divulguez au départ. Chaque connexion à un site web, chaque demande d’autorisation approuvée, chaque information vous concernant que vous rendez disponible en ligne alimente désormais la machine. Les outils de protection de la vie privée peuvent également aider dans ce domaine, mais il incombe de plus en plus aux utilisateurs eux-mêmes de faire preuve de vigilance et d’adopter une attitude très prudente quant à leur interaction avec le Web — même si ce n’est pas une tâche facile du tout à notre époque hyper-numérique.
L’IA a également ouvert une « nouvelle frontière » potentielle pour le blocage des publicités : les publicités intégrées dans les conversations des chatbots. À l’heure actuelle, presque toutes les publicités associées aux chatbots sont distinctes des réponses et identifiées comme « sponsorisées », mais cela pourrait poser problème à l’avenir.

Capture d’écran de la balise « Sponsorisé » de ChatGPT par Tibor Blaho sur X
D’un point de vue fonctionnel, elles ne diffèrent pas beaucoup des autres publicités que l’on peut rencontrer sur un site d’actualités, par exemple ; les bloquer revient donc simplement à mettre à jour la liste des filtres en conséquence. Mais il est tout à fait possible, d’un point de vue technique, d’intégrer une publicité directement dans le texte de la réponse du chatbot. À moins de savoir déjà que le bot tente de vous vendre quelque chose, il serait impossible de savoir si une recommandation est sincère ou si elle a été insérée de force dans la réponse à des fins purement publicitaires. Heureusement, pour l’instant, il semble que les entreprises spécialisées dans l’IA accordent de l’importance à leur image publique et craignent suffisamment les réactions négatives pour éviter cette tactique, mais il n’est pas exclu que cela devienne une réalité à un moment donné. On pourrait penser que c’est là que les bloqueurs de publicités jetteront l’éponge, mais ce n’est pas nécessairement le cas. Cela nécessitera toutefois une approche entièrement nouvelle — qui, ironiquement, impliquera également l’utilisation de l’IA. Les bloqueurs de publicités devront passer de la compréhension du code à celle du sens. Il y a trois ans déjà, nous avions évoqué les moyens possibles de faire face à ce problème ; les développeurs de bloqueurs de publicités restent donc à l’affût : cela pourrait devenir une menace réelle plus tôt que vous ne le pensez.
Mais l’IA n’est pas un facteur négatif pour le blocage des publicités. Loin de là, d’ailleurs : l’utilisation de l’IA dans le domaine de filtrage de contenu a été l’un des principaux thèmes abordés lors du sommet Ad-Filtering Dev Summit de l’année dernière. Les développeurs ont discuté de la manière dont l’IA peut être mise à contribution pour automatiser le blocage des fenêtres contextuelles relatives aux cookies, de son rôle dans l’assurance qualité, et même de la façon dont elle peut aider à identifier et à bloquer les publicités elles-mêmes. Maxim Topciu, le responsable de l’équipe des extensions de navigateur chez AdGuard, a créé et présenté plusieurs prototypes fonctionnels utilisant différentes méthodes pour distinguer le contenu publicitaire sur la page et le bloquer. Il est tout à fait clair que l’IA restera l’un des principaux sujets de discussion lors du prochain Sommet et, pour être honnête, probablement lors de tous les Sommets à venir.
Il est impossible de condenser 17 ans de menaces sur le Web en un seul article de blog, même en prenant quelques libertés, et ce n’était d’ailleurs pas le but. L’objectif était de montrer à quel point les défis auxquels les bloqueurs de publicités ont dû faire face ont évolué au fil du temps, à quel point il n’a pas été simple de vous proposer les meilleurs outils de protection contre les publicités et les traceurs, mais aussi à quel point nous avons toujours fait de notre mieux à chaque étape. Nous espérons que vous avez été satisfaits d’AdGuard, quelle que soit la durée depuis laquelle vous l’utilisez, que ce soit depuis un an seulement, peut-être cinq, ou, qui sait, les dix-sept années entières.
Nous avons hâte de voir ce que les dix-sept prochaines années nous réservent ! Une chose est sûre : nous continuerons à faire tout ce qui est en notre pouvoir pour faire face aux menaces futures et vous protéger.








