AdGuard、偽装トラッカー見つけ出すためウェブをすみずみまでスキャンしました(CNAME追跡対策)
【3月9日時点最新情報】 他のコンテンツブロッカーがCNAMEクローキングされたトラッカーをブロックするために私たちのリストを採用し始めたので、この努力が報われたことを嬉しく思います。すなわち、EasyPrivacyは、すでに私たちのリストを追加しています。
コンテンツブロッキングが普及するにつれ、過剰なトラッキング(個人情報追跡)のためのツールの多くは結構役立たずであることが明らかになっています。
しかし、市場がますます大規模なデータ収集に向かっているため、可能な限り追跡を推し進め続けようとする傾向があります。
あからさまな方法を選ぶ人もいれば、ユーザーのデータを収集するためのより独創的な方法を模索する人もいます。
そのようなより巧妙な方法の一つに、「CNAME」というものがあります。
CNAMEレコードとは、「Canonical Name record」の略で、あるドメイン名(エイリアス)をIPアドレスに直接マッピングするのではなく、別のドメイン名(カノニカルネーム=CNAME)にマッピングする、DNSレコードの一種である。
これは、何百万ものウェブサイトで使用されている基本的な機能で、メールや検索などのさまざまなサービスに固有のサブドメインを作成するために使われます。
シームレスな相互作用を可能にするため、サブドメインはプライマリドメインと同様に信頼されます。
CNAMEクローキングで隠された追跡は、この基本的な仕組みを悪用し、無断のデータ収集だけでなく、多くの問題を引き起こします。
CNAMEレコードを使用すると、外部のトラッキングサーバー(追跡元サーバー)を、ブラウザが信頼しているウェブサイトのサブドメインに偽装することができ、トラッキングクッキーは“ファーストパーティ”のものとしてブラウザに受け入れられてしまいます。
さらに、これは逆にも作用し、プライマリドメイン用のクッキーが偽装されたトラッカーと共有される可能性があります。
追跡主第三者は、ユーザーの名前や連絡先から、ユーザーのセッションを識別してWebサイトにログインし続けるための認証クッキーまで、あらゆる種類のデータを受け取ることができてしまいます。
Yana Dimova、Gunes Acar、Wouter Joosen、Tom Van Goethem、Lukasz Olejnik作の最近の研究論文によると、このようなトラッカーを採用しているWebサイトの95%でCookieの漏洩が発生しているとのことです。
この研究では、CNAMEを使用したトラッキングは、基本的なウェブセキュリティツールを欺くものであり、重大なセキュリティやプライバシーの侵害につながる可能性があることが強調されています。
ブラウザ自体は、CNAMEクローキングされたトラッキングからユーザーを守ることはできません。しかし、コンテンツブロッカーなら守れます。
AdGuardとAdGuard DNS、そしてMozilla Firefox版uBOは、このような「隠れたトラッカー」をすでにブロックしています。
しかし、Chrome、Chromium、Safariの制限により、通常の拡張機能はホスト名を動的に解決してトラッカーを削除することはできません。
こういった拡張機能はフィルターリストをもとにした動作に制限されており、CNAMEで偽造されたトラッカーのほとんどが入るフィルターリストを作成するためには、ウェブ全体を検査するのはなかなかのことです。
ですが、私たちAdGuardはまさにこのようなスキャンを行いました。独自のDNSサーバと、スタンドアロンおよびブラウザベースのコンテンツブロッキングツールのおかげで、私たちはハンターを狩る(というかトラッカーを追跡する)ことができ、それらをリストアップし、ブロックすることができました。
そして今、私たちは「AdGuard追跡保護フィルタ」の一部として、すべての既知のCNAMEクローキングされたトラッカーの完全なリストを公開しています。
また、他のコンテンツブロッカーが使用できるように、このリストをGitHubでも公開しています。6000件以上を含む、現在最も完全で自動更新されるアクティブな偽装トラッカーのリポジトリ(簡単に言えば、偽造トラッカーのURLを集めたリスト)です。このリストは定期的に更新され、新しいCNAME偽装トラッカーが検出されるたびにリストに追加される予定です。
さて、これで、CNAMEを使用したトラッキングの問題は完全に解決されたということでしょうか?
残念ながらそうではありません。フィルターリストは常に最新の状態に保つ予定ですが、隠しトラッカーの数は常に増加しているため、ブロックルールの数も増加することになります。
問題は、SafariとChromeの開発者がコンテンツブロッキングを完全にコントロールしようとしすぎているあまり、ブロッキングルールの数がそれぞれ50,000と150,000(Manifest V3で実施予定)に制限されていることです。
現在でも、Safariの5万件のルールは、広告やトラッカー、その他ウェブ上に潜むあらゆる悪質なものから身を守るのに十分ではありません。実際の脅威からユーザーを守るためのスペースが足りなくなる日は、案外近いのかもしれません。