音声アシスタント:不具合などでユーザーを裏切ることもある“ヘルパー”
GoogleやAmazon、AppleやMicrosoftなど、ハイテク大手は私たちユーザーに関するデータを大量に収集し、それを漏洩する可能性があることは、誰もが知っています。
しかし、大手らの製品を使うのをやめるのはなかなか難しいです。
音声アシスタントも大手製品のひとつです。
退屈な時に、Siriにジョークや寝物語を聞かせてもらえる。
判断に迷ったら、Siriにどの選択にすればいいかとコインを投げて決めてもらえる。
ハリー・ポッターの呪文をSiriコマンドの代わりに使うこともできる。
さらに、音声アシスタントは生活を著しく楽にする人もいます。
例えば、視力に問題がある人などです。
実際、音声アシスタントは、生活の快適さに大きく貢献しています。
例えば自動車を運転するとき、電話、メッセージ、ナビゲーション、ニュース、予約などをハンズフリーで管理することができ、マルチタスクが得意になります。
スマートハウスでは、アシスタントにドアを開けてもらったり、電気をつけてもらったりすることができます。
テキストを口述すれば、手で打つ必要がなくより効率的にテキストを作成することもできます。
また、言葉がわからなくても、翻訳機能を使って外国人と話すことができます。
しかし、便利さには裏表があり、音声アシスタントはかなりデリケートな話題です。
熱狂的に支持する人もいながら、恐れて絶対に避けようとする人もいます。
それにはそれなりの理由があります。
大手ハイテク企業の焦点は、主に音声アシスタントではないため、音声アシスタントの個人情報保護問題は見落とされがちです。
問題点① データがクラウド上で処理される
音声アシスタントは、いくつかの方法で機能します。
音声データを録音して圧縮し、企業のサーバーに送信し、そこで処理するものもあります。
その結果である“返答”は、音声アシスタント技術を搭載したスマホやその他のデバイスに返送され、音声アシスタント技術はローカル音声合成システムを使って、まとまりのある音声対話の印象を与えることができます。
この場合、クラウド上に保存されるのは音声データであり、最近までこれが唯一の方法でした。
以前、音声コマンドを正確に解釈するには、1台のデバイスが搭載できるよりもはるかに多くの計算能力が必要でした。
そのため、クラウド音声処理を利用することで、より少ないリソースでより多くのことができるようになっていたのです。
しかし、2021年末には、データ流出や偉大なミスによるいくつかのスキャンダルを経て、ほとんどの大手テック企業(グーグル、アマゾン、マイクロソフト、アップル、サムスンなど)は、プライバシーポリシーだけでなく、使用する技術も更新したのです。
現在では、ほとんどの企業が、少なくとも部分的にデバイス上音声処理(デバイス外に音声データが出ないデータ処理仕組み)を使用しています。
もしあなたの声がデバイスから出なければ、誰もそれがどのように聞こえるかを知ることはなく、それを利益のために使用することはできないからです。
自分の声がデバイスから出なければ、誰もその響きを知ることがなく、自分の利益のために使うこともできない、ということからプライバシーに関する不安も少しは冷めたかもしれません。
しかし、実際には、このことは状況をほとんど変えていません。
データは依然として収集されています。ただ、テキスト形式になっているだけです。
音声データをローカルで処理した後、デバイスはトランスクリプト(テキスト形式)をサーバーに送信し、あなたが何を言ったかを「理解」して答えることができるようにします。
また、「朝7時にアラームをセットする」「お母さんに電話する」など、ごく一部のコマンドに限り、インターネット接続は必要ありません。
トランスクリプトはどこにも送信されず、すべてあなたのデバイス上でローカルに行われます。
では、問題はどこにあるのでしょうか。
問題は、クラウドそのものにあります。
ローカルに保存されている間は、データは安全です(まあ、最低でもクラウドよりは確実に安全)。
あなた以外の誰もデータにアクセスできませんが、クラウドにははるかに多くの人がアクセスできます。
一方、クラウドにははるかに多くの人がアクセスできます。
まれに、誰かがあなたのデバイスに侵入しても、あなた1人のデータにしかアクセスできません。
しかし、データがクラウド上に保存されている場合、漏洩や攻撃の結果、何百万人ものユーザーに関する情報が公開されてしまう可能性があります。
間違いが肝心となることも
「ウェイクワードに反応する」機能を無効にしていないと、音声アシスタントは常に聞き耳を立てていることになります。
対話の開始にはウェイクワードが必要なので、常に「待機モード」のような状態になっているのです。
「シティ」や他の音が「Hey Siri」(ヘイシリ)と誤認識されることもあります。
例えばチャックの音。
音声アシスタントがランダムなフレーズをウェイクワードと誤認したケースは数知れずあります:
バックグラウンドで流れているテレビ番組、親しい会話、英国議員の下院での発言...。
ウェイクワードの後に言ったことはすべてコマンドとみなされます。
たとえあなたが話したいと思っていなかったとしても、音声アシスタントは聞いています。
問題点② 企業らは、会話が他人に聞かれることを許可する
音声アシスタントに聞かせると、聞くのはアシスタントだけでない可能性があります。
音声アシスタントがどれだけ正確に応答しているかを分析するために、企業は言語専門家と提携して、あなたとアシスタントの会話の録音の一部を聞いていると言われています。
そう、彼らはあなた(ユーザー)の同意の上でそれを行います。
録音されている内容のごく一部しか聞かなく、情報は匿名化されています。
しかし、間違いも起こります。
アップルが、あなたが断っても音声データを録音し続けたことびついては、以前にも書きました
。
さらに、様々な音声アシスタントによって、約1,000の単語列がトリガーワードとして不正に解釈される可能性があると報告されました。
家族の喧嘩、医者と患者の会話、ビジネス、麻薬取引、カップルのセックスなど、想像できる限りの情報が録音されていたりします。
また、情報は法律で定められた最小限の範囲でのみ匿名化されています。
これらの録音データには、アプリデータと位置情報や連絡先などを示すユーザーデータが付随しています。
また、これだけでもユーザーを無防備にするのに十分なのですが、見知らぬ人にプライベートな会話を聞かれることは、例えば、守秘義務を破ることで医療上の慣習に反する可能性があるのです。
想像してみてください。あなたは医者だとします。
あなたは音声アシスタント改善用音声録音を無効にしました。
しかし、システムにバグがあり、患者との会話はそのまま録音されてしまいました。
そして、人間の作業員が調べた録音の中に入っていたのです。
あるいは、音声アシスタントは自分とのやりとりだけを記録し、それ以上のことは記録しないと思っていたから「はい」と答えたのに、アシスタントが言葉を聞き間違えて録音を始めてしまったのかもしれません。
このような場合、誰が守秘義務を破ったのか、どうすればそれを防げたのか。
なので、音声アシスタントを搭載していると、会話の中で共有する情報が安全かどうか、断言することはできないようです。
問題点③ 企業とその他の他人はさらに詳しい情報を知ることができる
あなたの録音が分析されたデータのごく一部でなかったとしても、それらはサーバーに残っています。
特に他の指定がない限り、アップルはあなたが口述した内容の記録を保存します。
マイクロソフトは、あなたの同意なしに、あなたの音声トランスクリプトにアクセスすることを許可しています。
アマゾンは大量の音声情報を保存しています。
少し前、あるツイッターユーザーが、アレクサがどれだけのデータを持っているかの写真を投稿しました。
あるロイターの記者は、4年の間に、アマゾンのアレクサが自分とその家族について9万件以上の録音をしたことを知りました。(追記:自分に関してこの情報をアマゾンに請求する方法を知りたい方は、こちらのAmazon説明書をご覧ください。)
また、偶然の音にはあまり商業的な価値はありませんが、音声アシスタントとの実際の会話の録音には商業的な価値があります。
すべての企業は、あなたの興味が何であるかを知りたがっています。ただ、企業の中でもより熱心な企業もあります。
あなたが何を検索し、何を買い、どのチャンネルを見て、誰と時間を過ごすか、などなど、これらはすべて収益化可能なデータであり、おそらくあなたのデータを求める企業にとっては、その誘惑に抗えないほどおいしいものなのです。
それ以外にも、ハッカーやFBIなど、あなたの人格に関心を持つ関係者もいます(FBIや警察を装ったハッカーは、AppleやMetaにさえもユーザーデータを要求し、盗む可能性があります)。
個人情報が漏れたり、国家監視機関から要求されたり、音声アシスタントが収集するデータは非常にセンシティブなものである可能性があります。
問題点④ 情報をすべてを削除できるわけではない
アマゾン自体も、ユーザーから要求されたデータ削除が実際に成功したかどうかを確認することをできなかったという。
技術的には、音声アシスタントとの対話のログを要求し、会社に削除を依頼する方法があります。
これは、Alexa、Cortana、Googleアシスタントなど、ほとんどのケースで有効です。
Siriに関しては、Appleはログを提供せず、6ヶ月未満のデータのみを削除します。
この期間を過ぎると、音声データやトランスクリプトは固有の識別子を失い、Siri改善のために使用されることが可能。
しかし、個人データは本当に削除されるのでしょうか。
もしあなたが音声アシスタントとの対話のログをベンダーに求めた場合、理論的には、あなたのID、つまりあなた自身と結びついた、処理されたリクエストのキューを削除することが期待できる。
しかし、あなたのリクエストの反対側、つまり処理側には、まだあなたに関する何かを持っている情報システムがあります。
最低でもそのシステムは検索エンジン、音楽サービス、商品サービスへのリクエスト完了に関するログを保存しているのです。
それに、企業はユーザーのリクエストの統計を取る傾向がある。
何が最も頻繁に検索されているか、どのサービスが好まれているか、どんな音楽を聴いているかなど、人々が何に関心を持っているかを判断するための指標を保存しているのです。
例えばGoogleの"Year in Search"も集計されたデータですが、それほど無害なものではありません。
特定の人物とその識別子から切り離されたデータではあるが、音声アシスタントへのリクエストにはフルネーム、住所、職業などが含まれている可能性があります。
トランスクリプトは削除されたとしても、誰かが毎週金曜日にバーからあなたの住所までタクシーを注文していたという情報は残ります。
依頼すれば、会社がすべての個人情報を削除してくれるとは100%確信できません。
それを証明することもできません。
信頼するかしないかのみ。
データと個人情報を自分で制御する方法
企業は、あなたの情報を収集することを簡単にはあきらめません。
情報を集めれば集めるほど、その情報を広告主に売って儲けることができるからです。
あなたに対するプロフィールが正確であればあるほど、あなたを引っかけるのが容易になる。
言うまでもなく、彼らはいきなりユーザーに協力し始めることはないでしょう。
私たちにできることは、リスクを認識することです。
電子機器をすべてゴミ箱に捨てる必要はなく、これらのリスクを軽減する方法を知っておく必要があります。
自分のデータを要求し、企業に削除を依頼し、プライベートな会話では音声アシスタントをオフにし、友人にも同じようにお願いすることができます。
また、デバイスがあなたの発言を積極的に聞いているときに、警告を出すようにするのもよいでしょう。
他のデバイスで再利用されない強力なパスワードを設定し、二要素認証を使用してください。
お子様がいる場合は、4歳の子供におもちゃを大量に注文させたい場合以外は、暗証番号を設定するか、音声購入をオフにしましょう。
もっと本格的にやりたい場合は、音声アシスタントのマイクをミュートしてもよいでしょう。
その場合、ウェイクワードで起動しないので、毎回手動でオンにする必要があります。
一方、マイクをずっとオンにしておきたい場合もあります。
いつか音声アシスタントはアリバイとなるかもしれません。
さらに、各社のプライバシーポリシーを慎重に検討し、自分のニーズに最も適したものを選ぶことができます。
おそらく、あなたのデータ・個人情報を第三者と共有しないと明言しているものを選ぶとよいでしょう。
あるいは、サーバーに情報を保存しない会社もあります。
また、レビューや調査を読んで、あなたが個人情報を託そうとしている会社がデータ漏洩で捕まったことがあるかどうかを調べることもできます。
いずれにせよ、音声アシスタントを使用する際に、プライバシーに対するリスクをすべて排除することはできません。
長所と短所を比較検討し、本当に音声アシスタントのヘルプが必要なのかどうかを自分で判断することが、あなたにできる最善のことです。
十分な情報を得た上での選択は、常に最良の選択となるでしょう。