AdGuard Блог Голосовые помощники: безопасность данных или удобство?

Голосовые помощники: безопасность данных или удобство?

3 июня 2022 г. время чтения: 9 мин

Никто из нас не удивится, если нам скажут, что Google, Apple или Microsoft знают о нас практически всё. А ещё постоянно собирают и сливают данные. Но почему-то мы не прекращаем пользоваться их продуктами. И голосовые помощники — одни из таких продуктов.

Попросите Siri рассказать вам анекдот или сказку на ночь — и вот вы уже чувствуете, что не одиноки. Не можете решиться — попросите её подбросить монетку. Хотите добавить в жизнь немного магии — используйте заклинания из Гарри Поттера вместо команд. А для некоторых голосовые помощники незаменимы — например, для тех, у кого проблемы со зрением.

Голосовые помощники действительно делают нашу жизнь комфортнее. Можно вести машину и отвечать на звонки, отправлять сообщения, сверяться с маршрутом, узнавать последние новости, бронировать номер в отеле — не отрывая руки от руля. В умном доме можно попросить голосового помощника открыть дверь или включить свет. Можно в три раза быстрее отвечать на электронные письма и общаться с иностранцами без знания языка.

Но у комфорта есть обратная сторона, и репутация голосовых помощников неоднозначна: кто-то от них в восторге, кто-то не доверяет и избегает. И неспроста: нолосовые помощники — почти всегда не основной продукт компаний, которые их производят. И вопросам защиты данных часто не уделяется должного внимания.

Проблема №1. Данные обрабатываются в облаке

Голосовые помощники обрабатывают данные двумя способами. Некоторые из них записывают и сжимают аудиоданные, а затем отправляют их на серверы компании для обработки. Результат — «ответ» — отправляется обратно на ваш телефон или любое другое устройство со встроенным голосовым помощником. Оно синтезирует человеческую речь и вступает с вами в диалог.

Голосовые данные сохраняются на облаке. Ещё недавно иначе было нельзя: *для точной интерпретации голосовых команд нужно было гораздо больше вычислительной мощности, чем могло предоставить одно устройство*. А обработка данных на облаке эту проблему решала

Но к концу 2021 года, после череды скандалов с утечками данных, Google, Amazon, Microsoft, Apple и Samsung внесли изменения в политику конфиденциальности и поменяли методы обработки данных. Сейчас большинство компаний обрабатывают хотя бы часть данных на самом устройстве. Возможно, поэтому споры о безопасности использования голосовых помощников поутихли: если ваш голос не покидает устройство, то никто не узнает, как он звучит, и не сможет использовать его в собственных целях. Но ситуация изменилась совсем незначительно.

Данные всё равно собирают, только в текстовом формате. Специальная программа обрабатывает данные локально на устройстве, а потом устройство отправляет стенограмму на сервер, где происходит расшифровка и формулируется ответ.

Интернет не нужен только для простейших команд, вроде «заведи будильник на 7 утра» или «позвони маме». В этом случае никто никаких стенограмм никому отправлять не будет.

В чём же тогда проблема?

В облаке. Данные в безопасности, пока они хранятся локально на устройстве (по крайней мере, в большей безопасности, чем на внешнем сервере). На устройстве доступ есть только у вас, в облаке — кто знает.

И даже если злоумышленники получат доступ к устройству, они завладеют данными только одного пользователя. А в случае атаки или утечки данных с облачного сервиса под угрозой будут данные миллионов пользователей.

Голосовые помощники ошибаются

Если вы не отключили функцию «активации по ключевому слову», то голосовые помощники будут слушать вас постоянно. Они впадут в своего рода «спячку» в ожидании ключевого слова или фразы. «Привет, Siri!»... Или «Сирия»? Или кто-то просто застегнул молнию? Об ошибках голосовых помощников пишут часто. Они могут принять за ключевые слова обрывки фраз: из телевизионной передачи, из дружеской беседы, из выступления депутата в британском парламенте... Всё сказанное после ключевого слова считается командой. Даже если вы не хотели обращаться к голосовому помощнику, он всё равно будет слушать.

Проблема №2. Компании позволяют сотрудникам «подслушивать» ваши разговоры

Если вы разрешили вашему голосовому помощнику вас слушать, будьте готовы к тому, что в курсе ваших дел будет не только он.

Чтобы понять, насколько адекватно голосовые помощники отвечают своим владельцам, компании нанимают экспертов-лингвистов, которые слушают записи разговоров между вами и вашим ассистентом.

Да, они это делают с вашего согласия. Да, они анализируют лишь малую часть того, что было записано. Да, данные анонимны. Но, во-первых, как мы помним, никто не застрахован от ошибок. Недавно мы писали о том, что Apple продолжала записывать разговоры пользователей с Siri несмотря на запрет это делать. А с учётом того, что около 1000 слов и выражений могут быть истолкованы различными голосовыми помощниками как «ключевые слова», ошибиться есть где. В записях, которые попадают в руки к эксперту, могут быть семейные ссоры, разговоры между доктором и пациентом, деловые переговоры, сделки с наркоторговцами или подробности интимной семейной жизни.

Во-вторых, информация обезличена только в минимальной степени требуемой законом. Эти записи дополнены данными о местонахождении пользователей, их контактными данными и информацией о приложении. Любой, кто захочет идентифицировать пользователя на основе этих данных, сможет это сделать.

Ваши данные не в безопасности уже потому, что чужие люди могут слушать ваши разговоры. А если вы доктор, вы можете ненароком нарушить конфиденциальность пациента. Допустим, вы психотерапевт и запретили своему голосовому помощнику записывать данные. Но произошёл сбой в системе, ваш разговор с пациентом был записан и попал к лингвистам на анализ. Или, возможно, вы разрешили записывать свой голос, потому что думали, что помощник запишет только ваши команды — но тот ослышался и включил запись во время консультации. Кто в этом случае виноват, что конфиденциальность нарушена?

С учётом вероятности ложных срабатываний никогда не знаешь наверняка, не попала ли в чужие руки информация, которой вы по секрету поделились со своим лучшим другом. И всё это только потому, что вы когда-то купили телефон со встроенным голосовым помощником.

Проблема №3. Ваши данные — доступная мишень

Даже если ваши записи не стали частью данных, отправляемых на речевой анализ, они все равно хранятся на серверах. Apple хранит стенограммы того, что вы диктуете Siri, если не указано иное. Microsoft оставляет за собой право доступа к стенограммам без вашего согласия. Amazon хранит большой массив аудиоданных на каждого пользователя. Так, журналист Reuters обнаружил, что Alexa за 4 года передала Amazon 90,000 записей бесед с голосовым помощником его и его близких. Если вы хотите запросить у Amazon досье на вас, на сайте компании есть подробная инструкция, как это сделать.

И если записи случайных звуков не имеют коммерческой ценности, то записи ваших реальных разговоров с голосовыми помощниками имеют. Все компании хотят знать, чем вы интересуетесь — но некоторые хотят этого больше, чем другие. Что вы ищете в интернете, что вы покупаете, какие каналы смотрите, как проводите своё время — всё это монетизируемые данные. Для некоторых соблазн получить к ним доступ может оказаться слишком велик.

Ваши данные интересуют не только корпорации. Есть хакеры, правоохранительные органы, а ещё есть хакеры, которые представляются полицейскими. Они могут запросить ваши данные у Apple и Meta, чтобы затем продать. Личные данные могут утечь в сеть, их могут запросить госорганы. А как мы помним, не всеми данными, которые собирают голосовые помощники, безопасно делиться.

К слову об утечке данных: согласно прошлогоднему расследованию портала Wired, Amazon собрала такой большой массив данных, что едва ли в состоянии им управлять. По словам источников внутри компании, в Amazon зачастую не знают, где хранятся пользовательские данные, и поэтому не могут выявить потенциальные утечки данных.

Проблема №4: Не всё можно удалить

Также Amazon не может с точностью сказать, удалены ли данные по вашему запросу или нет. Вы можете запросить логи вашего взаимодействия с голосовыми помощниками и попросить компанию их удалить. Это способ применим к большинству голосовых помощников, в том числе Alexa, Cortana и Google Assistant. Что касается Siri, то Apple не пришлёт вам логи и не удалит данные старше 6 месяцев. Через 6 месяцев ваши данные отвязываются от случайного идентификатора устройства. Apple может их использовать для улучшения функции распознавания речи. Но если компания согласилась удалить данные, она их удалит, верно?

Когда вы запрашиваете логи ваших взаимодействий с голосовыми помощниками, вы ждёте, что компания удалит очередь обработанных запросов, которые связаны с вашим ID и соответственно с вами. Но на другой стороне вашего запроса — на стороне того, кто его обрабатывает — сохраняется информация о вас. Как минимум, в системе сохраняются логи выполнения запросов: поисковых запросов, запросов к музыкальному или продуктовому сервису.

Компании часто ведут статистику пользовательских запросов. Они собирают метрики, чтобы определить интересы пользователей — что чаще всего ищут, какую музыку слушают, какими сервисами пользуются. Вспомним «Год в истории поиска» от Google . Эти данные отвязаны от конкретного человека и его идентификатора, но запросы к голосовым помощникам могут содержать полные имена, адреса или род занятий. Стенограммы удалены? Да, но тот факт, что кто-то заказывает такси из бара к вам домой каждую пятницу, остаётся.

Мы не можем быть на 100% уверены, что компания удалит всё, о чём мы её попросим. И у нас не будет доказательств. Мораль такая: доверять или нет — мы выбираем сами.

Вы можете контролировать свои данные

Компании не откажутся от сбора информации о вас по щелчку. Чем больше они знают, тем больше они могут заработать, продавая эти данные рекламодателям. Чем больше рекламодатели знают о вас, тем легче навязать вам услуги или продукты. Корпорации не перейдут внезапно на сторону добра и защиты данных. Самое лучшее, что можно сделать — быть в курсе возможных рисков.

Необязательно выбрасывать все электронные устройства в мусорный бак. Но можно попытаться снизить риски — например, запросить свои данные и попросить компании удалить их. Ещё можно выключать голосовой помощник во время личных бесед и попросить своих друзей сделать то же самое.

Вы также можете настроить звуковые оповещения о начале работы голосового помощника. А если у вас есть ребёнок, используйте пароль или отключите покупки голосом, если не хотите, чтобы ваш четырёхлетний малыш заказал себе полный магазин игрушек.

Если вы готовы поступиться комфортом, можете отключить микрофон своего голосового помощника. Он не будет активироваться по ключевому слову, и его придётся каждый раз включать вручную.

А можно, наоборот, оставить микрофон включённым: кто знает, возможно, однажды он обеспечит вам алиби.

Старайтесь читать политики конфиденциальности и выбирать те компании, которые заботятся о защите данных: не передают данные третьим лицам, не хранят информацию на серверах. Ещё полезно почитать новости — были ли у компании утечки данных?

Все риски исключить всё равно не получится. Но можно взвесить все за и против и решить для себя, так ли нужен голосовой помощник. Тогда что бы вы ни решили, ваш выбор будет информированным.

Обновлено 30 марта 2024 г. время чтения: 9 мин Защита данных Полезное

Sofia Orlova

AdGuard для Windows

AdGuard для Windows — это не просто «ещё один блокировщик». Это многоцелевой инструмент, который блокирует рекламу и доступ к опасным сайтам, ускоряет загрузку страниц и защищает детей от взрослого контента.

Голосовые помощники: безопасность данных или удобство?

Проблема №1. Данные обрабатываются в облаке

Голосовые помощники ошибаются

Проблема №2. Компании позволяют сотрудникам «подслушивать» ваши разговоры

Проблема №3. Ваши данные — доступная мишень

Проблема №4: Не всё можно удалить

Вы можете контролировать свои данные

Готово! Что-то пошло не так Подпишитесь на наши новости

Подпишитесь на наши новости

Вы подписались на рассылку

Рекомендуемые статьи

Новая функция Instagram показывает ваше местоположение другим пользователям: насколько это плохо?

ТехТок 9. Как работают браузерные расширения и что такое фаервол

uBlock Origin навсегда отключён в Chrome. Почему это произошло и чем заменить

Google добавил Gemini в WhatsApp и другие приложения: как ограничить доступ к личным данным

AdGuard для Windows

AdGuard для Mac

AdGuard для Android

AdGuard для iOS

AdGuard Content Blocker

Браузерное расширение AdGuard

Помощник AdGuard

AdGuard Home

AdGuard Pro для iOS

AdGuard для Safari

AdGuard для Android TV

AdGuard для Linux

AdGuard Temp Mail

AdGuard VPN

AdGuard DNS

AdGuard Mail

AdGuard Wallet

1. Разрешите загрузку

Разрешение на установку

Для пользователей Samsung с One UI 6 (Android 14) и новее

2. Установите приложение

3. Запустите приложение