Тайный мир голосовых помощников: Как вы рискуете своими данными выбирая удобство
Google или Amazon, Apple или Microsoft — не секрет, что эти компании многое о нас знают. Также не секрет, что они постоянно собирают и сливают данные, но мы всё равно продолжаем пользоваться их продуктами. Голосовые помощники одни из них.
Попросишь Siri рассказать тебе анекдот или сказку на ночь — и ты уже больше не чувствуешь себя одиноким. Не можешь решиться — попроси её подбросить монетку. Хочешь добавить в жизнь немного магии — отдавай ей команды заклинаниями из Гарри Поттера. Некоторым людям они значительно облегчают жизнь, например, тем, кто имеет серьезные проблемы со зрением.
Нужно признать, что голосовые помощники делают нашу жизнь комфортней. Вы можете вести машину и отвечать на звонки, отправлять сообщения, сверяться с маршрутом, узнавать последние новости, бронировать номер в отеле — всё это не отрывая руки от руля. Вы превращаетесь в гуру многозадачности. В умном доме вы можете попросить голосового помощника открыть дверь или включить свет. Вы в три раза быстрее ответите на электронные письма. Вы сможете общаться с иностранцами без знания языка.
Но у комфорта есть обратная сторона. Голосовые помощники имеют неоднозначную репутацию: либо вы в восторге от них, либо не доверяете им и избегаете их. Этому есть причина. Так как они не являются основным продуктом компаний, которые их производят — вопросам защиты данных часто не уделяется должного внимания.
Проблема №1. Данные обрабатываются в облаке
Голосовые помощники обрабатывают данные двумя способами. Некоторые из них записывают и сжимают аудиоданные, а затем отправляют их на сервера компании для обработки. Результат — «ответ» — отправляется обратно на ваш телефон или любое другое устройство со встроенным голосовым помощником. Оно синтезирует человеческую речь и вступает с вами в диалог.
В данном случае голосовые данные сохраняются на облако. До недавнего времени этому способу не было альтернативы. Ранее точная интерпретация голосовых команд требовала гораздо большей вычислительной мощности, чем имелось в распоряжении одного устройства. Благодаря обработке голосовых данных на облаке стало возможно делать больше меньшими ресурсами.
Но к концу 2021 года, после череды скандалов с утечками данных, большинство крупных технологических компаний, в том числе Google, Amazon, Microsoft, Apple и Samsung — внесли изменения в политику конфиденциальности, а также поменяли методы обработки данных. На сегодняшней день большинство компаний обрабатывают хотя бы часть данных на самом устройстве. И, возможно, поэтому споры о безопасности использования голосовых-помощников несколько утихли: если ваш голос не покидает устройство, то никто не узнает, как он звучит и не сможет использовать его в собственных целях. Но, на самом деле, ситуация если и изменилась, то незначительно.
Данные всё равно собирают, но только в текстовом формате. После того, как специальная программа обработает данные локально на устройстве, последнее отправит стенограмму на сервер, где её расшифруют и сформируют ответ.
Только для сравнительно небольшого количества простейших команд, таких как «заведи будильник на 7 утра» или «позвони маме» не требуется интернет соединение. В этом случае никто никаких стенограмм никому отправлять не будет.
В чём же тогда проблема?
Облако и есть проблема. Данные в безопасности, пока они хранятся локально на устройстве (по крайней мере, в большей безопасности чем на внешнем сервере): никто кроме вас не имеет к ним доступ, тогда как к облаку имеет доступ значительно большее число людей.
В том редком случае если злоумышленники всё же получат доступ к устройству, то они завладеют данными только одного пользователя. А в случае атаки или утечки данных с облачного сервиса данные миллионов пользователей могут быть скомпрометированы.
Фактор ошибки
Если вы не отключили функцию «активации по ключевому слову», то голосовые помощники будут слушать вас постоянно. Они впадут в своего рода «спячку» в ожидании ключевого слова или фразы. «Привет, Siri!» или это был «Питер»? Или кто-то просто застегнул молнию? Можно найти множество свидетельств тому, как голосовые помощники по ошибке принимают за ключевые слова обрывки фраз: из телевизионной передачи, из дружеской беседы, из выступления депутата в британском парламенте... Всё сказанное после ключевого слова считается командой. Даже если вы не хотели обращаться к голосовому помощнику, он всё равно будет слушать.
Проблема №2. Компании позволяют сотрудникам «подслушивать» ваши разговоры
Если вы разрешили вашему голосовому помощнику вас слушать, то будьте готовы к тому, что в курсе ваших дел будет не только он.
Чтобы понять, насколько адекватно голосовые помощники отвечают своим владельцам, компании нанимают экспертов-лингвистов, которые слушают записи разговоров между вами и вашим ассистентом.
Да, они это делают с вашего согласия. Да, они анализируют лишь малую часть того, что было записано. Да, данные обезличены. Но, во-первых, как мы помним, никто не застрахован от ошибок. Ранее мы писали о том, что Apple продолжала записывать разговоры пользователей с Siri несмотря на запрет это делать. А с учётом того, что около 1000 слов и выражений могут быть истолкованы различными голосовыми помощниками как «ключевые слова», ошибиться действительно есть где. Записи, которые попадают в руки к эксперту, могут содержать самую разнообразную информацию: семейные ссоры, разговор между доктором и пациентом, деловые переговоры, сделки с наркотиками, подробности интимной семейной жизни и так далее.
Во-вторых, информация обезличена только в минимальной степени требуемой законом. Эти записи дополнены данными о местонахождении пользователей, их контактными данными и информацией от приложения. Любой человек, у которого возникнет желание идентифицировать пользователя на основе этих данных, сможет это сделать.
Сам факт того, что чужие люди могут слушать ваши разговоры, делает вас уязвимым. А если вы доктор, то дело обстоит ещё хуже — вы можете ненароком нарушить конфиденциальность пациента. Представим ситуацию: вы — психотерапевт и вы запретили своему голосовому помощнику записывать голосовые данные. Но в результате сбоя в системе ваш разговор с пациентом был записан и попал к экспертам речевого анализа. Или, возможно, вы разрешили записывать свой голос, так как вы думали, что помощник запишет только лишь ваши команды — но тот ослышался и включил запись во время консультации. Кто в этом случае виноват в нарушении конфиденциальности?
С учетом вероятности «ложных срабатываний» вы вынуждены переживать, не попала ли та информация, которой вы по секрету поделились со своим лучшим другом, в чужие руки. И всё это только лишь потому, что вы когда-то купили телефон со встроенным голосовым помощником.
Проблема №3. Если они захотят узнать о вас больше — они узнают, и не только они
Даже если ваши записи не стали частью данных, отправляемых на речевой анализ, они все равно хранятся на серверах. Apple хранит стенограммы того, что вы диктуете Siri, если не указано иное. Microsoft оставляет за собой право доступа к стенограммам без вашего согласия. Amazon хранит большой массив аудиоданных на каждого пользователя. Так, журналист Reuters обнаружил, что Alexa за 4 года передала Amazon 90,000 записей бесед с голосовым помощником его и его близких. Если вы хотите запросить у Amazon досье на вас, на сайте компании есть подробная инструкция, как это сделать.
И если записи случайных звуков не имеют коммерческой ценности, то записи ваших реальных разговоров с голосовыми помощниками имеют. Все компании хотят знать, чем вы интересуетесь — но некоторые хотят этого больше, чем другие. Что вы ищете в интернете, что вы покупаете, какие каналы смотрите, как проводите своё время и прочее — всё это монетизируемые данные. Для некоторых соблазн получить к ним доступ может оказаться слишком велик.
Помимо этого, существуют и другие лица, охотные до ваших данных. Речь идёт о хакерах и правоохранительных органах, а также о хакерах, которые представляются полицейскими. Последние могут запросить ваши данные у Apple и Meta в мошеннических целях. Личные данные могут «утечь» в сеть, их могут запросить сотрудники разведывательного аппарата. А как мы помним, данные, которые собирают голосовые помощники, часто содержать личную информацию, которую вам бы не хотелось раскрывать ни при каких условиях.
К слову об утечке данных: согласно прошлогоднему расследованию портала Wired Amazon собрала такой большой массив данных, что едва ли в состоянии им управлять: по словам источников внутри компании, в Amazon зачастую не знают, где хранятся пользовательские данные, и поэтому не могут выявить потенциальные утечки данных.
Проблема №4: Не всё может быть удалено
Также Amazon не может с точностью сказать, удалены ли данные по вашему запросу или нет. Вы можете запросить логи вашего взаимодействия с голосовыми помощниками и попросить компанию их удалить. Это способ применим к большинству голосовых помощников, в том числе Alexa, Cortana и Google Assistant. Что касается Siri, то Apple не пришлёт вам логи и не удалит данные старше 6 месяцев. Через 6 месяцев ваши данные отвязываются от случайного идентификатора устройства, и могут быть использованы Apple для улучшения функции распознавания речи. Но если компания согласилась удалить данные, она их удалит, так?
Когда вы запрашиваете логи ваших взаимодействий с голосовыми помощниками, вы ждёте, что компания удалит очередь обработанных запросов, которые связаны с вашим ID и соответственно с вами. Но на другой стороне вашего запроса — на стороне того, кто его обрабатывает — сохраняется информация о вас. Как минимум, в системе сохраняются логи выполнения запросов: поисковых запросов, запросов к музыкальному сервису, к продуктовому сервису и т.д.
Кроме того, компании часто ведут статистику пользовательских запросов. Они собирают метрики, чтобы определить интересы пользователей — что чаще всего ищут, какую музыку слушают, какими сервисами пользуются. Вспомним «Год в истории поиска» от Google . Эти данные представлены в агрегированном виде, но это не значит, что они не несут угрозу для конфиденциальности пользователей. Несмотря на то, что эти данные обезличены, то есть отвязаны от конкретного человека и его идентификатора, запросы к голосовым помощникам могут содержать полные имена, адреса, род занятий и т.д. Стенограммы удалены? Да, но тот факт, что кто-то заказывает такси из бара к вам домой каждую пятницу остаётся.
Мы не можем быть на 100% уверены, что компания удалит всё, о чём мы её попросим. И у не будет доказательств. Мораль истории такова: доверять или нет — мы выбираем сами.
Вы можете контролировать свои данные
Компании не откажутся от сбора информации о вас по щелчку пальца. Чем больше они знают, тем больше они могут заработать, продавая эти данные рекламодателям. Чем больше рекламодатели знают о вас, тем легче вам навязать услуги или продукты. Не нужно питать иллюзий, что корпорации внезапно перейдут на сторону добра и защиты данных. Самое лучшее, что вы можете сделать в данной ситуации — это быть в курсе возможных рисков.
Необязательно выбрасывать все электронные устройства в мусорный бак. Вы можете попытаться снизить риски, например, запросив свои данные и попросив компании удалить их. Также вы можете выключать голосовой помощник во время личных бесед и попросить своих друзей следовать вашему примеру.
Помимо этого, вы можете настроить звуковые оповещения о начале работы голосового помощника. Убедитесь, что вы используете надёжный пароль и двухфакторную аутентификацию. Если у вас есть ребёнок, то используйте PIN-код или отключите покупки голосом, если вы, конечно, не хотите, чтобы ваш четырёхлетний малыш заказал себе полный магазин игрушек.
Если вы готовы поступиться своим комфортом, вы можете отключить микрофон своего голосового помощника — в этом случае он не будет активироваться по ключевому слову, и его придется каждый раз включать вручную.
Или вы, наоборот, можете оставить микрофон включённым: кто знает, возможно однажды ваш голосовой помощник обеспечит вам алиби.
Кроме этого, вам следует внимательно ознакомиться с политикой конфиденциальности и выбрать устройство той компании, которая заботиться о защите данных в наибольшей мере. Возможно, вы выберете компанию, которая открыто заявляет, что не передаёт данные третьим сторонам. Или ту, которая не хранит информацию на серверах. Также вы можете прочитать отзывы и материалы в СМИ и выяснить, была ли компания, которой вы собираетесь доверить свои данные, замечена в утечке пользовательских данных.
В любом случае, вы не сможете исключить все риски для вашей конфиденциальности, связанные с использованием голосовых помощников. Лучшее, что вы можете сделать, это взвесить все за и против и решить для себя, действительно ли вы не можете без них обойтись.
Что бы вы не решили, ваш выбор будет информированным.
b