你对 Alexa 说的每一句话,都会成为 AI 的训练材料,而且选择权并不在你手上
拥有语音助手是不是很方便?您可以一边做正事,一边把琐碎的小事交给它,比如设置计时器、创建提醒、添加购物清单项目,或快速获取信息。
而且最近助手变得越来越聪明。Alexa 甚至学会了模仿已故亲人的声音 。这是一个备受争议的功能,不论从伦理还是隐私的角度看都引发了广泛讨论。随着生成式 AI 的兴起,语音助手正变得更加先进,对每位用户提供更个性化的体验,同时也带来了新的隐私问题。
此前,人们对这些不断增加的担忧还有一定的“安慰”机制:语音数据可以在本地设备上处理,您也可以选择不将语音数据发送到 Amazon 服务器上。但从 2025 年 3 月 28 日起,Amazon 已经取消了多个 Echo 设备中的「禁止发送语音记录」选项,包括第四代 Echo Dot、Echo Show 10 和 Echo Show 15。这意味着,从现在开始,所有的语音命令,也就是 Echo 听到的几乎一切,都将被传输到 Amazon 的云端处理。
据 Amazon 称,这一更改是为了支持 Alexa 新的生成式 AI 功能。语音数据将用于训练 Amazon 在 2025 年初推出的下一代语音助手 Alexa+。
隐私问题
虽然 Amazon 声称语音记录经过加密并会在处理完成后删除,但此次更新仍再次引发了用户对隐私的担忧。我们之前已经详细讨论过这些问题,但随着情况的发展,这里有必要重新审视一些核心问题。
问题一:数据泄露
此前,语音数据大多存储在用户设备本地,即使发生泄露,风险也仅限于用户的个人硬件。但现在,所有数据都必须发送至 Amazon 服务器上,完全无法在本地处理。
这大大提高了泄露风险,使得原本只是设备级别的隐患,升级为集中式云端漏洞。一旦云端被攻破,可能泄露的就是数百万用户的数据。
问题二:可能真的有人在听
Alexa 的 AI 功能如何实现?是否完全由算法自动完成?是否有人类介入?这并非杞人忧天,早在 2019 年,就有报道指出,成千上万的 Amazon 员工可以访问并监听用户的 Alexa 语音记录,以“进一步改进服务”。
“我们只对极少数的 Alexa 语音记录进行人工标注,以提升用户体验。例如,这些信息有助于我们训练语音识别和自然语言理解系统,让 Alexa 更好地理解您的请求,并确保服务顺畅运行。”
– Amazon 发言人
如今 Alexa+ 要利用更多的数据支持生成式 AI 功能,我们无法确定人类审核机制是被削减了,还是进一步扩大了。
问题三:数据删除
上传到云端的数据真的会消失吗?Amazon 表示您可以掌控这一切,只要您仍保持默认状态(不保存语音记录),他们就会在 Alexa 处理完成后删除您的语音数据。以下是 Amazon 发送给相关 Echo 用户邮件中的原话:
如果不做任何设置更改,您的 Alexa 设置将自动更新为“不保存语音记录”。这意味着,从 3 月 28 日开始,您的语音记录将被发送至云端处理,Alexa 完成处理后将会删除这些数据。此前保存的语音记录也将一并删除。
不过,问题在于,处理什么时候算结束?“用于算法训练的处理”到底包含哪些环节?用户又如何确认所有数据在“处理完成后”确实被彻底删除了?
总结
归根结底,大公司不仅仅是在“收集”个人数据,他们是靠数据生存的。随着生成式 AI 成为科技领域的新战场,您的声音、习惯和日常互动比以往任何时候都更有价值。那些曾经只在厨房里轻声说出的私人命令,如今却成了训练强大机器学习模型的素材。
而且,Amazon 并不是唯一家走这条路的公司,几乎每一家科技巨头都在争相获取更多用户数据,以“改进 AI”。但对于我们用户来说,代价到底是什么?云端看不见摸不着,但您与之分享的内容,其后果却真实存在。
当然,我们不是在建议大家彻底避开所有数字服务,那显然不现实。但是否信任某家公司处理个人数据,最终是您自己的选择。我们的目标只是提供信息,让您在做决定时能更清楚、也更谨慎。在这个便利常常以隐私为代价的时代,了解真相比任何时候都更重要。