Alexa如何收听唤醒词

Alexa在一张讲话泡泡的桌子上写着:“你说Alexa了吗?”

Alexa总是在听,但没有连续录音。 它不会向云服务器发送任何内容,直到它听到您说出唤醒字(Alexa,Echo或计算机)。 但是听取醒来的Discourse比你想象的要难。

echo硬件不是那么聪明。 没有互联网,您提出的任何要求或问题都将失败。 这是因为您的命令被发送到云端以进行解释和决策。 亚马逊不希望记录智能扬声器前面的每个对话,而只需要记录智能扬声器的命令。 出于这个原因,该公司采用唤醒字来引起智能音箱的注意。 为实现这一目标,亚马逊使用微调麦克风,短暂内存缓冲和神经网络训练的组合。

微调麦克风精确定位您的声音

亚马逊Echo dot 3采用浅蓝色LED环亮起。
浅蓝色LED将始终面向您的声音方向。 亚马逊

语音助手扬声器,如Echo和Echo Dot,通常有多个内置麦克风。 例如,Echo Dot有七个。 该阵列为设备提供了多种功能,从远处的听觉命令到分离背景噪音和声音。

后者对唤醒字检测特别有用。 使用多个麦克风,Echo可以精确定位您所在位置的位置,并在忽略房间的其他部分时向该方向倾听。

无论何时使用唤醒词,您都会看到这一点。 站在Echo或Echo Dot旁边说出唤醒词。 请注意,戒指以深蓝色亮起,然后呈浅蓝色,因为它会旋转并“指向”您。 现在,向侧面移动几个步骤并再次说出唤醒字。 请注意,浅蓝色灯跟着你。

了解自己的位置,可以帮助设备更好地关注您,并调出来自其他地方的噪音

短暂记忆使扬声器不会太多

echo设备有足够的存储空间,但它们不会使用太多存储空间。 根据亚马逊副总裁兼Alexa人工智能主管科学家Rohit Prasad的说法,Echo 只能存储几秒钟的音频

通过降低其功能,亚马逊不仅可以为您提供更多隐私(它可以减少您的语音存储空间),还可以防止Echo收听整个会话,从而将重点放在查找唤醒词上。

想象一下,你有一个三秒钟的录音带和一台录音机。 假设在它结束之后,磁带一遍又一遍地绕回到开头。 如果您开始录制对话,那么您在四秒钟前说的所有内容都将被擦除并立即录制完毕。 这就是Amazon Echo所做的。

它连续记录,但同时擦除它刚录制的所有内容。 那短暂的注意力意味着它所能听到的只是“Alexa”这个词,而不是更多。 但是,三秒钟足以让该词被记录,检查并适当地采取行动。

神经网络训练有助于模式匹配

亚马逊算法层的流程图。
亚马逊算法使用的图层的表示。 亚马逊

最后,亚马逊依靠神经网络训练来教Echo如何模式匹配。 与其他形式的机器学习非常相似,亚马逊通过在Alexa(或计算机或Echo,取决于公司正在训练的唤醒词)的实例之后提供实例来训练其算法

相关: 什么是算法,为什么它们让人不舒服?

这个想法是涵盖每一个变形和重音,也包括背景。 亚马逊希望你的Echo能够在你谈话时,当你谈论它时,或者,当你和一个名叫Alexa的谈话时,认识到这种差异。 定向麦克风也有助于实现这一目标。

随着Echo听到的每一个字,它通过多层算法运行音频。 每一层都旨在排除误报,寻找声音相似或上下文线索。 如果一层检查通过,则单词转到下一个。 最后,当本地设备确定它确实听到唤醒字时,它开始记录并将音频传递给亚马逊的云服务器。 亚马逊采用了四种算法:一种用于每个唤醒词(Alexa,计算机,Echo),另一种用于Alexa Guard,它可以处理特定声音,例如玻璃碎片,如唤醒词。

但即使发生匹配,亚马逊仍然会进行更复杂的检查。 您是否注意到当某人在电视节目或商业广告中说出Alexa这个词时,它通常不会引起您的Echo的回复? 那是因为亚马逊也进行了云检查。

云检查排除了一些误报

Alexa商人盯着他点燃的Echo牙刷。
这个搞笑的Alexa商业广告不会唤醒你的Echo。 亚马逊

当公司制作具有Alexa功能的商业广告时,他们可以将音频提交给亚马逊 该公司通过用于识别唤醒字的类似模式匹配算法来运行音频。 一旦完全编目了该确切的实例,就将其添加到数据库中。

作为接触云的过程的一部分,您的Echo包含有关其听到的唤醒字的信息并检查该数据库。 每当发现匹配时,亚马逊会指示您的Echo忽略唤醒字,关闭并丢弃任何录制的音频。

此外,亚马逊会检查同时说出的唤醒词的实例。 并非每家公司都向亚马逊提交音频,因此该公司提出了一种新颖的备份解决方案。 在检查数据库匹配后,公司将唤醒字印记与同时进入的任何其他实例进行比较。 两个同时说Alexa听起来完全相同的人不太可能,所以如果有匹配,亚马逊知道它可能是商业或电视节目而忽略了请求。

尽管进行了所有检查,仍然会发生误报。 你可以听听你的Echo亚马逊的隐私中心 录制 的内容 ,你可能会发现至少有一个误报。 但是这项技术正在不断改进,最终,亚马逊希望它能够在没有任何唤醒词的情况下运行。

赞 (0)
分享到:更多 ()