您现在的位置是：首页 >综合 > 2021-04-25 21:35:36 来源：

亚马逊的研究人员提高了Alexa理解复杂命令的能力

导读亚马逊的Alexa在一次性理解多步骤请求方面变得越来越精通。在一篇论文(口语协调的解析协调)和今天早上发表的随附博客文章中，Alexa AI组织

亚马逊的Alexa在一次性理解多步骤请求方面变得越来越精通。在一篇论文(“口语协调的解析协调”)和今天早上发表的随附博客文章中，Alexa AI组织的应用科学家Sanchit Agarwal详细介绍了一种将语音命令映射到行为的口语理解(SLU)系统(意图)和实体(插槽)比现成的替代品准确度高26%%。

Agarwal及其同事的工作将在本月晚些时候在希腊雅典举行的IEEE口语技术会议上展出。亚马逊科学家描述了一种可以将Alexa的技能选择错误率降低40%%的AI驱动方法，这一天他们的研究消息传来。

“狭义[SLU系统]通常有严格的约束，例如只允许一个意图与话语相关联，只有一个值与一个插槽类型相关联，”他写道。“我们[建议]一种方法，使SLU系统能够理解复合实体和意图。”

正如Agarwal解释的那样，他和同事们使用了一个深层神经网络 - 称为神经元的数学函数层，它们的生物学等价物是松散的模型 - 从口语数据的结构中“教导”。首先，根据指示应被视为集合的词组或“块”的方案来标记语料库：“B”表示块的开头，“I”表示块的内部，或者“O”表示位于大块之外的单词。然后，在训练之前，单词进行嵌入，这个过程涉及用向量代替它们来代表它们。

接下来将嵌入传递给双向长短期记忆(bi-LSTM)网络，这是一种能够学习长期依赖性的递归神经网络，其输出输入句子中每个单词的上下文嵌入。这些输出与神经网络层相结合，神经网络层将每个嵌入映射到输出“B”，“I”和“O”标签上的分布，根据其最可能的输出标签对输入的每个字进行分类。

另一个层(称为条件随机字段或CRF)学会了在输出标签之间进行关联，并从所有可能的序列中选择最可能的标签。感谢一种称为对抗性训练的技术 - 在此期间，网络被评估其预测标签的好坏程度 - 该模型学会了概括。

“我们不是为不同的插槽类型(例如ListItem，FoodItem，Appliance等)构建单独的解析器，而是构建了一个可以处理多种插槽类型的解析器，”Agarwal说。“例如，我们的解析器可以成功识别话语中的[列表项目]'将苹果花生酱和果冻添加到我的列表中'和[电器]在话语'打开客厅灯和厨房灯'。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：