您现在的位置是:首页 >互联网 > 2020-10-15 14:03:06 来源:

Google开源Tapas这是一种用于分析关系数据的自然语言AI

导读 Google LLC已经发布了Tapas的代码,Tapas是一种内部开发的人工智能,可以处理诸如最新iPhone的名称是什么?之类的自然语言问题。并从关系数

Google LLC已经发布了Tapas的代码,Tapas是一种内部开发的人工智能,可以处理诸如“最新iPhone的名称是什么?”之类的自然语言问题。并从关系数据库或电子表格中获取答案。

这家搜索巨头的研究人员在周四详细介绍了人工智能。Tapas基于BERT,这是Google在其搜索引擎中使用的自然语言处理技术。

世界信息的很大一部分是关系性的,也就是说组织成行和列。从历史上看,从这些行和列进行导航需要手动筛选电子表格或编写SQL查询。自然语言处理使用户的工作变得相当轻松,这就是为什么该技术已被Google和分析市场中的其他参与者广泛采用的原因。

这家搜索巨头表示,Tapas击败或匹配了三种用于解析关系数据的顶级开源算法。Google用Wikipedia的英语版在620万张桌子上训练了AI,然后将其设置为可用于三组学术数据集。基准测试表明,在所有三个数据集中,神经网络提供的答案都比竞争对手的算法准确或可比。

在后台,Tapas采用了Google搜索中使用的BERT自然语言处理技术的变体。BERT提供了比传统方法更高的准确性,因为它使AI不仅可以像通常那样从左到右或从右到左评估文本序列,而且可以同时执行。Google为Tapas实现的版本使AI不仅可以考虑用户提出的问题和他们希望查询的数据,还可以考虑存储数据的关系表的结构。

提高的准确性只是Google吹捧的优势之一。“与创建仅适用于单一样式表的模型不同,这种方法所产生的模型可以应用于来自广泛领域的表,”研究了Tapas的Google Research软件工程师ThomasMüller说道,在博客文章中有详细介绍。

此外,Tapas不仅可以获取数据,还可以执行基本计算。例如,如果评估销售数据的业务用户要求获得公司三种最受欢迎​​产品的平均收入,则AI可以计算出答案。

Tapas可能会在Google的某些产品中找到用途。例如,搜索巨头可能会使用该模型来增强其表格电子表格编辑器,该表格已经通过其“浏览”功能提供了有限的自然语言查询选项。Tapas从大型数据存储库中提取特定项目的能力也可能有助于改进Google Assistant的问答功能。