您现在的位置是:首页 >互联网 > 2020-11-02 14:00:46 来源:

在GPU加速的数据库上进行现实检查

导读 图形处理单元加速的数据库市场已将自己确立为一个重要的新兴市场。但是,尚不清楚GPU加速的数据库是否或何时进入主流企业数据库管理系统。

图形处理单元加速的数据库市场已将自己确立为一个重要的新兴市场。但是,尚不清楚GPU加速的数据库是否或何时进入主流企业数据库管理系统。

尽管GPU近年来已在数据库体系结构方面取得了一些进展,但它们似乎不太可能脱离特定于应用程序的协处理器存储区,并解决大多数组织使用数据库管理系统的核心事务处理工作负载。

这是因为GPU不适合加速无法并行化,不涉及浮点数和其他数字处理的数据库操作,或者需要大量数据在系统总线之间来回移动的数据库。主要的中央处理单元。

商业GPU优化的数据库已经将自己确立为一个有前途的利基市场,主要来自专注于加速数据分析应用程序的创业公司,而这是一个非常拥挤的利基市场。例如:

Brytlyt的GPU加速分析数据库可以在几秒钟内经济高效地查询数十亿行数据集。

BlazingDB的GPU加速数据库可以对海量数据集运行快速,简单的SQL查询。

Kinetica的平台可以在数十亿行中执行标准的SQL查询(以微秒为单位),同时可视化结果,执行机器学习模型并提取大量流数据。

OmniSci的平台将SQL查询编译为可以在Nvidia Corp. GPU,Intel Corp. X86或IBM Corp. Power CPU上运行的机器代码。

SQream的GPU加速列式数据库几乎实时处理了数万亿行。

值得注意的是,没有一家领先的企业级DBMS提供商进入GPU加速数据库市场。他们中的大多数人都与Nvidia合作, 以GPU加速其云和本地解决方案组合中的AI工作负载。一些与GPU数据库利基公司合作的合作伙伴 ,还整合了这些合作伙伴的产品,作为分析密集型数据库内工作负载(如数据仓库和AI)的加速器。

GPU作为企业数据库中的分析协处理器非常有意义。实际上,您可以像在最近的博客中讨论的Oracle产品经理一样,在GPU上运行一些企业数据库工作负载。通过这样做,您将获得更快的分析处理速度,并通过合并列式,内​​存中,单实例多数据,智能缓存,高带宽服务器内存和其他复杂功能,提高数据库性能,超出供应商可能已经设计的性能。技术应用于基于CPU的处理。

即便如此,GPU显然在图像处理和AI中脱颖而出。CPU经过优化,可以对大量数据执行少量的简单计算,而GPU擅长并行化大量数据的计算。GPU非常适合用于加速深度学习(重复的矩阵计算以从处理的每个数据集中提取见解)和成像(每个处理的图像数百万个矢量计算)的加速。这就解释了为什么在最近的这篇文章中,对GPU的未来需求可能来自需要将成像与数据驱动的情报进行高性能融合的沉浸式AI应用程序。

GPU数据库市场的未来在于很大程度上不在RDBMS范围内的数据平台:区块链。相对少量的数据进行高度并行计算就是区块链的全部意义所在–特别是它是区块链共识协议的基础。实际上,GPU数据库供应商已经将他们的解决方案出售给了加密货币挖掘市场,以处理这些以及其他以区块链为中心的工作负载。

区块链+深度学习+交互式成像

如果GPU优化的数据库市场希望突破其利基市场,那么很可能会受到对结合了区块链,深度学习和交互式图像的应用程序的需求的驱动。那可能是什么?

一种可能性是视频流市场中的区块链服务。正如我几个月前所讨论的,初创公司进入流媒体市场的目的是打破Netflix Inc.,YouTube和其他备受关注的内容看门 人的束缚, 他们将视频和其他流媒体娱乐过度分配给多设备,多渠道的最终用户,在世界上。这些初创企业中的大多数都试图通过构建对等媒体环境来拉平视频流市场,其中没有中央服务器来存储和管理内容。

这些创业公司的共同点是使用区块链作为以下所有功能的基础平台:视频存储,分发和治理。据我所知,没有人将基于AI的视频处理作为一项整体或扩展功能提供,但这似乎是有前途的下一步,以开发可能赚钱的新服务。这些AI功能-除了一些基于区块链的加密货币(发行商,查看者和其他生态系统参与者之间有数种付款方式)之外-似乎是为GPU加速数据库量身定制的。

但目前尚不清楚GPU数据库提供商是否正在探索这种机会。对于它们中的大多数,最可能的增长途径将是混合数据环境中的高性能查询加速器。