您现在的位置是:首页 >综合 > 2021-05-04 21:07:02 来源:

ABBYY推出了支持63种语言的人工智能实时识别SDK

导读 计算机视觉在过去几年中发展迅速。从Word Lens到Google Goggles,在任何设备上快速识别文本和对象的能力与扫描文档和耗时的OCR相差甚远。

计算机视觉在过去几年中发展迅速。从Word Lens到Google Goggles,在任何设备上快速识别文本和对象的能力与扫描文档和耗时的OCR相差甚远。

ABBYY推出了支持63种语言的人工智能实时识别SDK

文档和内容捕获公司 ABBYY 今天宣布发布其新的实时识别SDK(RTR SDK),该SDK承诺将文本捕获提升到一个新的水平。

我在伦敦的AI Europe期间看到了解决方案,总而言之 - 令人印象深刻。

利用智能手机相机的直播视频,该解决方案可以即时从最复杂的文档和对象中提取文本和数据。例如,如果您正在开发一个要求用户提供护照数据的应用程序,ABBYY的RTR SDK允许您直接从护照中即时捕获所有文档详细信息。

当ABBYY声称它实时工作时,没有错。我目睹了该解决方案立即从ID,银行对账单,驾驶执照等中获取信息。更令人印象深刻的是,它可以用63种语言实现这一目标 - 这一数字使谷歌目前的图像翻译语言名单相形见绌。

“通过实时识别,应用程序用户可以毫不费力地从打印来源,文档和银行卡输入数据,”ABBYY的首席营销官Jupp Stoepetie告诉我。“换句话说,实时识别可以改变移动用户体验和客户与品牌之间的互动。”

SDK可帮助开发人员即时将实际文档数据合并到他们的应用程序中。

“实际上,任何需要从打印源输入数据的应用程序都可以从更快,更准确,更轻松的文本识别和分类中受益,”Stoepetie说。“实时识别SDK集成到金融,保险,物流,电子商务,消费者或政府应用程序中,可显着加快复杂的身份识别,注册或入职流程,例如开立账户,申请贷款或输入银行卡信息,IBAN或促销代码。“

重要的是,它没有任何安全隐患。

“该技术非常适合需要遵守安全和隐私规则的流程,因为没有图像发送到服务器或存储在设备上,”Stoepetie说。

那么RTR SDK的下一步是什么,以及应用程序开发人员对未来功能集的期望是什么?

“目前,我们正在与神经网络合作,以进一步提高识别的准确性,”Stoepetie说。“我们也正在研究新的AI芯片在移动设备中提供的机会。Apple iPhone的神经引擎,华为Mate 10的神经处理单元以及其他新一代移动处理器为设备AI和机器学习提供动力,与我们的设备上智能捕获技术相结合,可根据用户的反馈持续改进“。

ABBYY实时识别SDK可用于从今天开始集成到iOS和Android应用程序的新应用程序或现有应用程序中。今天还提供开发人员工具包,支持与代码示例和快速入门指南的轻松集成。