您现在的位置是:首页 >生活 > 2021-04-17 09:44:20 来源:

品牌将视觉智能视为人工智能战略的关键部分

导读 自从神经网络在2012年重新开始复兴以来,计算机视觉一直是人工智能研究人员研究和创新的成熟领域,也是企业应用人工智能的一个富有成效的领

自从神经网络在2012年重新开始复兴以来,计算机视觉一直是人工智能研究人员研究和创新的成熟领域,也是企业应用人工智能的一个富有成效的领域。深度学习可实现令人难以置信的机器视觉功能,例如在人类奇偶校验中对图像主体进行分类并动态生成全新的图像。

品牌将视觉智能视为人工智能战略的关键部分

品牌很快将这项技术视为商业资产。Clarifai是一家领先的计算机视觉公司,拥有流行的视觉智能API,最近用于分析棒球比赛期间数百张球迷的照片,以确定他们何时接球。然后,洞察力被覆盖在体育场座位图上,以显示希望带回家纪念品捕获的粉丝的最高概率席位。从业务角度来看,此类数据可以推动更有效的分层定价。

同样的技术同样适用于暴雪娱乐公司制作的流行纸牌游戏“炉石传说”。通过观看多轮比赛,AI学习了游戏的牌和策略,并可以提供逐个游戏的评论。在黑客马拉松期间,开发人员将Clarifai的可视化API用于另一个目的:Tinder刷卡。这些算法学会了其中一个开发人员的偏好并接管了为他扫描的费力行为。

“这里的共同主题是定制,”Clarifai创始人兼首席执行官Matthew Zeiler解释道。“无论你想要识别什么,你都可以教平台,这一直适用于大公司。”事实上,许多寻求更快的照片搜索和分类方法的大公司都在注意。数字媒体巨头BuzzFeed采用了视觉智能,以帮助编辑找到相关的文章照片。另一个Clarifai的客户,“自然美”的支持者,使用视觉智能来识别来自未穿着化妆品的时尚女性的社交媒体的例子,体现了他们的品牌信息。

Zeiler和他在Clarifai的团队并不是唯一一个依赖视觉智能潜力的人。Google,IBM,Salesforce和Microsoft等主要厂商以及GumGum和Ditto等小型企业都提供计算机视觉解决方案。例如,Google Cloud Vision API使用户可以轻松整理存储的照片。亚马逊的版本Rekognition面向希望为应用添加面部识别安全性或记录观众人口统计数据的开发人员。GumGum的优惠针对的是有兴趣使用社交媒体帖子在线监控品牌代表或从体育赛事视频中计算获得的媒体的公司。Zeiler表示,视觉识别的一大承诺是“下一级分析,展示您的产品如何在世界范围内使用”。

挑战仍然存在,尤其是品牌数据。例如,许多零售商都有针对白色背景的产品目录照片。虽然可以训练算法以在消毒条件下识别这些产品,但是在真实场景中识别相同的鞋将需要更多的训练数据。Zeiler表示,未来的关键是“它不会是收集这些数据的AI专家 - 它将成为地球上的每个人。”为了促进这一点,他和他的团队正在使他们的技术广泛采用和用户 - 尽可能友好地“让每个人都互动”。

另一个挑战是缺乏高分辨率图像,这对某些应用至关重要。许多品牌都在呼吁人工智能解决方案进行自动伪造检测。假冒产品和真品之间的差异往往非常微妙,例如钱包扣或鞋带上的轻微变化,并且在低分辨率照片中可能无法检测到。很多时候,人眼检测到的差异甚至很难。

Zeiler还认为,多模态神经网络 - 即可以并行处理多种不同媒体类型的网络,如音频,视频和文本 - 是下一个需要关注的创新。“融合多种数据类型很困难,”他指出,“多功能神经网络的表现不如单一数据。”但是,同时分析产品的多个方面具有非凡的价值,例如:图像,描述,价格,用户评论以及用户生成的图像和视频。Zeiler希望一次处理多达10种模态。

虽然科技巨头一直在抢购像Orbeus,Alchemy和MetaMind这样的AI创业公司以赶上AI战争,但Zeiler认为对客户需求的专注承诺将帮助Clarifai保持竞争优势。“谷歌生产互联网气球,自动驾驶汽车,文字处理器,电子邮件客户端,当然还有搜索和广告产品。如此多的部门,他们与客户竞争。“如果广告客户将其专有数据视为关键的防御优势,他们可能会犹豫是否将这些数据发送到Google的云端。同样,亚马逊可以从其他零售商的数据中学习并直接与他们竞争。

“Twilio是独立的通讯公司。Stripe是独立支付公司。Spotify是一家独立的音乐公司。我们相信Clarifai将成为独立的视觉公司,“Zeiler总结道。