阿里达摩院创全球新纪录:AI「读图会意」首次超越人类
2021-08-14 12:25:52 时寒峰

  原标题:阿里达摩院创全球新纪录:AI「读图会意」首次超越人类

 

  从阿里云官方获悉,近日,国际权威机器视觉问答榜单 VQA Leaderboard 出现关键突破,阿里巴巴达摩院以 81.26% 的准确率创造了新纪录,让 AI 在「读图会意」上首次超越人类基准。

 

  近 10 年来,AI 技术保持高速发展。然而在视觉问答 VQA(Visual Question Answering)这一涉及视觉-文本多模态理解的高阶认知任务上,AI 始终未取得超越人类水平的突破。


  自然语言技术与计算机视觉交融,是多模态领域重要的前沿研究方向。其中,VQA 是 AI 领域难度最高的挑战之一,对研发通用 AI 具有重要意义。

 

  VQA 的任务是根据给定图片及自然语言问题,生成正确的自然语言回答。

 

  例如下面这张图,图中玩具人的 IP 出自哪部电影?AI 先提取了问题关键信息——玩具人;再根据常识做出回答——星球大战。

 

  在首届 VQA 挑战赛上,AI 的最高准确率仅能达到 55%。今年 8 月,达摩院以 81.26% 的准确率创造 VQA Leaderboard 全球纪录,首次超越人类基准线 80.83%。

 

  这是 VQA 测试以来,AI 第一次超过人类水平,是标志性的重大突破。

投稿:lukejiwang@163.com
点击展开全文
Copyright © 2002-2024 鹿科技