阿里达摩院创全球新纪录：AI「读图会意」首次超越人类-阿里达摩院，新纪录，AI「读图会意」|AI-鹿科技

　　原标题：阿里达摩院创全球新纪录：AI「读图会意」首次超越人类

　　从阿里云官方获悉，近日，国际权威机器视觉问答榜单 VQA Leaderboard 出现关键突破，阿里巴巴达摩院以 81.26% 的准确率创造了新纪录，让 AI 在「读图会意」上首次超越人类基准。

　　近 10 年来，AI 技术保持高速发展。然而在视觉问答 VQA（Visual Question Answering）这一涉及视觉-文本多模态理解的高阶认知任务上，AI 始终未取得超越人类水平的突破。

　　自然语言技术与计算机视觉交融，是多模态领域重要的前沿研究方向。其中，VQA 是 AI 领域难度最高的挑战之一，对研发通用 AI 具有重要意义。

　　VQA 的任务是根据给定图片及自然语言问题，生成正确的自然语言回答。

　　例如下面这张图，图中玩具人的 IP 出自哪部电影？AI 先提取了问题关键信息——玩具人；再根据常识做出回答——星球大战。

　　在首届 VQA 挑战赛上，AI 的最高准确率仅能达到 55%。今年 8 月，达摩院以 81.26% 的准确率创造 VQA Leaderboard 全球纪录，首次超越人类基准线 80.83%。

　　这是 VQA 测试以来，AI 第一次超过人类水平，是标志性的重大突破。