游戏AI三大难揭秘:样本大、成本高、灵活性差
2021-06-23 23:04:41 沫小朵

  原标题:游戏AI三大难揭秘:样本大、成本高、灵活性差 

 

  继攻克围棋、《星际争霸》后,DeepMind开始瞄准手游了。
 

 

  5月初,DeepMind推出 AndroidEnv后,开始密集测试诸多手游。最新加入体验挑战的是安卓版《The Battle of Polytopia》,它由瑞典开发商Midjiwan 制作并发行,是一款回合制文明策略游戏。

 

  游戏故事背景设定在一个奇异而又平坦的“方块”星球。玩家可领导 12 个不同文明中的一个,扩张帝国、研究科技并成为整个星球的统治者来最终取得胜利。

 

  游戏拥有单人和多人模式,最多可支持 12 名玩家。

 

  目前,Midjiwan 正跟DeepMind合作,将《The Battle of Polytopia》集成到AndroidEnv中,成为后者一项常规任务。

 

  大爆炸,变革性体验要来了?

 

  “我们发现这款游戏是一个特别有趣的挑战,因为它有许多功能,如处理长期规划、不完善信息、多样化 UI 元素和非确定性。”DeepMind 评论说。

  针对本次合作,Midjiwan 总经理Christian Lövstedt则表示,DeepMind 是人工智能领域巨人般的存在,能拥有这样强大的合作伙伴,并成为平台一份子,我们感到非常自豪和兴奋。

 

  在Polytopia玩家群体中,不乏资深玩家。融入人工智能后,想必也会给玩家体验带来不一样的变化。

 

  AndroidEnv作为一个AI平台,允许AI代理在游戏中自定义任务,比如寻找公园的方向、预定航班甚至于获取最高分。

 

  AI代理主要依据屏幕上显示的图像做出决策,它能像人类一样通过触摸屏和手势进行操作。

 

  理论上,AI能够帮助开发者实现内容快速生成、自动生成剧情,乃至促进NPC智能化和多风化。

 

  以腾讯AI Lab为例。在竞技博弈AI方面,腾讯AI Lab推出了绝艺跟觉悟。前者主要涉及棋牌项目中的围棋和麻将,完成从完全信息博弈到非完全信息博弈的拓展。

 

  后者主要涉及到MOBA类手游《王者荣耀》及体育类的足球,分别在异构分布式multi-agent和更多智能体+长配合方面进行探索尝试。

 

  笔者获悉,《王者荣耀》项目组一直在尝试各种新玩法,但效果往往不尽如人意。意外的是,AI人机对战参与率极高,超过10%的玩家。

 

  这意味着,日活用户达到大几百万。官方披露的数据显示,AI觉悟挑战共吸引超过数千万玩家参与。

 

  此外,基于AI对于游戏理解的专业策略分析和声音文本的综合体现,腾讯也推出了王者荣耀虚拟主播。

 

  在美术资源方面,腾讯AI Lab涉及虚拟人和3D动作生成。据悉,内部团队正在着手尝试在动作生成方面得到更真实的游戏表现,使其适配各类动作、地形和突发情况。

 

  机遇与挑战并存

 

  看似变革性体验背后,其实需要耗费大量成本。

 

  一位兼具游戏跟AI背景的资深人士告诉笔者,AI的确可以有效提升游戏体验。掣肘在于,样本大、训练成本高。

 

  像《王者荣耀》这类大DAU,高流水竞技性产品,固然可以一试。对于中型体量产品而言,往往不太划算。

 

  一位创业游戏公司高层说,小样本模型效果不错的话,拿几千万尝试也不是没有可能。换言之,大样本模型,让企业望而却步。

 

  眼下业界常讨论AGI(通用人工智能),可产品灵活性仍是一大难题。

 

  DeepMind遇到成本、灵活性困境,无疑最具代表性。

  据估算,AlphaGo整体训练成本高达3500万美元,消耗能量足以支持12760个人类大脑在三天内不眠不休地工作。

 

  在备受关注的《星际争霸》项目上,DeepMind也遭遇了类似难题。

 

  2019年2月28日凌晨,DeepMind旗下游戏AI AlphaStar,以5比0大比分,击败了世界上最强大的职业星际争霸玩家之一。当时它被视为突破人类智力的最后阵地。

 

  通常情况下,训练AlphaStar需要使用Google v3 TPU,用以支撑数千个《星际争霸II》协同运行。

 

  AlphaStar共对战14天,每个代理使用16个TPU。在培训期间,每个智能体都经历了长达200年的实时游戏。

 

  粗略估算下来,训练成本达到数百万美元。抛开成本不谈,AlphaStar灵活性亦备受质疑。

 

  纽约大学心理学系教授Gary F. Marcus认为,上述方案限制重重。在单一地图上使用同一“种族”进行对战时,其成绩确实优于人类。

 

  不过一旦在其它地图使用不同“种族”时,表现就要差很多。要想切换操作风格,必须得从头开始重新训练AlphaStar。

 

  简言之,即系统缺乏足够的灵活性。这一特性会让DeepMind训练成本迅速放大。

 

  数据不会说谎。根据去年年底DeepMind向英国公司注册局备案提交的最新财务报告。

 

  报告显示,近三年DeepMind亏损额分别为4.77亿英镑(2019);4.702亿英镑 (2018);3.02亿英礡(2017)。

 

  营收方面,2019年DeepMind收入达2.66亿英镑;2018年达到1.03亿英镑;2017年营收为5442万英镑。

  综合近三年业绩表现,不难发现DeepMind营收确系稳步增长,亏损敞口逐步收小。不过需要指出的是,DeepMind大部分客户依赖于母公司Alphabet旗下关联公司。

  某种程度上,这也说明DeepMind商业化还有非常高的提升空间。AI龙头企业尚且如此,国内AI游戏厂商估计也大差不差。

  只有有效解决样本、成本、灵活性等问题,AI游戏才会真正大爆发。

投稿:lukejiwang@163.com
点击展开全文
Copyright © 2002-2024 鹿科技