学术论文网

  • 当前位置:主页 > 教育教学论文 > 历史学论文 > 正文>AAAI 2021最「严」一届放榜:录取率仅21%网易伏羲9篇论文入选

    AAAI 2021最「严」一届放榜:录取率仅21%网易伏羲9篇论文入选

    发布日期:2020-12-09 23:10 历史学论文

      近日,国际人工智能顶级会议AAAI 2021公布论文录取结果。网易伏羲实验室再创佳绩,共有9篇论文入选,研究方向涉及强化学习、虚拟人、自然语言处理(NLP)、图像动画、用户画像等领域。科研成果的集中爆发,充分显示网易伏羲在人工智能的多个领域已经具备国际顶尖的技术创新能力。

      AAAI(Association for the Advance of Artificial Intelligence)是美国人工智能协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的的国际顶级学术会议之一。在中国计算机学会的国际学术会议排名中,AAAI被列为人工智能领域的A类顶级会议。

      作为人工智能领域的风向标,每年的AAAI都会吸引大量来自学术界、产业界的研究员、开发者投稿和参会,论文竞争更是异常激烈。AAAI 2021联合主席Kevin Leyton-Brown在Twitter上表示,今年接受的投稿论文总数达到“惊人的高技术水平”。9034篇投稿论文中,7911篇接受评审,最终仅有1692篇论文被录取,录取率为21%。

      网易伏羲成立于2017年,是国内专业从事游戏与文创AI研究和应用的顶尖机构。此次AAAI中稿论文中展示的部分技术成果,如:智能捏脸、表情迁移等技术,已在网易多个产品中应用落地,成为吸引行业关注的亮点。

      受到参数范围的限制,现有的游戏角色人脸自动创建算法无法很好地还原参数范围之外的人脸,且大部分方法都没有考虑贴图。少部分能够生成贴图的方法,也没有考虑光照和遮挡物的影响,导致创建的三维人脸无法很好地应用在游戏中。

      为了提高创建的游戏人脸的形状相似度,本文提出先使用业内成熟的基于3DMM和CNN的方法重建三维人脸,然后基于径向基函数插值的方法,将三维人脸的形状迁移到游戏三维人脸模板上。

      人脸重演的目的是将一张人脸的表情和姿态迁移到另外一张人脸上去,该任务可以用于说话头生成、虚拟形象驱动等目的。

      之前的部分模型需要多张源图片来训练一个单独的网络。一些one-shot模型往往无法较好地保存原始人脸的身份信息,且生成质量较低。通过对adptive normalization的分析,我们指出先前的模型不适用于人脸重演这一任务。

      本文通过一个网络来预测所有层的adaptive参数,这种设计能够对adaptive参数进行全局的规划。此外,本文引入local-global机制,通过先将局部的五官迁移,然后用五官来指导生成整张脸简化了任务。

      实验表明,本文提出的方法能更好地保存原始人脸信息,生成更线、结构感知下基于姿态分解和语义相关性的人体图像生成

      鉴于标准CNN无法高效地处理大的空间形变,本文提出了一种基于外观流的方法来建模源特征与目标特征之间的密集对应关系。在此框架下,我们结合人体的先验结构信息来指导网络学习,从而有效地改善效果。同时,我们进一步设计了一个轻量且有效的基于金字塔池化的非局部(non-local)模块以捕获不同尺度下不同人体部分的全局语义相关性。

      因此,我们提出了一种改进的DepthNet HR-Depth,它具有两种有效的策略:(1)重新设计DepthNet中的跳跃连接以减少编码器和解码器之间的语义鸿沟;(2)提出特征融合Squeeze-and-Excitation(fSE)模块以更有效地融合特征。使用Resnet-18作为编码器,HR-Depth在高分辨率和低分辨率场景中都超越了所有现有技术,同时具有更少的参数。此外,以前的最新方法是基于相当复杂的深度网络,具有大量参数从而限制了它们的实际应用。因此,我们还构建了一个使用MobileNetV3作为编码器的轻量级网络。

      不同于只预测下一步状态的传统world model,我们通过引入goal-based强化学习框架,通过对强化学习策略的参数化序列建模,将world model扩展到了用户轨迹维度。因为传统的基于模型的规划方法效率较低,我们进一步将world model融入到值函数中,且一定程度上帮助值函数规避了高方差环境与稀疏奖励信号带来的学习问题。

      预测团体比赛的胜负是一项重要且有挑战的任务。由于人具有社会属性,比赛中的成员不可避免地会与其他成员产生交互,影响比赛结局。现有的工作主要关注于学习团队成员的个体能力,或者建模团队内部的交互。然而,群体比赛中存在多种复杂的交互,包括团队内部交互(即合作效应)和团队间交互(即竞争效应)。同时,不同重要性的成员还会在群体比赛中受到不同程度的关注,影响比赛结果。

      为此,本文提出了 NeuralAC,它能学习带权重的竞争合作效应,用于比赛结果的预测。具体来说,NeuralAC首先将个体成员投影到多个隐空间,使用神经网络作为交互函数来建模对友间的合作和对手间的竞争效应。随后,我们使用两种注意力机制来捕捉团队内部以及团队间的注意力分布,这同时提高了比赛预测的准确性和可解释性。

      本文提出了一种风格化的对话生成方法,可以捕捉嵌入在未配对文本中的风格特征。具体来说,我们的方法可以生成既符合上下文,又符合目标风格的对话回复。在本文中,我们首先引入了一个逆向对话模型来预测一条回复内容对应的输入。然后,我们用这个逆向模型来根据这些风格化的非配对文本生成风格化的伪对话对。我们使用这些伪对话对来联合训练风格化对话模型。为了增强decoder中的风格特征,我们提出了style routing方法。

      关键词:虚拟人、图像生成、数字人、音视频同步、说话人脸、视频合成本文首次提出了从文字生成说话人脸视频的算法框架,除了音视频同步的口型,还同时生成了与说话内容匹配的面部表情和与说话节奏匹配度韵律头动。

      本文的算法由两个阶段组成:第一阶段与特定说话人无关,包括三个并行网络,分别用于生成口型、眉眼表情和头部运动三组动作参数;第二阶段合成特定说话人视频,基于三维人脸信息监督的自适应注意力网络来生成不同特定人的说话视频,此阶段以动作参数作为输入,生成注意力掩码来修改不同说话人的面部表情变化。为了更好的采集面部动作和说话内容的关系,本文借助动作捕捉设备建立了一个音视频同步数据集。基于这个动捕数据集,本文的算法可以实现高效的端到端训练。


    网友转发请注明出处转载请保留链接:AAAI 2021最「严」一届放榜:录取率仅21%网易伏羲9篇论文入选本文链接http://www.yule868.com/a/lishixuelunwen/21081.html,谢谢合作!868学术论文网


    上一篇:史学学人日记视域下的近代史学研究   下一篇:图书2020︱学者、媒体人和出版人评出的中华聚珍年度十佳


    论主学术论文网 学术论文网专业指导写论文的要点和技巧,指导如何写论文,本科毕业论文,写作大学毕业论文,专为工程类,医学类,教育类,经理类,管理类,会计类,艺术类等原创毕业论文如何写,值得信赖值得靠谱的毕业论文写作网站.
  • 文章总数
  • 3137263访问次数
  • 建站天数
  • XML地图 XML_1地图 备案蜀ICP备16030853号