十年攻坚,清华大学、蚂蚁集团携手问鼎中国智能科学技术最高奖


(资料图)

中国智能科学技术最高奖——“2022年度吴文俊人工智能科学技术奖”颁奖典礼今日在北京召开,百余位部委专家、国内外院士、顶尖学者、获奖代表和企业家出席。清华大学兴军亮研究员,蚂蚁集团李建树、赵闻飙等五人共同完成的“无约束人像目标智能感知与理解”成果获“自然科学奖一等奖”。

吴文俊人工智能科学技术奖由中国人工智能学会2011年设立,是中国历史上第一次以“人工智能”命名的奖项,一等奖及以上具备提名推荐国家科学技术奖资格,在我国人工智能领域享有最高荣誉象征。其中,“自然科学奖一等奖”限定颁给实现前瞻性基础研究、引领性原创成果重大突破,并被国内外科学界公认和广泛引用,推动学科发展或对经济社会有重大影响的成果完成人。

此次,清华大学与蚂蚁集团历时十余年攻坚完成的“无约束人像目标智能感知与理解”获得“自然科学奖一等奖”,这意味着我国在解决AI视觉领域核心难题上取得了重大创新突破。

(图:5月6日,2022年度吴文俊人工智能科学技术奖颁奖典礼现场,清华大学兴军亮,蚂蚁集团李建树等人共同完成的“无约束人像目标智能感知与理解”成果获“自然科学奖一等奖”)

人工智能已成为新一轮科技革命和产业变革重要引擎。计算机视觉作为人工智能行业重要组成部分,通过模拟人类视觉系统赋予机器“看”和“认知”能力,是实现工业数字化智能化的关键性技术。人像目标则是计算机视觉领域最为重要的研究内容,在金融认证、民生经济等场景拥有广泛应用需求。然而,受人像内在多变因素(如姿态、表情、性别等)及外部复杂环境因素(如视角、光照、噪声等)等影响,现有人像目标感知理解模型在精度和效率上存在极大挑战。

针对这一复杂科学难题,该项目经过十多年努力,形成了较为完整的人像目标智能感知理解的基础理论方法和核心算法技术研究体系。主要有三大科学发现:一是针对人像表观和形状的多变呈现,揭示了“不变性特征学习”的重要性,形成了全视角人像关键信息感知建模理论框架。二是针对复杂空间下人像内在关联属性,发现了人像的姿态、表情等多维属性间普遍存在关联,提出了“联合多任务和对抗不变性学习”的属性挖掘方法。三是结合人像关键信息和关联属性,构建了面向“人脸-人体-人群”的高适用性机器视觉智能技术应用框架,可解决实际应用场景中的多属性融合感知等难题。

据了解,该项目在国家自然科学基金、“新一代人工智能”重大项目支持下,在学术研究、技术影响、服务产业等方面均取得丰硕成果。已累计获得CVPR、ACM Multimedia等5次重要论文奖,在国内外顶级人像感知理解赛事中10次夺冠;8篇代表作论文Google-Scholar总引用3225 次、WOS他引650次,并获得十余位马尔奖/傅京孙奖得主、百余位国内外院士等知名学者引用并正面评价。

该项目相关成果已在欧姆龙公司、华为、蚂蚁集团等企业核心产品中得到应用,并产生规模化商业应用。基于该项目核心能力沉淀的蚂蚁集团可信数字身份认证方案已在海外服务超1.2亿东南亚用户,荣获IDC金融科技真实价值奖。

关键词: