4月4日上午10时,IEEE Fellow、ACM Fellow、腾讯机器人实验室“Robotics X”负责人张正友博士受邀做客西南交通大学,为我校师生带来题为“人机智能交互与机器人展望”的学术报告,分享他在人机交互、人脸表情识别等领域的核心技术研究。讲座由西南交通大学科学技术发展研究院、信息化与网络管理处以及信息科学与技术学院共同主办,由信息科学与技术学院计算机科学与技术系吴晓教授主持。
张博士首先回望了人机交互的发展过程以及当前研究成果。他指出,可识别的智能交互系统将会为用户提供更加人性化的服务:在他及其团队的努力下,自带摄像机和麦克风的机器人诞生了——基于视觉,人脸识别,人机交互语音等技术,它可以听到用户的声音并且看到人们的表情。
如何做到有情商的人机交互?在张博士看来,只有考虑到用户的表情,理解人的表情,人与机器才可以做到更加融洽的交互。而表情识别研究在诸多领域有着深刻的实践背景。张博士提出情商有4种分类,而这是一个认识自我与他我的过程,有了情商才可以像人一样进行交互情感,但从计算机来理解情商还有很长的路要走。
讲座上,张博士与大家分享了20多年来智能化人机交互中的人脸表情识别技术的研究历程。在日本工作期间,张博士便开始研究人脸表情识别技术,而他也是世界上第一个采用神经网络做表情研究的学者。随后,张博士重点介绍了人机交互中的重要组成部分:置信点集的几何位置和这些点的多尺度多方向Gabor小波系数,二者既可以独立使用也可以结合使用人脸特征提取是为了找到人脸最合适的表示方式。在微软工作期间,他与团队设计了Emotion API表情识别系统,从图像,中得到人们的表情,原来的想法便是从语音等浅层信息中进行观察,而后来便是结合深度信息,即从身体变化,语音等多角度来观察一个人的表情与感情,将多种信息结合起来,通过API来进行私人助手等多种运用。
在张博士看来,“Robotics X”实验室旨在创建人与机器和谐互助的未来,不断增强人的智力,关怀人的情感以及发挥体能潜力:“我对人工智能的发展持乐观态度,我不认为人工智能的发展会威胁到人类的发展主导地位,相反,人工智能的发展则是为人类社会提供新的发展动力。”同时,他从人工智能的科研前沿视角回答了学生们所关心的人工智能“威胁论”。
讲座最后,张博士就表情研究的科研等学术问题与现场师生进行深入的探讨,同学们踊跃提问,此次讲座在热烈的氛围下圆满结束。