西南交通大学信息科学与技术学院、虚拟现实与多媒体团队的吴晓教授及其指导的博士生,在继去年国际多媒体学术会议(ACM International Conference on Multimedia, 简称ACM MM)发表为口头报告之后,今年,吴晓教授团队又相继在国际顶级一流学术会议:国际多媒体学术会议(ACM MM)和国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,简称CVPR)分别发表一篇和两篇国际顶尖论文。这4篇论文均以西南交通大学为第一署名单位。这也是吴晓教授团队近两年在人工智能前沿领域发表的第10篇国际顶级期刊和顶级会议论文。
国际多媒体学术会议(ACM MM)和国际计算机视觉与模式识别会议(CVPR)是计算机学科普遍认可的多媒体领域和计算机视觉领域的顶级国际会议,被中国计算机学会(CCF)列为A类会议,在我校期刊分级目录中列为A++级别。CCF分类标准中,A类会议是国际上极少数的顶级学术会议,分级标准鼓励我国学者去突破这一级别的顶级会议。在2016年教育部第四次全国性计算机一级学科评估中,CCF A类会议论文被作为唯一单列的论文发表指标。目前国内外从事计算机视觉和图像处理相关领域的著名学者都以在这几大顶级会议上发表论文为荣,其影响力远胜于一般SCI期刊论文。今年,ACM MM口头报告录用率仅为7.5%,全球675个投稿仅50篇论文被录用为口头报告;墙报(Poster)录用率约为20%。CVPR每年的论文录用率一般在20%左右。2017年总投稿量达4000多篇,最终录用约700篇,录取率不到20%。此次吴晓教授课题组在ACM MM 2017和CVPR 2017会议上所取得的成果,将最前沿的深度学习算法应用于电子商务以及时尚搜索领域,极具学术和商业价值,实现了我校计算机学科在顶级模式识别与人工智能会议上的又一突破。这也是信息科学与技术学院科研和学科建设的重要成果之一,同时标志着我校计算机领域的科研水平取得了长足的进步。
以博士生何俊彦为第一作者,与吴晓教授以及复旦大学姜育刚教授共同完成的研究论文《Sketch Recognition with Deep Visual-Sequential Fusion Model》,被ACM MM录用为口头报告。论文提出了一种基于深度学习的草图识别方法,该方法从草图绘制过程出发,探索了笔画的视觉特征以及时序模式的融合,利用二者之间隐含的互补性提高草图识别准确率,使得基于草图的跨域检索效果得到大幅度的提升,具有较高的实用价值。
以博士生赵波为第一作者,与吴晓教授以及新加坡国立大学冯佳时教授共同完成的研究论文《Memory-Augmented Attribute Manipulation Networks for Interactive Fashion Search》被CVPR录用。论文提出了一种新的交互式图像搜索方式,可以根据用户上传的检索图片以及对检索图像需要做的属性修改,检索到完全满足用户需求的视觉相似图像,解决了当用户所提供的检索图像无法完全满足用户需求时的视觉相似图像精确搜索,提高了用户体验,具有极高的商业应用价值。
以博士生程治淇为第一作者,与吴晓教授、阿里巴巴集团人工智能研究院(iDST)的高级研究员华先胜和高级算法专家刘扬共同完成的研究论文《Video2Shop: Exact Matching Clothes in Videos to Online Shopping Images》被CVPR录用。论文提出了一个名叫AsymNet的深度神经网络以检测并追踪出明星同款。该网络利用深度特征网络学习出衣物序列的特征,对特征进行编码。在检索阶段,提出一种全新的树形融合结构以融合不同时间序列的特征,解决遮挡,突变和模糊等问题,帮助用户精确检索衣物,使用户在观看视频的同时,能够买到喜爱的明星同款衣物。
虚拟现实与多媒体团队致力于视频编码技术、多媒体大数据、人工智能、机器学习、虚拟现实、数字化铁路等相关领域的前沿研究。团队主持和参与了20余项国家级及省部级项目,同时与众多铁路及地方单位进行了多项横向项目合作。近年来,虚拟现实与多媒体团队在一流国际期刊,如:IEEE Trans. on Multimedia, IEEE Trans. on Medical Imaging, IEEE Trans. on Image Processing, IEEE Trans. on Broadcasting, IEEE Trans. on Human-Machine Systems和顶级国际会议ACM Multimedia和CVPR上发表多篇高水准的研究论文,其中SCI检索40余篇,EI检索100余篇。所做研究成果已被国际同行专家认可,文章被高水平的论文引用,Google学术引用次数1500余次,其中单篇最高引用次数为285。吴晓教授所完成的项目《视频内容识别理论与方法》获2016年教育部自然科学奖二等奖(第二完成人),获ACM成都分会“新星奖”,指导的博士生获得四川省计算机学会优秀论文奖。虚拟现实与多媒体团队开展广泛的国际合作与交流,指导的博士生在读期间赴美国卡耐基梅隆大学、美国迈阿密大学、美国乔治梅森大学、澳大利亚詹姆斯·库克大学、新加坡国立大学、香港城市大学等知名大学联合培养,指导硕士生在读期间赴国际知名研究机构和企业实习并在毕业后就业,如:微软亚洲研究院、百度、阿里巴巴、腾讯等。