近日,国际人工智能和计算机视觉顶尖期刊International Journalof Computer Vision(IJCV,计算机视觉国际期刊)在线发表了计算机与人工智能学院李天瑞教授团队的最新研究成果:“Deep Hierarchical Learning for 3D Semantic Segmentation”。文章从人类认知和三维世界本身具有的多层次视角,首次提出了面向三维语义分割的深度层次学习模型和理论分析框架。
该篇论文以西南交通大学为第一署名单位,李崇寿副教授为第一作者,香港城市大学研究助理教授李欣科为通讯作者,与西南交通大学利兹学院计算机科学与技术专业2020级本科生刘宇恒、2021级本科生张裕宁、李天瑞教授以及纽约州立大学布法罗分校袁俊松教授共同完成。
IJCV是中国计算机学会(CCF)推荐的人工智能领域的4个A类期刊之一,也是计算机视觉领域最被认可的两大期刊之一,2025年影响影子11.6,年发文量仅170篇左右,偏重视觉智能基础理论。这也是学校首次在IJCV上发表科研论文。本项研究得到了国家自然科学基金青年基金、面上项目、四川省自然科学基金创新研究群体等资助。

3D场景的分层语义理解是计算机视觉领域的关键挑战,如何有效捕捉和利用物体之间的层次关系一直是研究的难点。本论文从人类认知固有的层次特性出发,首次从理论上跨层次语义一致性与各层熵最大化之间的理论关系,搭建了层次学习的理论分析框架。基于此理论,构建了深度层次学习方法,设计了分层嵌入融合模块,有效捕获点与点之间的层次关系,通过引入层次正则化项,将不同层级预测间的层次连贯性与分类损失有机结合。最后,借助视觉语言模型,开发了自动高效构建类别层次结构的技术,拓展了层次学习的适用范围。实验结果表明,本文所提出的深度层次学习模型能显著提高3D语义分割性能,为自动驾驶、城市规划和数字孪生等领域提供了重要技术支持。
李天瑞教授团队近年来始终专注于人工智能领域的前沿基础理论研究和面向国家重大需求的应用研究,承担国家重点研发课题、国家自然科学基金等国家级项目30余项,研究成果已发表在PNAS、IEEE TPAMI、IJCV等国际顶级期刊,中国科学、软件学报、计算机学报等国内顶级期刊以及AAAI、ACL、CVPR、ICCV等国际一流会议等。
论文链接地址:https://link.springer.com/article/10.1007/s11263-025-02387-6