交大要闻
当前位置: 首页 > 交大要闻 > 正文
当前位置: 首页 > 交大要闻 > 正文

计算机学院李天瑞教授团队博士后两篇论文在人工智能顶级期刊IEEE TPAMI发表

来源:计算机与人工智能学院 日期:2026/04/03

3月31日,计算机与人工智能学院李天瑞教授团队博士后2篇论文在国际顶级期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)上发表。TPAMI是人工智能、机器学习与模式识别领域公认最具影响力的国际顶级期刊,同时也是中国计算机学会(CCF)和中国人工智能学会(CAAI)推荐的A类期刊,近五年平均影响因子为20.4。该期刊以极为严苛的同行评审和录用标准著称,最终录用率通常不足10%。此次团队两篇论文同时被录用,标志着团队在相关领域的研究水平获得国际同行的高度认可。

论文《Variational Bayesian Personalized Ranking》第一作者为刘斌博士后(合作导师:李天瑞教授)。成对学习是信息检索、排序优化以及基于大模型RLHF(基于人类反馈的强化学习)基础范式。针对现有成对学习在监督稀疏、标签噪声、数据偏差导致的泛化不足。该研究引入离散隐变量对样本标签的不确定性进行显式建模,将成对学习重构为基于证据下界优化的变分推断框架,提出一种理论可解释、计算高效、可控性强的成对学习损失函数。该损失函数采用变分推断与变分学习两阶段优化策略,通过推导闭式变分后验,使偏差调控与噪声抑制过程具备清晰的可解释性;同时借助后验压缩技术,将计算复杂度降至与标准成对损失相当的线性阶,并利用Jensen间隙上界严格保证近似误差可控。此外,论文还提供了严格的泛化保证,揭示了先验分布误设带来的机会成本。在信息检索与推荐系统等典型场景的实验充分验证了其性能提升以及去偏、去噪的有效性。

图 1 基于证据下界优化的变分推断示意图

论文《Harnessing Meta-Learning for Controllable Full-Frame Video Stabilization》第一作者为Muhammad Kashif Ali博士后(合作导师:李天瑞教授)。视频稳定是计算机视觉领域的一项基础性任务,旨在消除手持拍摄中的抖动,提升视觉体验及下游任务性能。现有全帧像素级合成方法虽能生成完整画幅的稳定视频,却因运动模式与视觉内容的多样性而难以实现鲁棒泛化,且缺乏可控性。论文针对该任务中的自适应难题,提出了一种基于元学习的快速测试自适应框架,通过元训练使模型仅利用输入视频即可快速调整参数,在单次自适应迭代中即获得显著性能提升;进一步设计了急动定位模块与空间感知采样策略,聚焦于高抖动区域进行高效自适应,以最小计算开销实现最大稳定增益。实验结果表明,该框架在NUS、BiT、DOFVS等多个真实世界数据集上均达到最先进性能,并验证了其在跟踪、目标检测等下游任务及现代视频理解系统中的适用性,为全帧视频稳定提供了兼具可控性与高效性的新范式。

图 2 基于元学习的快速测试自适应框架示意图

计算机与人工智能学院高度重视博士后工作,始终以“引育高端人才、强化科研创新”为核心,构建起高标准、全链条的博士后培养与管理体系,此次两篇论文在TPAMI的发表,充分彰显了学院在人工智能领域人才引进与培养方面的显著成效。

李天瑞教授团队近年来始终专注于人工智能领域的前沿基础理论研究和面向国家重大需求的应用研究,积极拓展“智能+”学科交叉融合场景。团队研究成果发表于PNAS、IEEE TPAMI、IJCV、AI、IEEE TKDE、IEEE TEC、IEEE TFS、IEEE TIFS、IEEE TIP、IEEE TC、IEEE/ACM ASLP、IEEE TIE、IEEE TVT、ACM TIST等国际顶级期刊,《中国科学》《软件学报》《计算机学报》《自动化学报》《电子学报》《通信学报》等国内顶级期刊,以及AAAI、ACL、CVPR、ICDE、IJCAI、KDD、UbiComp、WWW、ICDM、CIKM、EMNLP等国际一流会议。


作者:陈延云   编辑:冉孟雨   


[西南交通大学新闻网版权所有,未经书面授权禁止使用]

[打印本页] [关闭窗口]