【创源大讲堂】开放世界的多模态大模型研究与应用

来源：计算机与人工智能学院日期：2026/01/14

讲座题目：开放世界的多模态大模型研究与应用

讲座时间：2026年01月15日（星期四）上午10:00

讲座地点：犀浦校区3号教学楼X31541报告厅

主讲人：徐常胜教授

主讲人简介：

徐常胜，中国科学院自动化研究所研究员，西南交通大学兼职教授，国家级高层次人才，IEEE/IAPR/CCF/CSIG Fellow和ACM杰出科学家。担任ACM多媒体专委会中国区（ACM SIGMM China Chapter）主席。发表IEEE/ACM会刊论文200余篇，CCF-A类会议论文150余篇，在多媒体领域国际顶级会议和期刊上获得最佳论文奖10余次，以第一完成人获中国电子学会自然科学一等奖和技术发明一等奖，7次获得中国科学院优秀导师奖。

内容简介：

与视觉和语言大模型相比，多模态大模型能够从不同模态数据中学习共性知识，因此具有更强的通用性，也更接近人类的认知能力，是目前人工智能进一步发展的关键所在。尽管目前的多模态大模型已取得了重要进展，在跨模态检索、跨模态生成等任务中取得了优异的性能，但在实际应用中面临的开放世界，已有多模态大模型仍然存在很多尚未解决的挑战。本报告主要探讨解决两个方面的问题：（1）如何在保留不同模态数据本身特性的前提下建模多模态数据关联；（2）如何在保证模型泛化性的前提下实现多模态大模型在下游任务中的跨域迁移和小样本迁移。报告分析了多模态大模型中理想的视觉系统所应具备的要素并提出了基于解耦视觉系统的多模态大模型Libra；同时也介绍了针对多模态大模型的多个泛化性保持的跨域和小样本迁移方法。

海报.jpg

作者：邹远编辑：冉孟雨

[打印本页] [关闭窗口]

学术活动