
【讲座名称】
Stochastic Second-order Methods for LLMs
【主讲人】
王天宇,复旦大学上海数学中心青年副研究员
【主讲人介绍】
王天宇博士毕业于杜克大学,本科毕业于香港科技大学。他的主要研究方向为机器学习以及衍生问题。他曾入选上海海外领军人才(现白玉兰计划),并获上海扬帆项目支持。
【讲座内容简介】
Large Language Models (LLMs) have transformed many aspects of our lives, and created numerous opportunities. In this talk, we will explore operational research challenges inherent to LLMs, with a particular focus on a second-order optimization method well-suited for fine-tuning these models. This talk is based on a joint work with Y. Liu, W. Peng and J. Yu.
【时间】
2025年4月11日(周五)上午 10:00
【地点】
西南交通大学犀浦校区交通运输与物流学院 417学术报告厅