中国·AC米兰(Milan·中文)官网入口|主页欢迎您

学术活动

首页 > 学术活动 > 正文

稷下讲坛（自然科学）第677期——大语言模型高效推理：KV缓存压缩、防遗忘适应、语义分组与百万级稀疏注意力

时间：2026-05-25 点击：

今邀请加拿大索尼AI公司姚恒帅研究员来我校进行学术访问并作学术报告，届时将与我校有关专家学者进行学术交流。欢迎广大师生踊跃参加！

报告题目：大语言模型高效推理：KV缓存压缩、防遗忘适应、语义分组与百万级稀疏注意力

报告时间：2026年05月24日（周日）下午14:30

报告地点：15号教学楼430室

附件：姚恒帅研究员简介

数学与统计学院

科学技术处

2026年5月23日

附件：

姚恒帅研究员简介

姚恒帅研究员，现任Sapient公司（新加坡）团队负责人，主要从事大语言模型高效推理和强化学习研究。博士毕业于加拿大阿尔伯特大学计算机专业，博士期间师从2024年ACM图灵奖获得者Rich Sutton教授。2020年至2024年担任阿尔伯特大学计算机学院客座教授。此前先后任职于华为自动驾驶和海思团队（主任研究员）、Sony AI北美研究院（高级研究员）等国际知名企业。主要研究方向为强化学习、深度学习、大语言模型高效推理及其在自动驾驶、游戏AI和智慧农业中的应用。承担了多项大型科研和企业应用项目，发表论文50余篇，其中人工智能和机器学习领域顶级会议论文10余篇（ICML、NeurIPS、AAAI、IJCAI等），Google Scholar引用次数2000余次，单篇引用230余次，H指文20。先后担任AAAI、ICML和NeurIPS的程序委员成员和ICML的区域主席。其提出的Universal Option Models（NeurIPS 2014）对游戏AI和智能体决策领域产生了深远影响，直接启发了Google DeepMind的UVFA工作，被Sony和Ubisoft广泛采用。Preconditioned Temporal Difference Learning（ICML 2008）一文被MIT教授Dimitri Bertsekas在其经典著作“Dynamic Programming and Optimal Control” Volume 2中引用。近期在大模型高效推理方面取得突破性进展，提出的Thin Keys方法可将Transformer内存降低75%，Focus方法实现长序列推理10倍加速。拥有4项已授权发明专利。