中国·AC米兰(Milan·中文)官网入口|主页欢迎您

学术活动

    学术活动

    首页 > 学术活动 > 正文

    稷下讲坛(自然科学)第677期——大语言模型高效推理:KV缓存压缩、防遗忘适应、语义分组与百万级稀疏注意力

    时间:2026-05-25 点击:

    今邀请加拿大索尼AI公司姚恒帅研究员来我校进行学术访问并作学术报告,届时将与我校有关专家学者进行学术交流。欢迎广大师生踊跃参加!

    报告题目:大语言模型高效推理:KV缓存压缩、防遗忘适应、语义分组与百万级稀疏注意力

    报告时间:2026年05月24日(周日)下午14:30

    报告地点:15号教学楼430室

    附件:姚恒帅研究员简介

    数学与统计学院

    科学技术处

    2026年5月23日

    附件:

    姚恒帅研究员简介

    姚恒帅研究员,现任Sapient公司(新加坡)团队负责人,主要从事大语言模型高效推理和强化学习研究。博士毕业于加拿大阿尔伯特大学计算机专业,博士期间师从2024年ACM图灵奖获得者Rich Sutton教授。2020年至2024年担任阿尔伯特大学计算机学院客座教授。此前先后任职于华为自动驾驶和海思团队(主任研究员)、Sony AI北美研究院(高级研究员)等国际知名企业。主要研究方向为强化学习、深度学习、大语言模型高效推理及其在自动驾驶、游戏AI和智慧农业中的应用。承担了多项大型科研和企业应用项目,发表论文50余篇,其中人工智能和机器学习领域顶级会议论文10余篇(ICML、NeurIPS、AAAI、IJCAI等),Google Scholar引用次数2000余次,单篇引用230余次,H指文20。先后担任AAAI、ICML和NeurIPS的程序委员成员和ICML的区域主席。其提出的Universal Option Models(NeurIPS 2014)对游戏AI和智能体决策领域产生了深远影响,直接启发了Google DeepMind的UVFA工作,被Sony和Ubisoft广泛采用。Preconditioned Temporal Difference Learning(ICML 2008)一文被MIT教授Dimitri Bertsekas在其经典著作“Dynamic Programming and Optimal Control” Volume 2中引用。近期在大模型高效推理方面取得突破性进展,提出的Thin Keys方法可将Transformer内存降低75%,Focus方法实现长序列推理10倍加速。拥有4项已授权发明专利。

    版权所有©AC米兰中文官网入口地址:山东省淄博市张店区新村西路266号(255000)鲁ICP备09041544号-6

    XML 地图