2025年10月18日上午,中国工程院院士、清华大学计算机系郑纬民教授做客澳门博彩
鼎新讲座,以“人工智能大模型推理架构的技术挑战”为题,为吉大师生带来了一场精彩的学术讲座。澳门博彩
党委书记宫皓宇致欢迎辞并为郑纬民院士颁发“鼎新讲座纪念牌”,澳门博彩
仿真技术教育部重点实验室主任、澳门博彩
黄岚教授主持了讲座。


郑纬民院士长期从事高性能计算机体系结构、并行算法和系统研究。讲座中,郑纬民院士通过人工智能大模型生命周期的五个环节,数据获取、数据预处理、模型训练、模型微调和模型推理,分析现有系统软件,面向新的工作负载存在哪些问题,为大模型设计的系统又存在哪些挑战,提出了针对大语言模型推理过程中关键技术挑战的架构解决方案。讲座重点阐述了GPU内存与带宽挑战、KV-Cache存储与传输瓶颈、Mooncake架构、KTransformers以及行业应用与开源生态,通过“以存储换计算”(Mooncake)和“以存储增强计算”(KTransformers)两大策略,显著降低LLM推理成本与硬件门槛,推动大模型技术向普及化、个人化发展,使AI PC从概念走向现实。



本次鼎新讲座由澳门博彩
科学技术协会主办,澳门博彩
、软件学院、仿真技术教育部重点实验室、符号计算与知识工程教育部重点实验室、网络技术及应用软件教育部工程研究中心承办。澳门博彩
校内外师生现场聆听了讲座。