开源大模型创新背后的 RISC-V 算力架构革新

如果无法正常显示，请先停止浏览器的去广告插件。

1. 开源大模型创新背后的 RISC-V 算力架构革新演讲人：苏中

3. 人工智能发展：从符号主义到链接主义符号主义的鼻祖：亚里士多德与他的三段论 All men are mortal. Socrates is a man. Therefore, Socrates is mortal 所有人都会死。苏格拉底是人。因此，苏格拉底会死。亚里士多德《Prior Analytics》拉丁文版约1290年，佛罗伦萨劳伦齐亚纳医学院图书馆亚里士多德 Ἀριστοτέλης Aristotél （古希腊公元前384–公元前322年) https://en.wikipedia.org/wiki/Aristotle

4. 符号主义的发展符号主义的发展：从第一个AI程序Logic Theorist，专家系统的成功到日本第五代计算机计划 Logic Theorist：第一个人工智能程序(第一个特别设计用于模仿人类解决问题能力的程序)由赫伯特· 西蒙(Herbert Simon),艾伦· 纽厄尔(Allen Newell)和约翰· 肖(John Shaw)于1955年至1956年创建，在数学定理证明方面取得突破。 https://en.wikipedia.org/wiki/History_of_artificial_intelligence https://www.aikatana.com/p/legacy-japans-fifth-generation-computer-systems-fgcs-project-ai https://archive.org/details/fifthgeneration00edwa/mode/2up?view=theater 第五代电脑是日本通商产业省于1982年的一个大型研发计划，其目的为开发一部划时代的电脑，利用大量平行计算，使它拥有超级电脑的运算效能和可用的人工智能能力。

5. 链接主义的起步，来自于人类对于脑的认识智能的来源：结构与规模桑地亚哥· 拉蒙· 伊· 卡哈尔（1852-1934、西班牙） Ramón y Cajal in 1899 1906年诺贝尔生理学/医学奖 1899年绘制的鸽子小脑普金耶细胞（A）和颗粒细胞（B）图 https://en.wikipedia.org/wiki/Santiago_Ram%C3%B3n_y_Cajal 《comparative study of the sensory areas of the human cortex》, 1900

6. 人工智能的评测标准：图灵实验图灵发明的“炸弹”，它是一种机电计算装置，二战期间成功破译了德国恩尼格玛机加密的信息艾伦图灵 Alan Mathison Turing （英国 1912–1954) https://en.wikipedia.org/wiki/Alan_Turing https://en.wikipedia.org/wiki/Bombe#/media/File:Wartime_picture_of_a_Bletchley_Park_Bombe.jpg

7. 人工神经元网络：从感知机到深度学习人工智能的发展：规模与结构人类视觉皮层的纵向切面（横放）桑地亚哥· 拉蒙· 伊· 卡哈尔，1900 Geoffrey Hinton https://viso.ai/deep-learning/alexnet/ https://awards.acm.org/about/2018-turing 深度学习技术的引爆点：图像识别的AlexNet 架构。它由 8 层组成：5 个卷积层和 3 个全连接层 Yann LeCun

8. AlexNet：AI算力架构从CPU转向GPU的起点 CPU GPU 计算电路计算电路计算电路计算电路控制电路 AlexNet= 6000万个参数 +65万个神经元 +卷积神经网络的高性能C++/CUDA实现 +2*GTX580 GPU 缓存电路 • • 计算密度相对低复杂的控制电路，应对复杂的运算 • 庞大的缓存电路，缓存数据 • • 计算密度高能做的运算的计算复杂度低 • 内存访问的带宽高该模型由Alex Krizhevsky与多伦多大学的Ilya Sutskever和博士顾问Geoffrey Hinton于2012年合作开发@University of Toronto

9. 人工智能的发展：从感知到认知基于Transformer架构的大模型大语言模型的发展带来对于算力无尽的需求神经网络语言模型与词向量的推出 1960 1970 2003 Word2Vec训练方法，上下文语义学习 2010 RNN循环神经网路用于NLP 2013 OpenAI推出GPT3 模型，参数规模 1750亿 OpenAI推出GPT1 模型 2018 2017 Transformer架构提出，成为大模型的基础结构 1. 2. 3. 2019 2020 OpenAI提出GPT-2模型谷歌提出BERT模型谷歌提出T5模型阶段三（2003-至今）基于神经网络（链接主义）阶段二（1970-至今）基于概率与统计阶段一（1960-至今）基于语法与规则（符号主义） • • • OpenAI发布GPT4 Meta推出开源模型LLaMA2 中国迎来了“百模大战” 2022 OpenAI推出 ChatGPT 2023 2025 DeepSeek R1 正式发布

10. 当前计算架构无法满足未来的需求从大语言模型进一步发展到多模态，AI的“读万卷书”和“行万里路” • 人工智能的发展，完全颠覆了算力实际需求增长速度，计算架构重构成为唯一出路

11. 未来十年是计算架构创新的黄金10年算力瓶颈、存力瓶颈、互联瓶颈亟待突破 Input Device Central Processing Unit Control Unit Arithmetic/Logic Unit 技术趋势：面向领域的架构（DSA）将支撑计算机体系结构黄金十年现代计算机之父约翰· 冯· 诺伊曼  RISC架构先驱、图灵奖获得者John Hennessy和David Patterson教 Memory Unit 授预测，随着摩尔定律的放缓，计算机体系结构方面形成突破变得尤其重要，未来十年是DSA架构的黄金十年； Output Device 冯诺伊曼架构  新突破方向有：面向领域软硬件协同设计，增强的安全技术，开源的指令架构和敏捷开发  正式提出了RISC-V是新架构创新的底座

12. RISC-V：最适合AI时代高性能CPU打造的架构开放技术底座加上可扩展的能力是实现AI时代最佳算力 • • • • • • • PC时代移动时代（1980年代 – 2000年代）（2000年代 – 2020年代）通用计算能力要强以X86架构成为主流 X86架构完全闭源，架构不可定制 • • • 功耗要低 ARM架构成为主流 ARM架构采用授权模式，但由单独公司掌握，定制化程度低 AI时代（2020年代-） • • • 新架构的演进能力、定制化能力要强以RISC-V为代表的开源精简指令集成为CPU架构创新主要力量开源、开放的特性，为基于RISC-V架构的产品带来以下优势：硬件架构  可扩展的模块化指令集体系  针对AI不断完善的RISC-V Vector / Matrix / Tensor扩展  开源、自主可控的指令集软件生态经过多年发展，X86架构与ARM架构在PC、移动场景各自拥有丰富的软件生态闭源模式的中心化驱动，对AI的支持需要代际间的大版本更新 CPU IP根技术依存于少数企业，缺乏自主权传统架构对于异构可扩展性的支持仍然有待加强  开源软件体系  日趋成熟的基础生态  快速覆盖的应用生态应用落地  灵活度更高的商业模式  易于根据实际需求平衡计算、内存和互联能力  Scale Up & Scale Out潜力巨大

13. 全球都在推动RISC-V架构在AI方面的演进打开开源硬件之门，以无限潜力获得更多成功可能 RISC-V更适配AI高性能计算场景成本更低历史包袱小 RISC-V架构创新尝试无需购买CPU IP授权每代新产品无需重新购买 X86架构：3600+条指令 ARM架构：1000+条指令 RISC-V架构：47条基础指令 AI+CPU AI CPU AI （PIM） CPU+AI CPU IP 功耗小灵活性好硬件逻辑设计相对简洁能效比高且功耗小支持可拓展指令支持模块化指令子集 AI RISC-V创造了开源硬件的无限潜力 • 从通用计算到AI计算、图形计算、隐私计算、科学计算等各种计算场景，RISC-V以其开源特性带来的创新颗粒度，拥有更多的成功可能

14. RISC-V处理器性能不断提升 SPECint2006评分每两年提升2/GHz SpecInt2006/GHz AMD Zen4 AMD Zen3 20+ Apple M3 Intel Sapphire Rapids Intel Ice Lake 18 SiFive P870 Ventana Veyron V2 16 香山昆明湖 14 2025 RISC-V标杆产品玄铁930 SiFive P670 12 10 赛昉天枢 SiFive P550 8 香山雁栖湖玄铁C910 6 SiFive U74 4 SiFive U54 2 蜂鸟E200 0 2016 2017 玄铁C902 2018 2019 2020 2021 2022 2023 2024 2025

15. 立足中国走向世界：AI国际标准建设竞争激烈架构1：与vector寄存器独立（ Intel、Apple、DAMO Academy、 Streamcomputing ） Matrix的本质优势 Matrix Registers Scalar：1 element --- 1 operation Vector：N elements --- N operation Matrix：N 2 elements --- N 3 operation 架构2：复用vector寄存器资源（ SiFive ） Matrix Extension Vector Extension Matrix Extension Vector Registers Vector Registers Integrated Matrix TG Attached Matrix TG 两种Matrix架构特点对比 Vector Extension Attached Matrix Integrated Matrix 算力与Vector解耦，Matrix算力可灵活配置，可方便实现大算力受限于Vector算力，Matrix/Vector算力配比相对固定拓扑支持灵活拓扑结构，包括多核共享Matrix算力仅支持单核独享与Vector松耦合，频率支持异步，时序功耗更加友好与vector紧耦合，与CPU同频，大算力下频率功耗物理实现不易收敛指令力度大，对前端取指压力小指令力度较小，前端取指带宽占用大需要额外Matrix寄存器资源，执行单元可以设计更加高效无需专用Matrix寄存器资源，同算力下执行单元较attached架构更大需增加额外Matrix相关context维护复用vector资源硬件实现前端带宽占用资源软件编程

16. RISC-V从技术走向产品再到生态全产业链协作，聚焦标杆产品研发，并形成“技术创新-产品研发”与“产品研发-生态建设”的正面双循环技术创新促进产品迭代技术创新开放的标杆产品为生态吸引更多软硬件开发者标杆产品研发标准化建设规范技术创新完善生态反哺标杆产品迭代生态建设

17.

18. MAKE COMPUTING MORE EFFICIENT