清华交叉团队在《科学》发布中国人工智能光芯片“太极”
新清华 2024年05月17日 第2326期 专题报道
●记者 陈韩梅
随着各类大模型和深度神经网络涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代人工智能芯片,已成为国际前沿热点。
清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组合作,摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度智能光计算架构,研制全球首款大规模干涉衍射异构集成芯片“太极”(Taichi),实现160 TOPS/W(每焦耳能量执行160万亿次运算)的通用智能计算。该研究成果于4月12日,以“大规模光芯片‘太极’赋能160 TOPS/W通用人工智能”为题发表在《科学》(Science)期刊上。方璐、戴琼海为该论文的通讯作者,电子工程系博士生徐智昊、博士后周天贶为第一作者。
“挣脱”算力瓶颈的中国光计算睿智尝试
作为人工智能的三驾马车之一,算力是训练人工智能模型、推理任务的关键。
光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算,以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。
智能光计算作为新兴计算模态,在后摩尔时代展现出有望超越硅基电子计算的潜力。然而其计算任务局限于简单的字符分类、基本的图像处理等。其痛点是光的计算优势被困在了不适合的电架构中,计算规模受限,无法支撑亟需高算力与高能效的复杂大模型智能计算。
直面科研领域痛点问题,帮助光计算“挣脱”算力瓶颈,另辟蹊径,是这个清华团队迈出的关键一步。
从“无极”而至“太极”的双向奔赴
每一个研究成果的背后,都凝缩了团队每一位成员的心血。方璐将这次科研历程比拟为一场浪漫的“双向奔赴”:从算法架构上自顶向下探索,在硬件芯片设计上自底向上推演。
相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极”光芯片架构源自光计算独特的“全连接”与“高并行”属性,化深度计算为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。
据徐智昊介绍,在“太极”架构中,自顶向下的编码拆分-解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式‘大感受野’浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。
团队以周易典籍“易有太极,是生两仪”为启发,建立干涉-衍射联合传播模型,融合衍射光计算大规模并行优势与干涉光计算灵活重构特性,将衍射编解码与干涉特征计算进行部分/整体重构复用,以时序复用突破通量瓶颈,自底向上支撑分布式广度光计算架构,为片上大规模通用智能光计算探索了新路径。
通俗来讲,干涉-衍射的组合方式仿佛就是在拼乐高玩具。乐高积木可以通过一个模块凹槽与另一个模块凸起的契合来完成两个组件的拼接。在团队眼中,一旦把干涉、衍射变成基础模块,进行重构复用,可以凭借丰富的想象力搭建出变化无穷的造型。
方璐表示,“之所以将光芯片命名为‘太极’,也是希望可以在如今大模型通用人工智能蓬勃发展的时代,以光子之道,为高性能计算探索新灵感、新架构、新路径。”
学科交叉融合探索无限可能
“太极”光芯片的诞生是多学科交叉碰撞、探索无限的过程。
北京信息科学与技术国家研究中心的光电智能技术交叉创新团队由来自电子系、自动化系、集成电路学院、软件学院的相关领域学者和专门的研究人员组成。在这里,“理学思维融合工科实践,交叉领域践行原始创新”的理念一以贯之,团队始终致力于为中国成为世界科学中心和创新高地贡献出清华力量。
方璐认为,这次突破性科研成果的成功取得,是清华大学深入推进有组织科研的一次生动实践。
该课题受到科技部2030“新一代人工智能”重大项目、国家自然科学基金委杰青项目、基础科学中心项目,清华大学-之江实验室联合研究中心的支持。在合作者中,有来自各个学科、不同背景的成员。他们集思广益,多学科、多角度地探索更多解决途径。
创新的火花在学科碰撞中不断迸发,为科研团队厚植基础、勇攀高峰提供了新动能。