宋继强:异构AI基础设施是未来发展趋势
11月23日,第二十二届中国国际半导体博览会(IC China 2025)在北京国家会议中心开幕。在同期举行的第七届全球IC企业家大会上,英特尔公司副总裁、英特尔中国研究院院长宋继强发表演讲。他表示,当前,AI计算的重心已从通用基座大模型扩展至推理应用。未来,80%的AI计算将用于推理领域。异构的AI基础设施是未来发展的趋势。

宋继强表示,智能体AI是推理领域真正产生客户价值的部分,其算力需求将从2025年起逐步上升,并超越用于训练基座大模型与微调大模型的规模,今年,其规模已有140倍的增长,达到每月1400万亿Token的使用量。为应对智能体AI的高速增长需求,算力支持是首要的,算力基础设施的带宽、存储等都要跟上。Token服务供应商,如云服务和数据中心供应商也需对构造成本结构的方式进行系统级的优化。
宋继强指出,早期的智能体AI在中间层专门对应某一种语言模型,在底层则与具体的硬件和软件组合相对应,是在某种专门的应用架构上调优出来的,扩展比较受限。新出现的思维链技术得以支撑更广泛、更高级别的能力,但也需要更多的执行步骤、更多不同的模型,运用思维链方式完成一个问题使用的Token数比之前多10倍。而智能体内部不止一个思维链,对Token的使用量与调用复杂度将增长百倍以上。
因此,宋继强强调,异构的AI基础设施一定是未来发展的趋势,既能提高当前应用的性能、效率和成本效益,也能够保持对于未来智能体AI应用的长期有效性。
他表示,这样的计算架构需要至少三个维度的技术支撑。
第一,在硬件层,为避免受限于特定架构或供应商,必须构建异构的硬件架构基础。这也是目前算力中心与公有云服务建设中常常讨论并采纳的方式。
第二,在中间的系统级,越来越多的推理应用存在于某一个企业的工作范围内,所以一定要对企业应用开发、服务器部署友好。要针对企业所需要、所能够支持的尺寸交付算力,对于互联互通也需要采用开放的、基于以太网方式的能力规模扩展方案。
第三,是更开放的软件栈和软件框架,需要具备可编程性、可调配组合,能支持多种AI框架。
宋继强进一步分享了英特尔的一系列实践与创新案例。例如,制程技术方面,要提供更高能效比、更高性能、生产制造更灵活的方案。今年10月,英特尔公布了其最新的制程节点Intel 18A的技术细节,同时使用了RibbonFET全环绕栅极晶体管和背面供电技术PowerVia,可以提供更高晶体管密度、提升每瓦性能、降低功耗,为英特尔未来至少三代客户端与服务器产品提供支撑。
封装技术方面,宋继强表示,英特尔持续演进先进技术:从传统的二维封装到2.5D的EMIB嵌入式多芯片互联桥接方案、Foveros 2.5D和3D技术,再到Foveros Direct 3D,在先进封装技术的加持下,芯片Bump间距已经降到了10微米以下。
宋继强还分享了英特尔对未来定制芯片的设想,他指出,未来的定制芯片内部既可以有英特尔的主计算单元,也可以有客户的计算单元,并能够通过3D技术将两者封装在一起。在灵活构造的基础上,加上EMIB 2.5D、TSV等技术加持,将大大地提升芯片尺寸,目前最大能实现相当于十几个光罩尺寸大芯片规模,这将给可定制的未来处理器或AI加速器新的机会。他表示,针对未来多元的应用需求,希望有更多能效比优先,具备定制化特点的芯片方案。




