英伟达GTC2026前瞻:从AI聊天机器人转向自主智能体

极客网
即将到来的Feynman架构意义重大,因为当前的Rubin平台以扩充训练与推理吞吐量为核心;2028年即将推出的Feynman不同,它是一款“推理优先”芯片,反映了全行业向智能体转向的大趋势。

美国当地时间3月16日,英伟达GTC 2026开发者大会将在圣何塞会议中心举行,英伟达CEO黄仁勋会在科技界投下重磅炸弹,极客网提前预测一下今年的重要看点。

黄仁勋之前承诺,今年将发布一款“震惊世界”的芯片。分析师预测,该芯片可能标志着AI从聊天机器人转向“完全自主智能体”。一些投资者预测,在主题演讲中,黄仁勋将正式官宣Vera Rubin平台,并首次披露下一代芯片的Feynman架构。Feynman专为AI智能体设计,拥有更强的推理能力,具备长期记忆。

众所周知,英伟达长期主导数据中心市场,本次带来的惊喜,可能是指英伟达要同时强攻消费级与基础设施两大市场。

最大看点:推理优先架构Feynman

Rubin(Vera Rubin)是2026年年底即将量产的主力AI超算平台,是Blackwell的继任者。Feynman则是定于2028年推出的下一代革命性架构,是Rubin的直接继任者。

自2024年底Blackwell架构发布以来,英伟达已经加快研发速度,技术路线图一年一更。Vera Rubin平台将于下半年才量产发货,它搭载自研Olympus Armv9 CPU核心与HBM4内存。消息称,微软、Meta已经拿到芯片样本,推理性能较上一代提升5倍。

台积电是新芯片平台的最大受益者之一,作为3nm Rubin芯片平台和1.6nm Feynman架构的独家代工厂,台积电站在了AI宇宙的中心。下一代工艺将引入“NanoFlex”技术,它将决定整个行业的推进速度。

即将到来的Feynman架构意义重大,因为当前的Rubin平台以扩充训练与推理吞吐量为核心;2028年即将推出的Feynman不同,它是一款“推理优先”芯片,反映了全行业向智能体转向的大趋势。

由此开始,AI不再只是回答问题,而是能主动行动、使用软件工具、拥有“过目不忘”的长期记忆。

智能体需要海量KV Cache存储,英伟达正通过全新推理上下文内存存储(ICMS)平台与BlueField-4 DPU破解这一瓶颈。

曾几何时,GUI催生了GPU,智能体也需要一类全新的推理芯片。

Feynman采用台积电A16(1.6nm)工艺,将支持多节点内存共享,让智能体在统一知识库中实时协作。从短期看,市场将紧盯Vera Rubin平台的具体上市时间;但长期而言,市场将完全由Feynman主导。

如果英伟达成功跳过2nm节点,直接落地1.6nm工艺(支持背面供电),其领先优势将再扩大2–3年。

N1X AI PC芯片和硅光技术

在芯片方面,最受期待的可能是N1X AI PC超级芯片,它由英伟达和联发科联合研发。该芯片基于Arm架构,据传搭载20颗自研核心,集成的GPU性能堪比独立显卡RTX 5070。也就是说,英伟达将强势进军高端笔记本市场。

若N1X芯片在GTC兑现承诺,可能引发PC行业的彻底重构,此举标志着英伟达进军消费级CPU市场。成功切入“AI PC”领域,能让英伟达攫取海量边缘计算数据,进一步强化模型训练。

当然,进入消费CPU市场同样面临挑战,主要是软件兼容性,需突破Windows生态中英特尔与AMD的双寡头格局。

NemoClaw也值得注意,它是英伟达面向AI智能体的软件编排层。在“智能体时代”,硬件只是一半战场。只有开发能够让智能体“思考”与“行动”的软件,硬件平台才能成为行业标准。

与此同时,来自供应链的消息透露,英伟达将在硅光技术(Silicon Photonics)上实现突破。目前数据中心已经撞上“功耗墙”,用传统铜缆互联的方式为智能体提供支撑已经面临瓶颈。在大会召开期间,专用光计算芯片或共封装光学(CPO)交换机将会成为看点,该技术将用光速数据传输替代传统线缆。

结语:扫清“物理AI”落地障碍

总之,GTC 2026或许标志着AI从噱头变成全球生产力底层基础设施,英伟达已不再只是一家芯片公司,而是自主系统架构师。

从解决功耗危机的硅光突破到聚焦推理的Feynman架构,英伟达正努力扫清“物理AI”的落地障碍。

云厂商向AI投入巨资,需要通过智能体实现可持续软件收入,这是目前英伟达需要向业界证明的,否则投资无法持续。

此外,英伟达可能想通过AI PC实现高端算力的平民化,它将试图将算力带到每一台终端,除了建设更好的数据中心,还要让每一个口袋、每一张办公桌都拥有AI智能体。

请扫码关注数字化经济观察网
责编:左右
参与评论
文明上网,理性发言!请遵守新闻评论服务协议
0/200