363050.com

不止核弹芯片黄仁勋发布两开云体育台AI个人超算还拿下全球最快DeepSeek推理速度

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!

不止核弹芯片黄仁勋发布两开云体育台AI个人超算还拿下全球最快DeepSeek推理速度

  英伟达GTC大会已经成了AI界超级碗,没有剧本也没有提词器,中途黄仁勋被线缆卡住,反而是这场高浓度AI发布会里最有人味的片段,在当今基本提前彩排或录播的科技发布会里已经很稀缺了。

  刚刚,黄仁勋再次发布了全新一代核弹级AI芯片,不过这场发布会的还有个隐藏主角——DeepSeek。

  由于智能体AI(Agentic AI)和推理能力的提升,现在所需的计算量至少是去年此时预估的100倍。

  推理成本效率给AI行业带来影响,而不是简单地堆积计算能力,成为贯穿这场发布会的主线。英伟达要变成AI工厂,让AI以超越人类的速度学习和推理。

  推理本质上是一座工厂在生产token,而工厂的价值取决于能否创造收入和利润。因此,这座工厂必须以极致的效率打造。

  黄仁勋掏出的英伟达新「核弹」也在告诉我们,未来的人工智能竞争不在于谁的模型更大,而在于谁的模型具有最低的推理成本和更高推理的效率。

  全新的Blackwell芯片代号为「Ultra」,也就是GB300 AI芯片,接棒去年的「全球最强AI芯片」B200,再一次实现性能上的突破.

  如果说H100更适合大规模模型训练,B200在推理任务中表现出色,那么B300则是一个多功能平台,预训练、后训练和AI推理都不在话下。

  英伟达还特别指出,Blackwell Ultra也适用于AI智能体,以及用于训练机器人和汽车自动驾驶的「物理AI」。

  为了进一步增强系统性能,Blackwell Ultra还将与英伟达的Spectrum-X以太网和英伟达Quantum-X800 InfiniBand平台集成,为系统中的每个GPU提供800Gb/s的数量吞吐量,帮助AI工厂和云数据中心能够更快处理AI推理模型。

  黄仁勋表示,借助 DGX Station 和 DGX Spark,用户可以在本地运行大模型,或者将其部署在 NVIDIA DGX Cloud 等其他加速云或者数据中心基础设施上。

  DGX Spark系统现已开放预订,而DGX Station预计将由华硕、戴尔、惠普等合作伙伴于今年晚些时候推出。

  英伟达一直以科学家的名字为其架构命名,这种命名方式已成为英伟达文化的一部分。这一次,英伟达延续了这一惯例,将下一代 AI 芯片平台命名为「Vera Rubin」,以纪念美国著名天文学家薇拉鲁宾(Vera Rubin)。

  实际上,Rubin 由两个 GPU 组成,而这一设计理念与当前市场上的 Blackwell GPU 类似——后者也是通过将两个独立芯片组装为一个整体运行。

  从 Rubin 开始,英伟达将不再像对待 Blackwell 那样把多 GPU 组件称为单一 GPU,而是更准确地按照实际的 GPU芯 片裸片数量来计数。

  互联技术也升级了,Rubin 配备第六代 NVLink,以及支持 1600 Gb/s 的 CX9 网卡,能够加速数据传输并提升连接性。

  为了在瞬息万变的市场竞争中站稳脚跟,英伟达的产品发布节奏已经缩短至一年一更。发布会上,老黄也正式揭晓下一代 AI 芯片的命名——物理学家费曼(Feynman)。

  为此,英伟达推出了 Spectrum-X™ 和 Quantum-X 硅光网络交换机,旨在帮助 AI 工厂实现跨站点连接数百万 GPU,同时显著降低能耗和运营成本。

  随着 AI 的快速发展,对数据中心的带宽、低延迟和高能效需求也急剧增加。

  英伟达 Spectrum-X Photonics 交换机采用了一种名为 CPO 的光电子集成技术。其核心是将光引擎(就是能处理光信号的芯片)和普通的电子芯片(比如交换芯片或 ASIC 芯片)放在同一个封装里。

  黄仁勋表示,未来,每个行业、每家公司拥有工厂时,都将有两个工厂:一个是他们实际生产的工厂,另一个是 AI 工厂,而 Dynamo 则是专门为「AI 工厂」打造的操作系统。

  Dynamo是一款分布式推理服务库,为需要token但又无法获得足够token的问题提供开源解决方案。

  智能路由器,减少GPU对重复和重叠请求的重新计算,释放更多算力应对新的传入请求

  人形机器人再一次成为了GTC大会的压轴节目,这次英伟达带来了Isaac GR00T N1,全球首款开源人形机器人功能模型。

  黄仁勋表示,通用机器人技术的时代已经到来,借助Isaac GR00T N1核心的数据生成以及机器人学习框架,全球各地的机器人开发人员将进入AI时代的下一个前沿领域。

  在视觉语言模型的支持下,系统 2 对环境和指令进行推理,然后规划动作,系统 1 将这些规划转化为机器人的的动作。

  GR00T N1的基础模型采用广义类人推理和技能进行了预训练,而开发人员可以通过真实或合成数据进行后训练,满足特定的需求:既可以完成工厂的特定任务,也可以在家里自主完成家务。

  一台搭载Newton平台的机器人也登上了舞台,黄仁勋称之为「Blue」,外观神似《星球大战》中的BDX机器人,能够用声音和动作和黄仁勋互动。

  通过硬件和软件的结合,自今年1月以来,英伟达在DeepSeek-R1 671B模型上的吞吐量提升了约36倍,每token的成本效率提高了约32倍。

  值得注意的是,此次发布会的主题演讲并未提及量子计算,但英伟达特意在这届GTC大会设置了量子日,邀请了多家当红量子计算公司的CEO出席。

  一改口风的背后,离不开微软耗时17年研发的拓扑量子芯片Majorana 1实现8个拓扑量子比特集成,离不开Google Willow芯片宣称用5分钟完成经典计算机需10^25年处理的任务,推动了量子计算的热潮。

  硅谷著名投资人马克安德森曾提出软件正在吞噬世界(Software is eating the world)的论断,其核心逻辑在于软件通过虚拟化、抽象化和标准化,正在成为控制物理世界的基础设施。

  不满足于做「卖铲人」,英伟达的野心是打造AI时代的「生产力操作系统」。从汽车智能驾驶,到制造业的数字孪生工厂,这些贯穿整场发布会的案例都是将 GPU 算力转化为行业生产力的具象化表达。

  实际上,无论是发布会上亮相的最新核弹芯片,还是押注战未来的量子计算,黄仁勋在这场发布会上对AI未来发展的洞察和布局,都比当下的技术参数与性能指标更具看点。

  在介绍 Blackwell与Hopper架构的对比时,黄仁勋还不忘幽默一把。

  他以一个100MW工厂的对比数据为例,指出采用Hopper架构需要45,000颗芯片和400个机架,而Blackwell架构凭借更高的效率显著减少了硬件需求。

  随着AI领域的重心从训练转向推理,英伟达更需要证明其软硬件生态在推理场景的不可替代性。

  一方面,Meta、Google等巨头自研AI芯片,可能分流GPU市场需求。

  另一方面,英伟达最新AI芯片的适时亮相,回应如 DeepSeek 的开源模型对 GPU 需求的冲击,并展示推理领域技术优势,也是为了对冲市场对训练需求见顶的担忧。

  最近估值(未来12月市盈率)跌至10年低位的英伟达,比以往任何时候都需要一场酣畅淋漓的胜利。

Copyright © 2012-2025 开云体育公司 版权所有 非商用版本