DeepSeek同时考虑算法精度和系统效率。除了极致的底层优化,协同优化也可能让大模型在利用国产算力时达到甚至超越英伟达GPU的性能。从最顶层的产品应用到底层的基础设施,大模型的每一个层级都已经形成了非常好的生态,每一个层级上都存在着优化空间。

  ·未来推理算力或将有2-3个数量级的提升。训练算力需求仍会有所增长,总体来看,算力需求会激增,成本会更高,但算力成本还有巨大压缩空间,单位算力成本将下降,效率得到提升。

  “原来大家觉得训练模型只需要招一批算法工程师,再融一大笔钱,买一大批卡,这事就能干了。但现在不是了,现在还需要招一批懂系统的人,这是AI行业的一个很大变化。”上海交通大学长聘教轨副教授、无问芯穹首席科学家戴国浩日前在接受澎湃科技采访时表示,DeepSeek使用的训练服务算力并没有随模型尺寸等比例成倍增加,而是通过底层优化释放底层硬件性能、软硬件协同创新“压榨”算力,大模型“炼制”开始追求极致性价比。

  利用2048张H800 GPU,预估不到两个月时间训练DeepSeek V3。H800每小时每卡2美元租赁成本,训练成本550万美元左右,其中不包括前期探索模型架构、消融实验等开销。戴国浩表示,DeepSeek打响生态闭环第一枪,对国产算力优化提出更清晰的路径。总体来看,算力需求会激增,推理算力或将有2-3个数量级的提升,算力成本会更高,但算力成本还有巨大压缩空间,单位算力成本将下降,效率得到提升。

  上海交通大学长聘教轨副教授、无问芯穹首席科学家戴国浩。

  底层优化释放底层硬件性能

  拆解DeepSeek的技术报告,相对于模型架构、预训练方法和后训练方法,DeepSeek着重介绍系统架构。相比之下,国外开源模型的公开技术报告中对于系统架构的介绍篇幅较少。

  戴国浩表示,DeepSeek的极致性价比来自于两大类优化,一是了解硬件细节,实现极致的底层优化;二是打通软件硬件,实现联合协同优化。前者基于确定性的算法模型及底层硬件,开展通信优化、内存优化,这些优化不改变任何程序执行结果。后者如混合精度的量化、对底层硬件的修改,扩大系统的优化空间。

  例如在通信优化上,DeepSeek采用双向流水线机制,让计算和通信将近100%重叠,实现更大的专家并行,使得模型能够像流水线一样“边算边传”,这被认为是使用有限资源训练更大模型的有效手段。在底层优化上,PTX的优化使得系统和模型可以更好地释放底层硬件性能,这也是DeepSeek能够更精细控制底层硬件、实现“边算边传”的重要原因。

  训练一个大模型,首先要有GPU。但开发者并不需要关注底层硬件的模样,只需要通过Python等高层次语言或英伟达CUDA等硬件接口进行编程,最终调用底层的GPU。而能够直接和底层硬件发生交互的PTX一般被隐藏在CUDA的驱动中,PTX是比CUDA更底层的硬件接口编程语言。越接近底层的语言对硬件的利用效率越高,在同样硬件能力下实现更精细的通信任务管理,将最费时的跨界点通信效率提升60%,跑出效果更好的模型。

  PTX编程并非行业机密,但此前几乎所有大模型算法工程师不会接触到这一层语言。因此,如果能够编程和调用PTX,就可以更好地调用底层硬件。不过,戴国浩解释,这并不意味着绕过了英伟达CUDA的垄断。从编程范式来看,DeepSeek在某些代码上绕过了CUDA的编程,但并未完全绕开CUDA生态。

  软硬件协同创新“压榨”算力

  “从最顶层的产品应用到底层的基础设施,大模型的每一个层级都已经形成了非常好的生态,每一个层级上都存在着优化空间。”戴国浩表示,除了极致的底层优化,协同优化也可能让大模型在利用国产算力时达到甚至超越英伟达GPU的性能。“原来的算法架构只考虑算法精度,大家觉得只要算法足够好就行了,但DeepSeek同时考虑算法精度和系统效率。”

  例如英伟达H800集成了FP8计算单元,戴国浩表示,使用更低精度训练,理论上可带来2倍的计算加速和50%的显存降低。但由于低精度训练极易损失模型效果,以及大模型高昂的试错成本,开源社区中尚无项目实现大规模FP8预训练落地。而DeepSeek实现了FP8低比特训练出高质量模型,坚定“榨干”硬件所有潜力。

  DeepSeek采用MLA(隐空间注意力计算机制)架构和MoE(混合专家模型)架构,MLA架构可进一步降低推理消耗的内存。在模型训练过程中,MoE架构采用1个共享专家和256个路由专家,每个token激活8个路由专家。

  据介绍,MoE架构训练超大模型,最大的挑战是负载均衡。DeepSeek引入一个专家偏见(expert bias),保证专家负载均衡,提升集群效率。专家偏见只影响专家路由,不产生任何梯度影响。专家偏见动态调整,如果某个专家过载,就会降低偏见,如果某个专家负载不足,就会增加偏见。DeepSeek采用MoE架构,又在算法和软件层面解决了MoE本身由于专家并行带来的通信开销问题,充分挖掘了算法、软件、硬件协同创新。

  打响国产AI生态闭环第一枪

  “无论是底层优化,还是协同优化,必须要对底层硬件和系统有非常深刻的理解,既要懂算法,又要懂硬件。”戴国浩表示,以PTX编程为例,这需要开发者清晰了解英伟达的硬件是如何制造的,因此门槛高,大模型公司少有对PTX编程。业内拥有系统优化能力的团队懂PTX编程,但模型训练本身投入大,难以持续优化。

  DeepSeek打响了第一枪,对国产算力优化提出了更清晰的路径。降低算力成本是国内发展大模型的核心之一。软硬件协同路径包含模型、系统、芯片等关键因素,在国外,这三者已经形成了完备的闭环生态。戴国浩表示,在以往的认知中,使用国外的芯片预训练、使用国外的模型做微调,得到的模型跟国外的闭源或开源模型相比总存在一定差距,国内的系统、芯片也难以形成闭环生态。但DeepSeek的出现使得国内的模型超越了国外的模型,软硬件协同降低了算力成本,这套方法论可以打破现在的闭环生态瓶颈。

  戴国浩说,DeepSeek在论文中单独用2页文字提出对于未来硬件设计的发展建议,进一步佐证了模型、系统、硬件的闭环路线。国外的闭环AI生态始终是一个同构的AI系统,其核心竞争力就在于CUDA-X的垂直整合能力。因此,他认为,未来国内AI发展要通过调动跨越软硬件和上下游生态,加大模型、芯片、系统协同优化和垂直打通,例如根据新一代模型架构来定义未来芯片的底层电路实现、根据国产AI系统的互联通信方式设计高效的混合专家模型架构。

  “如何将国内的模型、系统和芯片形成自主可控的闭环,这是未来一定会发生的事。”戴国浩表示,DeepSeek的崛起对国产算力的发展是好消息。未来推理算力或将有2-3个数量级的提升。训练算力需求仍会有所增长。总体来看,算力需求会激增,成本会更高,但算力成本还有巨大压缩空间,单位算力成本将下降,效率得到提升。

 

  戴国浩判断,未来大模型的发展趋势,一是继续国产化,二是极致的软硬件协同优化带来成本下降,提升模型训练和应用的极致性价比。性价比越高,算力需求量就越大,算力越吃紧。当前中国算力生态存在供不应求和供过于求的双重矛盾,中国特有的AI基础设施格局是多模型和多芯片,存在大量异构算力,需要把他们变得能用、好用,在使用闭环中形成硬件和算法的正向循环。戴国浩表示,要通过软硬协同和多元异构压榨算力,降低获取强大基座模型的成本,解决算力缺口,以有限算力实现国产模型能力赶超。

  OpenAI为期12天的年终“技术盛宴”已结束第二天的直播。从当地时间12月5日发布的“满血版”o1模型和最贵ChatGPT Pro服务,到6日发布的强化微调(Reinforcement Fine-Tuning),无不证明AI世界又将迎来一次全新的产品升级和迭代。

  在AI的狂欢中,其他科技公司也不甘示弱。有着“AI教母”之称的李飞飞创立的World Labs以及谷歌DeepMind团队本周先后发布重磅产品,让用户可以通过单张图片生成交互式3D场景,展示了AI在虚拟世界构建领域的巨大潜力。

  Meta和马斯克的xAI也来凑了个热闹。Meta推出了今年的压轴AI大模型:Llama 3.3 70B,该模型据称能实现和Meta最大Llama 模型——Llama 3.1 405B同样的性能,成本还更低。xAI宣布Grok从今天起全球免费,但有使用限制。免费用户每2小时可以询问最多10个问题,每天最多可分析3张图片和生成4张图片。

  随着各路玩家在AI领域竞赛的深入,AI的竞争焦点也转向了智能体和通用人工智能(AGI)。

  据外媒6日的最新报道,OpenAI正在与微软磋商放弃AGI条款,以释放投资潜力。目前,最终决定尚未做出,OpenAI董事会将决定何时实现AGI。

  清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及告诉《每日经济新闻》记者,“基于多个大模型的AI智能体或多个智能体的协同,可能是未来AI技术发挥更大作用的一个重要趋势。”

  当地时间12月5日,OpenAI为期12天的圣诞季特别活动开启。

  在第一天的活动上,OpenAI发布了推理大模型o1的“满血版”和进阶模式,以及每月收费高达200美元(约合人民币1450元)的ChatGPT Pro订阅服务。

  “满血版”o1的特征是,在回答用户提问时不是“脱口而出”,而是形成一个类似人类思维方式的内部思维链条。该模型已面向ChatGPT Plus和团队用户开放,企业和教育用户则需要等到下周。

  “满血版”o1比9月发布的预览版更快、更强大、更准确,同时增加了多模态输入(可以上传图片)的能力。OpenAI表示,现在的o1模型“思维已经被训练得更加简洁”(大概快50%),而且在回答困难现实问题时,出现重大错误的概率减少了34%。

  图片来源:X同时发布的ChatGPT Pro服务也引发了外界的广泛关注,每月200美元的订阅费是目前ChatGPT Plus定价的10倍。不过,用户可以无限量地使用o1模型(Plus用户当前有每周50条信息的限制),以及无限量使用o1 mini和高级语音模式,同时也能用上o1 pro模式,该模式“使用更多的计算来为最难的问题提供最佳答案”。

  次日,OpenAI打出活动“第二弹”,推出了强化微调(Reinforcement Fine-Tuning)。阿尔特(13.380, -0.51, -3.67%)曼表示:“强化微调,效果出奇地好;它是我2024年最大的惊喜之一。”

  图片来源:X平台强化微调与标准微调不同,利用强化学习算法,研究者可以强化产生正确答案的思路,抑制产生错误答案的思路,只需要“几十个例子”(a few dozen examples)、甚至12个例子,模型就能以有效的新方式学习特定领域的推理,提升模型在特定领域任务中的推理能力和准确性。

  据介绍,它甚至可以让简易版推理模型o1 mini的效果超过前一天刚发布的“满血版”o1。OpenAI预计将于2025年初公开发布强化微调功能。

  除了OpenAI的首批年末“王炸”外,本周还有诸多AI相关的重磅产品出炉。

  作为AI领域影响力最大的女性和华人之一,斯坦福大学教授李飞飞于当地时间12月2日公布了其首个创业项目World Labs的成果——能用单张静态图片生成3D世界的AI产品。

  在World Labs网站的演示里,由AI生成的场景均通过浏览器实时渲染而成,用户可以使用箭头键或键盘(WASD)键移动,然后单击并拖动鼠标实现交互,从而自由探索场景。World Labs的AI工具配备了可操控的滑块来调节模拟景深(DoF)与模拟推拉变焦(dolly zoom),当使用者将景深效果调至越强时,背景中的物体便会越发模糊,为整个视觉体验增添了更多层次感与真实感。

  图片来源:World Labs推特截图但World Labs目前只向公众发布了关于该技术的博客,外界能够体验的功能极为有限,而且并未放出任何代码和模型。

  在单图生成3D世界领域探索的还有谷歌。北京时间12月5日凌晨,谷歌DeepMind在官网发布了大型基础世界模型Genie 2,可通过单张图片和文字描述生成种类多样的游戏3D世界,标志着AI在虚拟世界生成领域的又一次突破。

  图片来源:谷歌Deepmind官网截图简单来说,给Genie 2一张图片,它可以生成供人类游玩、可实时渲染、可控和可交互的无限3D世界,不需要借助任何游戏引擎。例如,输入“森林中的可爱人形机器人(22.460, 0.03, 0.13%)”,模型便可构建一个包含机器人角色和可探索环境的动态场景。用户可以通过键盘或鼠标操作角色在世界中进行跳跃、游泳等互动。

  和Genie 1相比,Genie 2拥有长期记忆,即使是角色短暂离开画面,在重新进入视野后,依旧能被精准还原出来。

  清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及在接受《每日经济新闻》记者采访时表示,“从学术研究的角度来看,能否将文本意义上的世界模型与物理意义上的世界模型关联起来,把真正的物理世界进行建模,是AI技术能否取得突破的关键。”

  World Labs和谷歌之后,Meta也来凑了个热闹,于当地时间12月6日推出了今年的压轴AI大模型:Llama 3.3 70B。Meta 生成式AI副总裁 Ahmad Al-Dahle在X发帖表示,纯文本的 Llama 3.3能实现和Meta最大Llama模型——Llama 3.1 405B同样的性能,成本还更低。

  Al-Dahle还附上了一张图表,显示包括针对大模型语言理解能力的测试MMLU在内,Llama 3.3在一系列行业基准测试中表现优于谷歌的Gemini 1.5 Pro、OpenAI 的 GPT-4o和亚马逊本周稍早发布的Nova Pro。

  图片来源:X随着大模型竞赛的深入,AI的风又更多地吹向了智能体和通用人工智能(AGI)。

  吴及告诉每经记者,目前,尽管单个大模型在某些方面表现出色,但也存在诸多不足,例如幻觉和遗忘效应等问题。他强调,“基于多个大模型的AI智能体或多个智能体的协同,可能是未来AI技术发挥更大作用的一个重要趋势。”

  吴及认为,智能体融合将成为AI应用解决特定场景问题的一个重要技术前景或发展方向。

  在《纽约时报》于当地时间12月4日举办的DealBook峰会上,阿尔特曼表示,“智能体是现在每个人都在谈论的话题,我认为这背后是有充分理由的。设想一下,你可以让AI系统完成一项相当复杂的任务,比如需要一位非常聪明的人,花费一段时间,借助各种工具来完成并产出有价值成果的任务。我预计,这样的场景将在明年成为现实。”

  他同时指出,AI行业即将迎来的发展将比预期更具冲击力。他将AI的影响力比作晶体管的发明,认为AI的推理功能未来将走向普及化和商业化。“到2025年,我们可能会首次见到具备AGI能力的系统。这类系统可以像人类一样完成复杂任务,甚至能运用多种工具来解决问题,”他说。

 

  据外媒12月6日最新报道,OpenAI正在与微软磋商放弃AGI条款,以释放投资潜力。根据目前的条款,当OpenAI创建AGI时,微软对这种技术的使用权将失效。目前,最终决定尚未做出,OpenAI董事会将决定何时实现AGI。

  10月17日,国务院新闻办公室举行新闻发布会,住房城乡建设部部长倪虹、财政部部长助理宋其超、自然资源部副部长刘国洪、中国人民银行副行长陶玲、金融监管总局副局长肖远企介绍促进房地产市场平稳健康发展有关情况,并答记者问。

  整体来看,对于接下来房地产市场的平稳健康发展,本次发布会提及的一揽子政策,可以概括为赋予城市更多自主权、减轻居民购房负担和推动市场供需平衡的“四个取消、四个降低、两个增加”。

  华金证券所长助理、首席金融地产分析师秦泰对澎湃新闻(www.thepaper.cn)记者表示:“综合来看,本轮房地产市场的加力放松聚焦于在供给侧‘保交付’的加大力度,政策层面更为看重的是已售在建项目的交付。

  “一方面,降息、降利率、放松限购等需求侧政策当前能够刺激起的新增需求有限已经在此前的多轮放松中得到体现。另一方面,政策也不欲见到新一轮的地产泡沫。综合判断,房地产市场‘L’型底部有望于2025年左右到来。”秦泰称。

  国金证券(8.900, 0.09, 1.02%)房地产分析师池天惠指出,本次房地产新政通过供需两端的综合施策,旨在促进房地产市场的平稳健康发展。“四个取消、四个降低和两个增加”的措施,既减轻了居民的购房负担,又推动了市场的供需平衡,这将有助于房地产市场的企稳回升,为行业的可持续发展注入新的动力。

  落实到市场层面,方正证券(8.350, 0.14, 1.71%)首席经济学家芦哲表示,近期发布的政策预期,定调相对乐观,从限购完全转向重启货币化是政策的基调逐步变化的过程。本轮政策转向已经开始,当前大概率不是本轮财政刺激的终点,但政策节奏或许不会集中式而是渐进式地释放积极信号。

  “综合来看,在长期政策转向预期改变前,市场整体情绪有托底、但上行动力可能被三季报业绩、经济数据修复程度拖累,指数可能震荡。风格方面,在估值中枢全面修复之后,震荡期可能仍然更偏向有资金支持、业绩头部集中的大盘股。”芦哲说。

  以下为澎湃新闻(www.thepaper.cn)记者的详细解读。

  一、四个取消:充分赋予城市政府调控自主权,城市政府要因城施策,调整各类购房的限制性措施,主要包括取消限购,取消限售,取消限价,取消普通住宅和非普通住宅的标准。

  解读:池天惠表示,为充分赋予城市政府调控自主权,新政明确城市政府应根据本地实际情况,因城施策,调整或取消包括限购、限售、限价以及普通住宅和非普通住宅标准在内的各类限制性措施。

  “‘四个取消’这一举措,旨在释放市场活力,促进房地产市场的自由流通。”池天惠称。

  浙商证券(13.420, 0.74, 5.84%)首席经济学家李超表示,“四个取消”的核心仍在于限购调整,未来一线城市的限购政策仍有进一步放松空间。

  二、四个降低:降低公积金贷款的利率,降低住房贷款的首付比例,降低存量贷款的利率,降低卖旧、买新换购住房的税费。

  解读:秦泰表示,“四个降低”明显地传递出本轮房地产市场政策调控意图的增量政策:防范房地产市场向金融性系统风险的更大规模传导。

  “本次住建部这一系列政策叠加小幅度的货币化安置,本质上都是在防范地产需求持续收缩造成大规模居民贷款违约而进一步向金融市场传递造成更大的系统性风险。”秦泰进一步指出,目前,一线城市由于对周边城市购房需求形成“虹吸效应”,房价实际上具备进一步上涨的空间,但北京、上海、深圳反而仍在坚持因城施策的措施,并未实行全面放松,也体现了当前政策实际上是希望引导房地产市场长期健康发展的。

  秦泰指出,在防范更大规模房地产市场风险这一根本要求的前提下,再度刺激起新一轮泡沫也绝非政策导向,本次住建部的政策放松能够刺激起的新增房地产市场需求仍然有限,减缓需求的下行斜率才是根本目的。

  李超预计,“四个降低”之下全国每年可节省的公积金个人贷款利息支出约195亿元。

  “在降低购房成本方面,‘四个降低’将有效减轻居民的购房和还贷压力,支持刚性和改善性住房需求。”池天惠表示。

  三、两个增加:一是通过货币化安置的方式,新增实施100万套城中村改造和危旧房改造。二是年底前将白名单项目的信贷规模增加到4万亿元。

  解读:货币化安置方面,池天惠指出,这一转变从此前的实物安置转向货币化安置,既有利于消化库存,也能托底投资和需求。全国范围内,仅35个大城市就有170万套待改造的城中村,加上其他城市和危旧房,改造需求巨大。

  “此次对条件成熟的100万套进行改造,将显著改善居民的居住条件,同时促进房地产市场的健康发展。”池天惠表示。

  李超进一步分析称,2014年至2018年的棚改规模分别达到470万、601万套、606万套、609万套、626万套;2019和2021年分别达到316万套和165万套。因此,在地产“止跌回稳”实现之前,货币化安置仍有进一步加码空间。

  而对于4万亿元的信贷规模,李超表示,截至10月16日,“白名单”房地产项目已审批通过贷款达到2.23万亿元。因此,年底前将“白名单”项目的信贷规模增加到4万亿元,该项政策对应增量约1.77万亿元的信贷支持。

 

  池天惠指出,增加“白名单”项目的信贷规模的举措,旨在通过加大保交付白名单贷款投入,保障交房,从而修复市场信心。

  英伟达今日公布了该公司的2025财年第三财季财报。报告显示,英伟达第三财季营收为350.82亿美元,同比增长94%,环比增长17%;不按照美国通用会计准则的调整后净利润为200.10亿美元,同比增长100%,环比增长18%(注:英伟达财年与自然年不同步,2024年1月底至2025年1月底为2025财年)。

  英伟达预计2025财年第四财季营收将达375亿美元左右,超出分析师平均预期,但与最高预期的410亿美元相比存在差距。

  详见:英伟达第三财季营收350.82亿美元 净利润同比大增109%

  财报发布后,英伟达创始人、总裁兼首席执行官黄仁勋和执行副总裁兼首席财务官科莱特·克雷斯等高管出席随后召开的财报电话会议,解读财报要点并回答分析师提问。

  以下是分析是问答环节主要内容:

  Cantor Fitzgerald分析师C.J. Muse:在大型语言模型扩展规模方面,显然我们现在还处于非常早期的阶段,想知道公司是如何帮助客户处理模型扩展方面出现的问题的?当然,有些服务器集群尚未采用Blackwell架构,这是否会引发对该产品更大的需求?

  黄仁勋:基础模型方面,预训练的扩展规模仍在进行且进展良好。这是我从观察中看到的,而非物理定律角度得出的判断,有证据表明它仍在不断扩展。然而我们认为仅仅这样是不够的,我们已经发现了另外两种扩展的方式。

  一种是训练后扩展,当然,第一代训练后扩展是强化人类反馈,但现在我们有了强化学习人工智能反馈。而且所有形式的合成数据都已生成,这些数据有助于训练后扩展。其中,最重大、最令人振奋的进展之一就是ChatGPT o1(Strawberry)模型,它实现了推断时间扩展,也就是之前所讲的测试时间扩展。它思考的时间越长,给出的答案质量就越高,而且它会考虑使用像思维链、多路径规划以及各种各样思考所需的方法,有点像我们人类在回答问题之前先在头脑中进行思考的过程。所以我们现在已经有了三种扩展方式,也正因为如此,我们看到对公司基础设施的需求真的很大。

  在上一代基础模型的末期,大概是十万个Hopper的规模,下一代则从十万个Blackwell开始,这样大家大概就能了解到这个行业在预训练扩展、训练后扩展,以及现在非常重要的推理时间扩展方面的发展趋势了,需求真的很大。

  与此同时,对于我们公司来说,推理方面的扩展真的已经开始了,英伟达是当今世界上最大的推理平台,已安装的设备数量非常庞大,所有在Ampere架构和Hopper架构上训练的内容,其推理也令人难以置信地在Ampere架构和Hopper架构上进行。随着我们将Blackwell用于训练基础模型,未来同样会为推理留下了庞大的设备基数。

  所以,我们看到推理需求在上升,推理时间扩展在上升,原生人工智能公司的数量在持续增长,当然,我们也开始看到企业对代理式人工智能(Agentic AI)的采用,这确实是当下最新的潮流,我们看到来自很多不同地方的大量需求。

  高盛分析师Toshiya Hari:黄仁勋在今年早些时候进行了大规模变革,然后上周末有一些报道提到公司芯片产品出现的散热问题。另外,已经有投资者询问你如何执行今年在游戏开发者大会(GDC)上所展示的路线图,包括明年上市的Ultra芯片和2026年向Rubin平台的过渡等。能否请你讲讲这方面的情况?一些投资者对于公司能否按时执行计划存在疑问。另外一个问题关于供应短缺,我想知道是多种零部件导致了这种情况,还是具体是因为某种特定芯片或组件,比如CoWoS封装或者HBM芯片方面的问题?短缺的情况是在好转还是在恶化?

  黄仁勋:关于最后一个问题,Blackwell的生产正在全力推进,正如科莱特之前提到的,我们本季度的交付量将会超过之前的预估。供应链团队在与供应伙伴合作以增加Blackwell的产量方面做得非常出色,而且我们会在明年继续努力提高其产量。目前的情况是市场需求超过了我们的供应,我们正身处在这场生成式人工智能变革初期,所以这是预料之中的。新一代能够进行推理、能够长时间思考的基础模型刚刚推出,其中一个非常令人振奋的领域便是实体人工智能,即能够理解真实世界结构的人工智能,所以Blackwell的需求非常强劲,我们的执行情况也很顺利,团队在全球范围内正在开展大量的工程工作。包括大家看到的戴尔和CoreWeave正在搭建相关系统,甲骨文公司搭建的系统,微软也有相关系统,即将采用Grace Blackwell系统,谷歌(Google)也有相关系统,所有这些云服务提供商都在争抢先机。

  英伟达和这些公司一道开展相当复杂的工程工作,原因在于虽然我们构建了全栈和完整的基础设施,但我们需将这些人工智能超级计算机进行拆分,并集成到世界各地的定制数据中心和架构中。这个集成过程我们已经经历了好几代,现在已经很擅长了,但仍然有大量的工程工作要做,从所有正在搭建的系统来看,Blackwell的情况非常好,而且正如我们之前提到的,本季度我们计划发货的数量超过了之前的预估。

  关于供应链,我们建造了七种不同的定制配置,以便交付Blackwell系统,这些系统可以采用风冷或液冷方式,有NVLink 8或NVLink 72,或者NVLink 8、NVLink 36、NVLink 72等不同组合,还有X86或Grace架构,将所有这些系统集成到世界各地的数据中心上,简直可以说就是一个奇迹。

  要实现这样规模的产能提升,对应的所需零部件的供应链情况,你得回头看看我们上季度的Blackwell发货量是零,而本季度Blackwell系统的总发货量是以十亿为单位来衡量的,产能提升的速度令人难以置信,似乎世界上几乎每家公司都参与到了英伟达的供应链中,我们有很棒的合作伙伴,从台积电到安费诺(Amphenol)、Vertiv、SK海力士、美光、Spil、安普科(Ampcore)、京瓷(Kyec),还有富士康(FOXconn)及其建造的众多工厂、广达(Quanta)、纬颖(Wiwynn)、戴尔、惠普(HP)、超微(Supermicro)、联想(Lenovo)等等。参与Blackwell产能提升的公司数量真的相当惊人,我非常感激这些合作伙伴。

  最后,关于我们执行路线图的问题,公司有年度路线图,并且预计会继续按照年度路线图执行,这样做,我们当然能够提高平台的性能。同样非常重要的是,当我们以数倍的幅度提高性能时,我们就在降低训练成本、降低推理成本、降低人工智能的成本,使其能够更容易被大众所使用。另一个需要注意的重要因素是,一个固定规模的数据中心——数据中心总是有一定的固定规模,过去可能是几十兆瓦,现在大多数数据中心是一百兆瓦到几百兆瓦,我们还在规划千兆瓦级的数据中心——不管数据中心规模多大,电力都是有限的,而当你处于电力有限的数据中心时,每瓦特的最高性能会直接转化为我们合作伙伴的最高收益。

  所以一方面,我们的年度路线图降低了成本,另一方面,因为我们每瓦特电力所创造的性能比其他任何产品都要好,我们为客户创造了尽可能高的收益,所以这个年度节奏对我们来说非常重要,据我所知,一切都在按计划进行。

  瑞银分析师Timothy Arcuri:我想请管理层展望一下Blackwell芯片今年产能提升的情况。黄仁勋刚刚谈到Blackwell的情况比预期要好,我记得你提到发货量价值有几十亿美元,而且听起来1月份的发货量还会更多。我也记得几个月前你还说过,Blackwell在4月这个季度会超过Hopper,这一预测是否仍然有效?另外一个问题给科莱特,你提到随着Blackwell产能的提升,毛利率会下降到70%多一点,那么如果4月是产量的交叉点,是不是公司毛利率承受压力最大的时候?是不是从4月开始公司的毛利率就会处于70%多一点的低位?

  科莱特·克雷斯:我们之前讨论过,在刚开始提升Blackwell的产能时,鉴于我们推向市场的多种不同配置、多种不同芯片,我们会着重确保客户在搭建相关系统时能拥有最佳体验。一开始我们的毛利率会有所下降,在这一轮供给的初期阶段,毛利率会处于70%多一点的低位。在此之后的几个季度里,我们会开始提高毛利率,并且希望能在这一轮产能爬坡的过程中非常快地恢复到75%左右的水平。

  黄仁勋:Hopper的需求还将持续到明年,明年的前几个季度都会有需求。与此同时,Blackwell下一季度的发货量会比本季度多,再下一季度的发货量又会比(2026财年)第一季度多,通过这样的对比,大家应该能更清楚地了解情况。我们确实正处于计算机领域两项根本性转变的开端,意义相当重大。

  首先,是从在CPU上运行编码转向在GPU上运行能创建神经网络的机器学习,这种从编码到机器学习的根本性转变目前已经非常普遍了,没有哪家公司不打算开展机器学习的,而机器学习也是催生生成式人工智能等技术的基础,全球价值万亿美元的计算机系统和数据中心如今正在为适应机器学习而进行现代化改造。

  另一方面,利用这些系统,我们将要创造一种新型的能力,也就是我们熟知的人工智能。当我们谈到生成式人工智能时,本质上是说这些数据中心实际上就是人工智能工厂,就像电厂发电一样,我们开始生成人工智能了。如果人工智能的客户数量众多,就像用电的消费者数量众多一样,这些生成器,也就是数据中心,将会全天候运行,如今很多人工智能服务确实就像人工智能工厂一样在全天候运行,这种新型系统的上线确实和过去的数据中心不太一样。所以以上谈到的这两项根本性的趋势才刚刚开始,我们预计这种增长、这种现代化改造以及新产业(64.040, 0.42, 0.66%)的创建将会持续数年。

  美银美林分析师Vivek Arya:科莱特,我想明确一下,公司有可能在2025年下半年恢复到75%左右的毛利率吗?另外一个问题问给黄仁勋,从历史经验来看,当出现硬件部署周期时,这个过程中不可避免地会包含一些市场消化的阶段,你认为我们什么时候会开始进入这个阶段?还是说因为Blackwell才刚刚起步,所以现在讨论这个问题还为时过早?需要经过多少个季度,发货量才能满足第一波的市场需求?你觉得这种增长能持续到2026年吗?我们应该如何应对长期硬件部署过程中出现的市场消化?

  科莱特·克雷斯:没错,我们能在明年下半年达到75%左右的毛利率水平,这对我们来说是一个合理的假设或者说目标,但我们还得看看产能提升的具体情况进展如何。不过,确实是有这种可能性的。

  黄仁勋:我认为在我们完成对价值万亿美元的数据中心进行现代化改造之前,都不会出现你所提到的消化阶段。全世界数据中心的建造,绝大多数发生于人们还在手动编写应用程序,并在CPU上运行的时期,而现在再这么做就已经不合时宜了。当今各家公司在数据中心方面的资本支出,应该为机器学习和生成式人工智能的未来而建。接下来的若干年里会发生的情况是,全球的数据中心完成现代化改造。如你所知,信息技术产业每年大约会有20%到30%左右的增长,到2030年,全球用于计算的数据中心价值有望达到数万亿美元。我们必须朝着这个方向发展,必须将数据中心从编码应用转向机器学习应用,这是第一点。

  第二,生成式人工智能是一种世界前所未有的新型能力,一个全新的细分市场。比如OpenAI,它并没有取代任何东西,完全是全新的事物,在很多方面,就像iPhone问世时一样,它完全是全新的,并没有取代什么东西。我们会看到越来越多这样的公司,通过自己的服务创造并生成出智能,有些是像Runway那样的数字艺术智能,有些是像OpenAI那样的基础智能,有些是像Harvey那样的法律智能,还有像路透社那样的数字营销智能等等。

  这些公司的数量,也就是所谓的原生人工智能公司,有数百个之多,而且几乎每一次平台变革时,都有互联网公司的兴起,有云优先的公司,有移动优先的公司,现在则是原生人工智能公司。这些公司之所以会不断涌现,是因为人们看到了平台变革带来了全新的机会,可以去做一些全新的事情。所以我的感觉是,我们首先要继续推进信息技术的现代化改造,实现计算领域的现代化;其次,要创建这些人工智能工厂,为生产人工智能的新产业服务。

 

  (持续更新中。。。)

  在科技与时尚并驱的今天,品牌与明星的跨界合作已成为推动市场热潮的重要力量。早在8月,创维集团就正式官宣了品牌大使,与跨栏女神吴艳妮共同开启品牌发展的全新征途。而在近日,创维又携手品牌大使吴艳妮,共同发布了系列TVC视频,以“有实力,拦不住”为主题,展现了创维作为国民品牌的创新风采与吴艳妮作为体育健将的拼搏精神。此举堪称创维品牌建设的又一关键里程碑,视频所呈现的内容不仅折射出创维品牌战略的全新面貌,更是创维全屋家电硬核实力的有力彰显。

  冠军精神,赋能品牌新高度

  吴艳妮,这位在田径赛场上屡获佳绩的年轻运动员,乃是集颜值与实力于一身的中国田径女子 100 米栏领军人物。她的每一次奋力冲刺,皆是对极限的勇敢挑战,对胜利的执着渴望。创维之所以选择吴艳妮作为品牌形象大使,正是看中了她身上那股 “争第一,拦不住” 的冠军精神。在 TVC 视频中,吴艳妮的飒爽身影与创维的壁纸电视、21 天长效保鲜冰箱、AI 语音空调、大筒径洗衣机-洗净比1.10以及具备真杀菌功能的电动牙刷等产品巧妙融合,每一帧画面都传递出 “有实力,拦不住” 的独特品牌气质。

  通过此次合作,创维巧妙地将吴艳妮的竞技精神转化为品牌精神,使消费者在感受运动员拼搏精神的同时,也对创维产品的卓越性能和科技实力有了更为直观的认知。这种精神层面的强烈共鸣,无疑为创维品牌注入了崭新活力,大幅提升了其在年轻消费者心中的品牌形象,为品牌发展开辟出全新局面。

  尤为值得一提的是,创维在智能家居领域的探索从未停止。AI 语音空调的惊艳亮相,不仅让家居生活更加智能便捷,更体现了创维对未来生活方式的深刻洞察与前瞻布局。

  而电动牙刷的真杀菌功能,则是创维对健康生活理念的又一次生动践行,展现了品牌在细分市场的精准定位与创新能力。

  明星效应,激发市场新活力

  吴艳妮作为年轻一代的偶像,其阳光、健康的形象与创维的品牌气质高度契合。通过TVC视频的发布,创维得以将吴艳妮的个人魅力转化为品牌的情感纽带,进一步拉近了与年轻消费群体的距离。这种情感共鸣,不仅增强了品牌好感度,也为创维带来了更广泛的市场关注度和潜在客户群体。

  同时,创维巧妙地将吴艳妮的性格特征与品牌促销活动相结合,如通过“吴艳妮同款”促销策略,激发消费者的购买欲望,有效促进了产品销售转化。这种以明星影响力为驱动的营销策略,不仅提升了创维产品的市场竞争力,也为中国家电行业的营销创新提供了宝贵借鉴。

  创维与吴艳妮的此次合作,无疑是品牌与体育明星双赢的典范。在“有实力,拦不住”的主题口号下,创维正以更加开放的姿态,拥抱科技变革,为全球消费者带来更加智能、健康、高品质的生活体验。

 

  随着“创维x吴艳妮TVC视频”的正式上线,我们有充分理由相信,创维将以此次合作为契机,持续深化品牌内涵,强化产品创新,不断提升品牌影响力,用实际行动诠释“有实力,拦不住”,书写属于创维的辉煌篇章。