亿万游戏人，扶黄仁勋登顶-格隆汇

美国时间3月18日下午1点，加州圣何塞会议中心内星光璀璨，人头攒动。偌大的场馆里挤满了3万参会人员。“欢迎来到GTC，我希望你明白这不是一场音乐会，你来到的是开发者大会。”穿着黑色皮夹克的黄仁勋走到舞台中央说。

现场欢呼阵阵。恍惚间，时空仿佛回到2010年乔布斯发布iPhone4时万人空巷的场景。不同的是，这次的主角是英伟达创始人兼CEO黄仁勋。

与乔布斯很早就靠着Mac和iPhone被创业者奉为神明不同，黄仁勋用了20多年才站到全球科技中心，成为新的AIGC时代被行业仰望的灯塔。

谁是助力黄仁勋登顶全球创业者C位背后最大的功臣？

如果我们把视野放在更长的历史来看，这个功臣，不是马斯克，不是谷歌或者OpenAI，而是支撑英伟达一路走到今天的全球亿万游戏人。

中国用户印象深刻的是，2000年开始，电脑组装业务（俗称“攒机”）盛极一时，英伟达的GeForce系列显卡因其出色的游戏性能脱颖而出，成为组装市场上的热门选择，在游戏爱好者中享有盛誉。

二十年来，英伟达显卡从每一位游戏玩家身上赚走的钱，都被黄仁勋拿走投入新业务研发，化作全球通用人工智能大模型底座的“神经元”。

“虎口拔牙”

时间倒退回90年代，没人会想到这位要给游戏玩家做显卡的普通创业者，今天会成为和乔布斯一样的存在。

1993年，从LSI Logic（一家知名的专用芯片公司）离职的黄仁勋选择在30岁这一年创业。黄仁勋相信，终有一天，PC会成为享受游戏的消费级设备，他要在PC上做一流的游戏显卡。

对于其黄仁勋的这一决定，英伟达副总裁Rev Lebaredian说，黄仁勋是一个对图形技术潜力有深刻信念的领导者，有能力看到10年后的投资回报。

但伟大从来不是被计划的。在波谲云诡的商业世界，没人能保证10年之后事情会按照预期发展。回看1993年的芯片格局，选择在游戏显卡领域创业不失为明智之举。

20世纪末，在个人计算机（PC）时代，芯片竞争主要围绕CPU展开，英特尔和AMD明里暗里都在争夺微软这一大客户，GPU在产业上的优势和需求还未体现出来。

1993年，游戏《毁灭战士》（Doom）的大火让黄仁勋看到了独立显卡的“钱景”。

创业前3年，英伟达推出初代产品NV1和NV2。由于两者都是基于四边形而非传统的三角形渲染技术，导致其与当时主流的三维图形API（如Direct3D和OpenGL）不兼容，这一度把英伟达逼入破产的边缘。

黄仁勋经常把“我们公司还有30天就要倒闭了”挂在嘴边正是此次经历的后遗症。

此后，黄仁勋孤注一掷，解雇了50多名员工，把公司的命运押注在NV3上，也就是我们熟悉的Riva128显卡。1998年，Riva128的出货量就超过voodoo系列显卡（其背后是图形处理硬件制造商3dfx Interactive），让英伟达起死回生。

1999年1月，英伟达在纳斯达克上市。7个月后，英伟达发布其首款被冠以“GPU”（图形处理器）称号的产品——GeForce 256。

图为GeForce 256

英伟达之所以能在两年翻身并迅速上市，原因之一是赶上1997年至1998年的全球游戏浪潮。现在依然耳熟能详的游戏《拳皇97》、《质感扫雷》、《星际争霸》、《生化危机2》、《天堂》都是那个时期的爆款。

英伟达能起死回生，离不开上亿游戏玩家的青睐。

彼时，看到游戏这一“钱景”的不止英伟达，还有科技巨头英特尔和微软，但黄仁勋赢了。

1998年2月，英特尔发布了首款独立显卡i740。由于其2D效果一般，i740一度成为了英特尔在独立显卡市场的绝唱。直至2022年Intel Arc（锐炫）系列的推出，英特尔才重回独立显卡市场。

与英特尔想从独立显卡分到游戏的一杯羹不同，微软更为彻底，直接进入游戏主机市场。为和游戏主机巨头任天堂和索尼硬刚，2000年微软找到英伟达，给出了5亿美元的合同，让其为还是秘密项目的初代Xbox开发一款定制GPU——基于GeForce 3的架构的X-Chip。

这5亿美元的合同还未落袋为安，英伟达就因为微软的一个决定再次跌入低谷。

当时，为和索尼的Play Station2抢市场，微软大幅下调Xbox的售价。为了打赢这场价格战，微软希望英伟达大幅下调X-Chip的价格。

这一提议被黄仁勋一口回绝，直接导致微软放弃英伟达，转而让ATI（当时英伟达最大竞争对手）承接下一代Xbox的GPU设计。

学生时期宁愿扫厕所也不会向“坏学生”屈服的黄仁勋，没有咽下这口气，直接和当时最大的“甲方爸爸”微软对簿公堂。

叠加当时互联网泡沫阴霾未散，这直接导致英伟达股价大幅缩水。2002年初，英伟达股价一度跌至7美元左右。

直至2002年底黄仁勋拿下索尼的订单，才缓解了英伟达的燃眉之急。英伟达的这次危机让黄仁勋充分认识到，依靠单一业务和大客户无异于“虎口拔牙”。

黄仁勋做了一个关键决定，英伟达要提高自身的护城河，就要从纯粹的图形芯片制造商转型为高性能计算解决方案供应商。

“小米威武”

为拓展产品线、提高护城河，黄仁勋化身乔布斯、雷军、埃隆.马斯克的“小迷第”，不放过任何一个推销新业务的机会。

打破GPU仅是图形处理器传统认知的关键一步，是降低GPU编程的难度。2006年英伟达推出通用并行计算平台CUDA解决了这个问题。

比如CUDA提供了一套基于C/C++的高级编程接口，开发者无须掌握复杂的图形API或者低级硬件指令，可以使用熟悉的编程语言来编写GPU代码；CUDA也附带了一系列实用的库（如BLAS库、FFT库等）和工具，并提供了性能分析和调试工具，可以帮助开发者更好地优化程序性能。

但建立GPU+CUDA软硬件协同的生态并非易事，不仅需要在软硬件方面持续投入研发资金，更需要不断拓展游戏之外的新业务场景，以推动整个生态发展。

为拓展新业务，黄仁勋没有放过任何一个风口。从苹果Mac、智能手机的普及，到特斯拉开启智能汽车时代，再到加密货币及人工智能，每个风口都能看见英伟达产品的身影。

2007年，英伟达推出面向移动平台（笔记本电脑等）的图形处理器——GeForce 8M系列，并发展了苹果这一客户。不过，二者的合作并没有维持太久，2010年后，苹果Mac开始有意识的减少使用英伟达的GPU。

英伟达被苹果抛弃原因有三，一是2008年至2009年期间，使用英伟达GeForce 8600M GT GPU的MacBook出现黑屏、幕显示异常、系统崩溃等问题，这直接引发用户的集体诉讼；二是苹果有意自主研发SoC处理器，并于2010年推出了首款自研SoC芯片A4；三是因为专利纠纷，苹果开始在Mac产品中使用英特尔的处理器。

信任一旦出现裂痕就很难完全修复，失去苹果这一重要客户的黄仁勋开始亲自下场拉跑业务。为了拓展手机客户，自称是“米粉”的黄仁勋曾亲自为小米手机站台，并在现场大喊，“小米威武”。

这一幕发生在2013年9月小米3手机发布会现场。“雷军让我来和大家讲两句，而且不可以讲英文，要讲中文。很高兴和雷军一起发布世界第一款Tegra 4手机，我也是米粉，小米威武。”黄仁勋站在雷军身边手舞足蹈的说。

黄仁勋亲自为小米3手机站台

Tegra是英伟达于2008年针对智能手机等小型移动设备推出的一款基于ARM架构的系统级芯片（SoC）。2013年初，Tegra更新至Tegra 4。

事实上，全球首款采用英伟达Tegra 4处理器芯片的智能手机并非小米，而是两个月前发布的中兴U988S移动版。黄仁勋之所以对小米如此热情，还把小米3定义为“世界首款Tegra 4手机”或许是因为彼时的小米是中国最红的手机公司，雷军也因推出便宜的红米手机成为“雷布斯”。

从英伟达的营收构成看，英伟达其他业务（包含OEM和知识产权等）确实在2014财年达到了历史高点，为15.32亿美元，超过游戏相关业务的15.11美元。

不过，黄仁勋的热情并没有持续打动雷军，由于英伟达在基带芯片领域有短板，Tegra 4处理器并未整合基带芯片，所以小米3移动版在搭载Tegra 4处理器时，还外挂了展讯的基带芯片，这不仅会提升设计复杂性还会增加生产成本。

小米3移动版成为唯一一款大规模搭载Tegra 4的小米手机。

有了小米3手机的“负面效应”，英伟达包含OEM的“其他业务”营收开始一路下滑。2015财年至2021财年，该业务营收分别为13.29 亿美元、7.83亿美元、6.98亿美元、7.77亿美元、7.67亿美元、5.05亿美元、6.31亿美元。

有了此前被微软“背刺”的经历，黄仁勋自然不会把鸡蛋放到一个篮子里。在和小米合作之前，黄仁勋还将Tegra 芯片推荐给了特斯拉创始人埃隆.马斯克。

2012年，特斯拉宣布采用英伟达Tegra 3芯片，并在2014年交付的Model S高端车型上率先使用。Tegra 3芯片被用于处理车辆摄像头和传感器收集的数据，以支持特斯拉Autopilot系统的初步自动驾驶功能。

Model S的交付推动了智能汽车产业发展浪潮。为抢占风口，英伟达于2015年推出专为汽车应用设计的计算平台系列DRIVE系列，包括面向车载信息娱乐系统的DRIVE CX和面向自动驾驶系统的DRIVE PX。

黄仁勋和马斯克在2015年英伟达GTC大会上

黄仁勋和马斯克的“蜜月期”仅持续了5年多。为减少对外部供应商的依赖，并更好地控制自动驾驶技术路径和进度，马斯克坚持自研自动驾驶软硬件。

2016年特斯拉还在Autopilot 2.0系统上采用英伟达的Drive PX 2计算平台作为其硬件基础，但在Autopilot 3.0（2019年推出）就转向自家研发的软硬件系统FSD（Full Self-Driving）。

图为英伟达2007—2023财年研发费用的变化（百万美元）

从2006推出CUDA至2019年，伴随着英伟达拓展游戏之外新业务，其研发费用开始翻倍增长。但从营收构成看，飕飕增长的研发费用并没有在新业务中起到化学反应。2020财年之前支撑英伟达营收增长的一直是游戏业务，营收占比一直在50%以上。

可以这么说，在英伟达花钱拓展新业务的背后，全球的游戏玩家都有出一份力。

英伟达对游戏玩家也颇具敬畏之心，在加密货币大火的那两年（2019年至2020年），为确保游戏显卡更多地服务游戏玩家，特意限制了部分游戏显卡在加密货币挖矿中的性能。

“游戏，轮回”

黄仁勋增加新业务的关键是拓展GPU的应用范围，让客户了解独立显卡不仅能提升游戏体验，GPU强大的并行计算能力还可赋能智能手机、新能源汽车及人工智能等领域。

尽管英伟达在手机、汽车等领域发展不尽如人意，但命运对黄仁勋的馈赠在十年前已经埋下。

2012年，“深度学习教父”辛顿带着他的两位学生Alex Krizhevsky和Ilya Sutskeverz（后来成为OpenAI的首席科学家），参加了全球最为权威的计算机视觉大赛ImageNet大赛，并一举夺冠。其设计的深度卷积神经网络AlexNet把图像识别错误率错误率从上一年的26.2%降至15.3%。

AlexNet之所以能降低图像识别错误率原因之一是，辛顿团队一改传统使用CPU训练的做法，改用英伟达GPU训练。相比谷歌猫（Google Brain于2012年推出的项目）用了16000颗CPU，AlexNet只用了4颗英伟达GPU。

AlexNet的一战成名让深度学习的研究人员意识到，GPU不仅可以给《光环》、《侠盗猎车手》等电子游戏渲染图形，其并行计算的优势同样擅长运行神经网络的训练。

事实上，早在20世纪七八十年代，学术界就有了关于神经网络和深度学习的研究和理论，但其开始崛起主要是因为GPU的出现，而让行业相信GPU可以提高模型训练效率的正是辛顿。

从左至右依次为Ilya Sutskeverz、Alex Krizhevsky和辛顿

如果说，辛顿是从GPU的算力方面发现“游戏”在加速深度学习中的作用，那么DeepMind和OpenAI 则是从训练方法论上发现了游戏的厉害之处。

2016年3月9日，围棋机器人AlphaGo因战胜世界著名棋手李世石而名噪一时。AlphaGo之所以能一战成名，源头还要从其训练AI方法—“让系统玩游戏”说起。

DeepMind打造通用人工智能的起点是会玩游戏的系统，因为其创始人戴密斯.哈萨比斯认为，在人工智能的开发过程中，研究人员应该密切评估其进展，而游戏则提供了这种评估标准。因为在游戏中，分数和结果都是确定的，可以为人工智能体系提供即时的反馈信号，方便重复实验以测量性能提升。

比如，DeepMind就曾通过他们打造的深度神经网络反复学习《越狱》游戏，密切跟踪哪些动作有效、哪些无效。两个多小时后，该系统玩游戏的速度和精度就超越了所有人类玩家。

OpenAI之所以会想出用GPU训练对话和生成式模型也是源于辛顿的提醒。

DOTA2 OpenAI机器人

“GPU出现在我们多伦多实验室，要感谢杰弗里.辛顿，他说我们应该试试 GPU。最初我们也没搞懂GPU怎么发挥作用，但随着 ImageNet数据集的出现，卷积神经网络非常适合GPU的模型。它让训练变得非常快，能做规模远超以前的训练。”前OpenAI联合创始人、首席科学家Ilya Sutskever在和黄仁勋的“炉边谈话”中如此阐述。

和DeepMind一样，OpenAI也发现游戏在训练和测试人工智能系统优势。

OpenAI广为世人所知的杰作是聊天机器人软件ChatGPT。但在人工智能领域，OpenAI在2019年就因为其训练的神经网络OpenAI Five（由5个神经网络组成的队伍）击败了DOTA 2的世界冠军战队OG而名噪一时。

Dota 2是一个多人线上游戏，其在海外的知名度不亚于《星际争霸Ⅱ》。因为Dota 2游戏规则复杂多变，此前没人相信人工智能可以战胜专业选手。但OpenAI Five却通过反复训练和学习做到了。

从另一层面看，其实硅谷的商业和技术精英中，本身就存在着大量游戏爱好者。

现在，让神经网络玩游戏已经成为训练AI的重要手段之一，这对于英伟达来说，犹如一个轮回。

30年前，英伟达从GPU起家，步履蹒跚，靠着游戏显卡和玩家活下来。30年后，凭借其在并行计算的积累，英伟达在AGI世界中开辟出一条康庄大道。

ChatGPT大火以后，训练大模型要抢购英伟达的高端GPU已成为行业共识。黄仁勋经常拿出来讲的一个故事是，公司在2016年把首台搭载了8块P100 GPU的DGX-1送给了OpenAI。

2016年8月，黄仁勋把第一台DGX-1捐给成立不到一年的Open AI，此前捐款一亿美元的马克思也被邀请见证

过去一年，全球大型科技公司疯抢英伟达芯片和服务器。

英伟达的H100 GPU不仅是Meta、亚马逊、甲骨文、谷歌等科技巨头争抢的对象，还一度成为和黄金类似的硬通货。

去年，一台由8张A800组成的服务器一度从230万被炒至到330万，谁能抢到英伟达芯片就犹如拿到了一台印钞机。

比如，超微电脑（主业是服务器解决方案）过去一年市值从默默无闻到如今股价暴涨1300%，部分原因是其创始人梁见后有对黄仁勋鼎力相助的情分，超微电脑总能第一时间拿到英伟达显卡。

在国内，英伟达的芯片和服务器价格一路水涨船高，成为百度、阿里、腾讯、字节、美团等巨头和创业公司布局AGI大模型的核心竞争力。

当然，英伟达也并非能完全高枕无忧，已有多家公司宣布其研发的AI芯片计算能力超过英伟达。比如，创业公司Groq就宣称其推出的AI加速芯片LPU推理性能是英伟达GPU的10倍，成本仅为其十分之一。

不过，硬件的算力仅是一部分，英伟达CUDA生态上丰富开发者社区、开源项目和第三方支持库等已为其构筑了坚不可摧的护城河。毕竟，生态的切换是一个庞大且复杂的工程。

从整个财年看，游戏业务（Gaming）首次被数据中心（Datacenter）业务超越是2023财年（对应自然年为2022年）。2022年ChatGPT的横空出世让行业看到了人工智能“技术奇点”到来的可能性。

2024财年，英伟达数据中心业务营收475.25亿美元，是游戏相关业务营收的4.6倍。直到此时，在游戏领域蛰伏了20多年的英伟达才真正找到属于自己的财富高增长密码。

亿万游戏人，扶黄仁勋登顶

“虎口拔牙”

“小米威武”

“游戏，轮回”

相关阅读

评论