亿万游戏人,扶黄仁勋登顶

本文来自:深网腾讯新闻;作者: 安然

猜不透的创新之路

美国时间3月18日下午1点,加州圣何塞会议中心内星光璀璨,人头攒动。偌大的场馆里挤满了3万参会人员。“欢迎来到GTC,我希望你明白这不是一场音乐会,你来到的是开发者大会。”穿着黑色皮夹克的黄仁勋走到舞台中央说。

现场欢呼阵阵。恍惚间,时空仿佛回到2010年乔布斯发布iPhone4时万人空巷的场景。不同的是,这次的主角是英伟达创始人兼CEO黄仁勋。

与乔布斯很早就靠着Mac和iPhone被创业者奉为神明不同,黄仁勋用了20多年才站到全球科技中心,成为新的AIGC时代被行业仰望的灯塔。

谁是助力黄仁勋登顶全球创业者C位背后最大的功臣?

如果我们把视野放在更长的历史来看,这个功臣,不是马斯克,不是谷歌或者OpenAI,而是支撑英伟达一路走到今天的全球亿万游戏人。

中国用户印象深刻的是,2000年开始,电脑组装业务(俗称“攒机”)盛极一时,英伟达的GeForce系列显卡因其出色的游戏性能脱颖而出,成为组装市场上的热门选择,在游戏爱好者中享有盛誉。

二十年来,英伟达显卡从每一位游戏玩家身上赚走的钱,都被黄仁勋拿走投入新业务研发,化作全球通用人工智能大模型底座的“神经元”。   


“虎口拔牙”


时间倒退回90年代,没人会想到这位要给游戏玩家做显卡的普通创业者,今天会成为和乔布斯一样的存在。

1993年,从LSI Logic(一家知名的专用芯片公司)离职的黄仁勋选择在30岁这一年创业。黄仁勋相信,终有一天,PC会成为享受游戏的消费级设备,他要在PC上做一流的游戏显卡。

对于其黄仁勋的这一决定,英伟达副总裁Rev Lebaredian说,黄仁勋是一个对图形技术潜力有深刻信念的领导者,有能力看到10年后的投资回报。

但伟大从来不是被计划的。在波谲云诡的商业世界,没人能保证10年之后事情会按照预期发展。回看1993年的芯片格局,选择在游戏显卡领域创业不失为明智之举。

20世纪末,在个人计算机(PC)时代,芯片竞争主要围绕CPU展开,英特尔和AMD明里暗里都在争夺微软这一大客户,GPU在产业上的优势和需求还未体现出来。

1993年,游戏《毁灭战士》(Doom)的大火让黄仁勋看到了独立显卡的“钱景”。

创业前3年,英伟达推出初代产品NV1和NV2。由于两者都是基于四边形而非传统的三角形渲染技术,导致其与当时主流的三维图形API(如Direct3D和OpenGL)不兼容,这一度把英伟达逼入破产的边缘。

黄仁勋经常把“我们公司还有30天就要倒闭了”挂在嘴边正是此次经历的后遗症。   

此后,黄仁勋孤注一掷,解雇了50多名员工,把公司的命运押注在NV3上,也就是我们熟悉的Riva128显卡。1998年,Riva128的出货量就超过voodoo系列显卡(其背后是图形处理硬件制造商3dfx Interactive),让英伟达起死回生。

1999年1月,英伟达在纳斯达克上市。7个月后,英伟达发布其首款被冠以“GPU”(图形处理器)称号的产品——GeForce 256。

图为GeForce 256

英伟达之所以能在两年翻身并迅速上市,原因之一是赶上1997年至1998年的全球游戏浪潮。现在依然耳熟能详的游戏《拳皇97》、《质感扫雷》、《星际争霸》、《生化危机2》、《天堂》都是那个时期的爆款。

英伟达能起死回生,离不开上亿游戏玩家的青睐。

彼时,看到游戏这一“钱景”的不止英伟达,还有科技巨头英特尔和微软,但黄仁勋赢了。

1998年2月,英特尔发布了首款独立显卡i740。由于其2D效果一般,i740一度成为了英特尔在独立显卡市场的绝唱。直至2022年Intel Arc(锐炫)系列的推出,英特尔才重回独立显卡市场。   

与英特尔想从独立显卡分到游戏的一杯羹不同,微软更为彻底,直接进入游戏主机市场。为和游戏主机巨头任天堂和索尼硬刚,2000年微软找到英伟达,给出了5亿美元的合同,让其为还是秘密项目的初代Xbox开发一款定制GPU——基于GeForce 3的架构的X-Chip。

这5亿美元的合同还未落袋为安,英伟达就因为微软的一个决定再次跌入低谷。

当时,为和索尼的Play Station2抢市场,微软大幅下调Xbox的售价。为了打赢这场价格战,微软希望英伟达大幅下调X-Chip的价格。

这一提议被黄仁勋一口回绝,直接导致微软放弃英伟达,转而让ATI(当时英伟达最大竞争对手)承接下一代Xbox的GPU设计。

学生时期宁愿扫厕所也不会向“坏学生”屈服的黄仁勋,没有咽下这口气,直接和当时最大的“甲方爸爸”微软对簿公堂。

叠加当时互联网泡沫阴霾未散,这直接导致英伟达股价大幅缩水。2002年初,英伟达股价一度跌至7美元左右。

直至2002年底黄仁勋拿下索尼的订单,才缓解了英伟达的燃眉之急。英伟达的这次危机让黄仁勋充分认识到,依靠单一业务和大客户无异于“虎口拔牙”。

黄仁勋做了一个关键决定,英伟达要提高自身的护城河,就要从纯粹的图形芯片制造商转型为高性能计算解决方案供应商。   


“小米威武”


为拓展产品线、提高护城河,黄仁勋化身乔布斯、雷军、埃隆.马斯克的“小迷第”,不放过任何一个推销新业务的机会。

打破GPU仅是图形处理器传统认知的关键一步,是降低GPU编程的难度。2006年英伟达推出通用并行计算平台CUDA解决了这个问题。

比如CUDA提供了一套基于C/C++的高级编程接口,开发者无须掌握复杂的图形API或者低级硬件指令,可以使用熟悉的编程语言来编写GPU代码;CUDA也附带了一系列实用的库(如BLAS库、FFT库等)和工具,并提供了性能分析和调试工具,可以帮助开发者更好地优化程序性能。

但建立GPU+CUDA软硬件协同的生态并非易事,不仅需要在软硬件方面持续投入研发资金,更需要不断拓展游戏之外的新业务场景,以推动整个生态发展。

为拓展新业务,黄仁勋没有放过任何一个风口。从苹果Mac、智能手机的普及,到特斯拉开启智能汽车时代,再到加密货币及人工智能,每个风口都能看见英伟达产品的身影。

2007年,英伟达推出面向移动平台(笔记本电脑等)的图形处理器——GeForce 8M系列,并发展了苹果这一客户。不过,二者的合作并没有维持太久,2010年后,苹果Mac开始有意识的减少使用英伟达的GPU。

英伟达被苹果抛弃原因有三,一是2008年至2009年期间,使用英伟达GeForce 8600M GT  GPU的MacBook出现黑屏、幕显示异常、系统崩溃等问题,这直接引发用户的集体诉讼;二是苹果有意自主研发SoC处理器,并于2010年推出了首款自研SoC芯片A4;三是因为专利纠纷,苹果开始在Mac产品中使用英特尔的处理器。

信任一旦出现裂痕就很难完全修复,失去苹果这一重要客户的黄仁勋开始亲自下场拉跑业务。为了拓展手机客户,自称是“米粉”的黄仁勋曾亲自为小米手机站台,并在现场大喊,“小米威武”。

这一幕发生在2013年9月小米3手机发布会现场。“雷军让我来和大家讲两句,而且不可以讲英文,要讲中文。很高兴和雷军一起发布世界第一款Tegra 4手机,我也是米粉,小米威武。”黄仁勋站在雷军身边手舞足蹈的说。

黄仁勋亲自为小米3手机站台

Tegra是英伟达于2008年针对智能手机等小型移动设备推出的一款基于ARM架构的系统级芯片(SoC)。2013年初,Tegra更新至Tegra 4。

事实上,全球首款采用英伟达Tegra 4处理器芯片的智能手机并非小米,而是两个月前发布的中兴U988S移动版。黄仁勋之所以对小米如此热情,还把小米3定义为“世界首款Tegra 4手机”或许是因为彼时的小米是中国最红的手机公司,雷军也因推出便宜的红米手机成为“雷布斯”。

从英伟达的营收构成看,英伟达其他业务(包含OEM和知识产权等)确实在2014财年达到了历史高点,为15.32亿美元,超过游戏相关业务的15.11美元。

不过,黄仁勋的热情并没有持续打动雷军,由于英伟达在基带芯片领域有短板,Tegra 4处理器并未整合基带芯片,所以小米3移动版在搭载Tegra 4处理器时,还外挂了展讯的基带芯片,这不仅会提升设计复杂性还会增加生产成本。

小米3移动版成为唯一一款大规模搭载Tegra 4的小米手机。

有了小米3手机的“负面效应”,英伟达包含OEM的“其他业务”营收开始一路下滑。2015财年至2021财年,该业务营收分别为13.29 亿美元、7.83亿美元、6.98亿美元、7.77亿美元、7.67亿美元、5.05亿美元、6.31亿美元。   

有了此前被微软“背刺”的经历,黄仁勋自然不会把鸡蛋放到一个篮子里。在和小米合作之前,黄仁勋还将Tegra 芯片推荐给了特斯拉创始人埃隆.马斯克。

2012年,特斯拉宣布采用英伟达Tegra 3芯片,并在2014年交付的Model S高端车型上率先使用。Tegra 3芯片被用于处理车辆摄像头和传感器收集的数据,以支持特斯拉Autopilot系统的初步自动驾驶功能。

Model S的交付推动了智能汽车产业发展浪潮。为抢占风口,英伟达于2015年推出专为汽车应用设计的计算平台系列DRIVE系列,包括面向车载信息娱乐系统的DRIVE CX和面向自动驾驶系统的DRIVE PX。

黄仁勋和马斯克在2015年英伟达GTC大会上

黄仁勋和马斯克的“蜜月期”仅持续了5年多。为减少对外部供应商的依赖,并更好地控制自动驾驶技术路径和进度,马斯克坚持自研自动驾驶软硬件。

2016年特斯拉还在Autopilot 2.0系统上采用英伟达的Drive PX 2计算平台作为其硬件基础,但在Autopilot 3.0(2019年推出)就转向自家研发的软硬件系统FSD(Full Self-Driving)。   

图为英伟达2007—2023财年研发费用的变化(百万美元)

从2006推出CUDA至2019年,伴随着英伟达拓展游戏之外新业务,其研发费用开始翻倍增长。但从营收构成看,飕飕增长的研发费用并没有在新业务中起到化学反应。2020财年之前支撑英伟达营收增长的一直是游戏业务,营收占比一直在50%以上。

可以这么说,在英伟达花钱拓展新业务的背后,全球的游戏玩家都有出一份力。

英伟达对游戏玩家也颇具敬畏之心,在加密货币大火的那两年(2019年至2020年),为确保游戏显卡更多地服务游戏玩家,特意限制了部分游戏显卡在加密货币挖矿中的性能。


“游戏,轮回”


黄仁勋增加新业务的关键是拓展GPU的应用范围,让客户了解独立显卡不仅能提升游戏体验,GPU强大的并行计算能力还可赋能智能手机、新能源汽车及人工智能等领域。   

尽管英伟达在手机、汽车等领域发展不尽如人意,但命运对黄仁勋的馈赠在十年前已经埋下。

2012年,“深度学习教父”辛顿带着他的两位学生Alex Krizhevsky和Ilya Sutskeverz(后来成为OpenAI的首席科学家),参加了全球最为权威的计算机视觉大赛ImageNet大赛,并一举夺冠。其设计的深度卷积神经网络AlexNet把图像识别错误率错误率从上一年的26.2%降至15.3%。

AlexNet之所以能降低图像识别错误率原因之一是,辛顿团队一改传统使用CPU训练的做法,改用英伟达GPU训练。相比谷歌猫(Google Brain于2012年推出的项目)用了16000颗CPU,AlexNet只用了4颗英伟达GPU。

AlexNet的一战成名让深度学习的研究人员意识到,GPU不仅可以给《光环》、《侠盗猎车手》等电子游戏渲染图形,其并行计算的优势同样擅长运行神经网络的训练。

事实上,早在20世纪七八十年代,学术界就有了关于神经网络和深度学习的研究和理论,但其开始崛起主要是因为GPU的出现,而让行业相信GPU可以提高模型训练效率的正是辛顿。

    从左至右依次为Ilya Sutskeverz、Alex Krizhevsky和辛顿

如果说,辛顿是从GPU的算力方面发现“游戏”在加速深度学习中的作用,那么DeepMind和OpenAI 则是从训练方法论上发现了游戏的厉害之处。

2016年3月9日,围棋机器人AlphaGo因战胜世界著名棋手李世石而名噪一时。AlphaGo之所以能一战成名,源头还要从其训练AI方法—“让系统玩游戏”说起。

DeepMind打造通用人工智能的起点是会玩游戏的系统,因为其创始人戴密斯.哈萨比斯认为,在人工智能的开发过程中,研究人员应该密切评估其进展,而游戏则提供了这种评估标准。因为在游戏中,分数和结果都是确定的,可以为人工智能体系提供即时的反馈信号,方便重复实验以测量性能提升。

比如,DeepMind就曾通过他们打造的深度神经网络反复学习《越狱》游戏,密切跟踪哪些动作有效、哪些无效。两个多小时后,该系统玩游戏的速度和精度就超越了所有人类玩家。

OpenAI之所以会想出用GPU训练对话和生成式模型也是源于辛顿的提醒。   

 DOTA2 OpenAI机器人

“GPU出现在我们多伦多实验室,要感谢杰弗里.辛顿,他说我们应该试试 GPU。最初我们也没搞懂GPU怎么发挥作用,但随着 ImageNet数据集的出现,卷积神经网络非常适合GPU的模型。它让训练变得非常快,能做规模远超以前的训练。”前OpenAI联合创始人、首席科学家Ilya Sutskever在和黄仁勋的“炉边谈话”中如此阐述。

和DeepMind一样,OpenAI也发现游戏在训练和测试人工智能系统优势。

OpenAI广为世人所知的杰作是聊天机器人软件ChatGPT。但在人工智能领域,OpenAI在2019年就因为其训练的神经网络OpenAI Five(由5个神经网络组成的队伍)击败了DOTA 2的世界冠军战队OG而名噪一时。

Dota 2是一个多人线上游戏,其在海外的知名度不亚于《星际争霸Ⅱ》。因为Dota 2游戏规则复杂多变,此前没人相信人工智能可以战胜专业选手。但OpenAI Five却通过反复训练和学习做到了。

从另一层面看,其实硅谷的商业和技术精英中,本身就存在着大量游戏爱好者。

现在,让神经网络玩游戏已经成为训练AI的重要手段之一,这对于英伟达来说,犹如一个轮回。   

30年前,英伟达从GPU起家,步履蹒跚,靠着游戏显卡和玩家活下来。30年后,凭借其在并行计算的积累,英伟达在AGI世界中开辟出一条康庄大道。

ChatGPT大火以后,训练大模型要抢购英伟达的高端GPU已成为行业共识。黄仁勋经常拿出来讲的一个故事是,公司在2016年把首台搭载了8块P100 GPU的DGX-1送给了OpenAI。

2016年8月,黄仁勋把第一台DGX-1捐给成立不到一年的Open AI,此前捐款一亿美元的马克思也被邀请见证

过去一年,全球大型科技公司疯抢英伟达芯片和服务器。

英伟达的H100 GPU不仅是Meta、亚马逊、甲骨文、谷歌等科技巨头争抢的对象,还一度成为和黄金类似的硬通货。

去年,一台由8张A800组成的服务器一度从230万被炒至到330万,谁能抢到英伟达芯片就犹如拿到了一台印钞机。   

比如,超微电脑(主业是服务器解决方案)过去一年市值从默默无闻到如今股价暴涨1300%,部分原因是其创始人梁见后有对黄仁勋鼎力相助的情分,超微电脑总能第一时间拿到英伟达显卡。

在国内,英伟达的芯片和服务器价格一路水涨船高,成为百度、阿里、腾讯、字节、美团等巨头和创业公司布局AGI大模型的核心竞争力。

当然,英伟达也并非能完全高枕无忧,已有多家公司宣布其研发的AI芯片计算能力超过英伟达。比如,创业公司Groq就宣称其推出的AI加速芯片LPU推理性能是英伟达GPU的10倍,成本仅为其十分之一。

不过,硬件的算力仅是一部分,英伟达CUDA生态上丰富开发者社区、开源项目和第三方支持库等已为其构筑了坚不可摧的护城河。毕竟,生态的切换是一个庞大且复杂的工程。

从整个财年看,游戏业务(Gaming)首次被数据中心(Datacenter)业务超越是2023财年(对应自然年为2022年)。2022年ChatGPT的横空出世让行业看到了人工智能“技术奇点”到来的可能性。

2024财年,英伟达数据中心业务营收475.25亿美元,是游戏相关业务营收的4.6倍。直到此时,在游戏领域蛰伏了20多年的英伟达才真正找到属于自己的财富高增长密码。    

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论