新智元报道
:乔杨 好困
【新智元导读】 1999年,英伟达发布世界上首款GPU——GeForce 256。不仅彻底革新了游戏PC,更为之后的AI浪潮提供了无可比拟的动力。
1999年10月11日,正值世纪之交,一场科技革命正在悄然酝酿。
25年前的今天,英伟达发布了首款GeForece显卡——GeForce 256。
GeForce 256不仅仅是一张显卡,它也是世界上第一款GPU。虽然这一发布当时只有PC游戏玩家和科技爱好者关注,但却为今天生成式AI奠定了基础,铺就了未来游戏和计算领域的进步。
25周年整活欢庆
为了庆祝全球首款GPU25岁的生日,英伟达总部特意摆出了绿色爆米花。
英伟达总部举行周年纪念展示
官方放出的周年庆视频,从今年的《黑悟空》往前回溯,一幕幕都是英伟达GPU所赋能的各种游戏。
纳斯达克也和英伟达联动整活,把交易所附近弄成了绿油油的一片。
毕竟,没有GPU,就不会有英伟达如今的股价奇迹。
老黄本人,也前往纳斯达克大厅纪念这个革命性的时刻。
叉腰站在纳斯达克前的老黄,大广角镜头仰拍,俨然是指点江山的当代科技领袖。
世界上第一张GPU——游戏改变者
1999年,虽然市面上存在其他显卡,但GeForce 256是第一款以「GPU」为广告宣传的桌面卡。
当时至少有六家,甚至更多不同的公司生产视频卡硬件,但它们后来几乎都被AMD或英伟达收购。
GeForce 256究竟是不是实质上的第一块显卡?已经无从考证,但英伟达首次做出了这种区分,并大张旗鼓地将其称为GPU。
GeForce 256是首批支持当时新兴的T&L技术的显卡之一,减少了游戏中CPU的工作量,提供了视觉升级和更好的性能。
从固定功能T&L引擎,到可编程的顶点和像素着色器,再到统一着色器,现在又增加了网格着色器、光线追踪和AI计算等功能,所有现代显卡的设计很大程度上都归功于最初的GeForce。
最初的GeForce 256使用139 mm^2芯片,封装了1700 万个晶体管,采用台积电220nm工艺节点制造。
相比之下,当时的英特尔奔腾III 450 CPU使用250nm节点,将950万个晶体管封装到128 mm^2芯片中。这意味着, GeForce 256的尺寸增加了不到10%,晶体管总数却增加了80%。
1999年,GeForce 256的发行价格为199美元;考虑到通货膨胀因素,换算成今天的价格大致为373美元。
然而,过去25年中,英伟达的芯片技术和价格一起经历着突飞猛进。今天的高端CPU的价格仍然远低于500美元,但RTX 4090的起价已经达到了约1800美元。
与此同时,英伟达RTX 4090在608 mm^2的面积中封装了AD102芯片,采用台积电4N节点,内含760亿个晶体管。
GeForce 256标志着一个时间节点——GPU和显卡开始崛起,成为游戏PC最重要的组成部分,具有完整的 DirectX 7和OpenGL支持。
随着DirectX 8添加可编程着色器,GPU真正开始演进为一种不同的计算方式。如今的GPU提供高达petaflops 的计算性能,不仅仅为游戏行业带来了变革,也在为AI的狂飙式发展提供动力。
从游戏到AI
并行计算改变了游戏CG,也引起了研究人员的注意。他们意识到GPU可以在AI方向发挥巨大的计算潜力,能在游戏世界之外实现突破。
深度学习是一种依赖数十亿神经元和万亿连接的软件模型,需要巨大的算力。
传统的CPU设计用于顺序任务,无法高效处理这样的工作负载。而GPU凭借其大规模并行架构,完美胜任这一任务。
到2011 年,AI研究人员发现,英伟达的GPU具有处理深度学习庞大计算需求的能力。
谷歌、斯坦福大学和纽约大学的研究人员开始使用英伟达GPU加速AI开发,达到了以前只有超算才能实现的性能。
2012年出现了突破。多伦多大学的Alex Krizhevsky利用英伟达GPU赢得了ImageNet图像识别竞赛。他所用的神经网络AlexNet在一百万张图像上进行训练,击败了由视觉专家人工编写的软件。
这标志着科技领域的重大转变。曾经像科幻小说一样的情景——计算机通过大量数据自主学习和适应——如今在GPU的强大性能推动下成为现实。
到2015年,AI在感知能力上已达到超人水平,谷歌、微软等科技巨头所训练的模型,在图像识别、语音理解等任务中超越了人类表现,而这一切都由在GPU上运行的深度神经网络驱动。
2016年,老黄向OpenAI捐赠了第一台 NVIDIA DGX-1 AI 超级计算机,亲自送货、亲手安装。
DGX配备了8个当时最先进的GPU,OpenAI随后利用这些GPU训练了ChatGPT。
之后的故事我们都知道了。
2022年发布的ChatGPT在几个月内用户量破亿,展示了以GPU为代表的算力是如何在生成式AI变革中发挥巨大力量的。
「强化学习之父」Rich Sutton在一次演讲中表示,过去的100多年中,我们一直在见证摩尔定律。近年来AI领域的进步,至少有一半归功于算力方面指数级的增长。
未来,英伟达还将通过硬件方面的创新,缔造怎样的技术变革?
参考资料:
https://blogs.nvidia.com/blog/first-gpu-gaming-ai/
https://www.tomshardware.com/pc-components/gpus/nvidia-geforce-256-celebrates-its-25th-birthday-company-talks-about-a-quarter-century-of-gpu-progression
消失的第三方之图形显示芯片篇
在当今的显卡市场,英伟达和AMD几乎垄断了消费者的选择,两家公司的产品线清晰且技术对比深入人心。 然而,回顾过去,图形显示芯片市场曾是群雄逐鹿的“战国时代”。 20到25年前,消费者有更多品牌可供选择,如3dfx,其Voodoo系列在1996年凭借Voodoo和Glide API颠覆了市场,让3D应用体验变得触手可及。 尽管如此,3dfx的辉煌如流星般短暂,其膨胀和傲慢导致了市场份额的丧失,最终被英伟达收购。 SiS和XGI这两个品牌更多地被视为主板芯片组厂商的副业,SiS曾试图在图形领域发力,但重心始终在芯片组上,而XGI则在被AMD并购后淡出显卡市场。 3Dlabs作为专业领域的领导者,曾主导OpenGL标准,但随着DirectX的崛起,逐渐失去市场。 Trident作为多媒体先驱,曾主导电视和家庭娱乐市场,但在3D时代遭遇挑战,最终破产。 PowerVR则在移动市场找到了新生,凭借TBDR技术引领变革,从PC领域的边缘角色转变为移动图形技术的引领者。 ATI作为最后的双雄之一,通过坚持技术研发和与微软的紧密合作,与英伟达展开激烈竞争。 Matrox则以色彩和多屏显示技术著称,尤其在专业领域拥有传奇地位,但逐渐转向了专业市场。 S3 Graphics曾是显卡市场的霸主,但驱动问题和收购策略使其逐渐式微,最终被HTC收购。
全球芯片排名前十
1、英特尔公司成立于1968年,是全球半导体行业和计算创新领域的领先厂商。 作为世界上最大的半导体芯片制造商,英特尔拥有数十年的生产历史,自推出全球首个处理器以来,对我们的生活产生了重大影响,并引发了信息技术革命。 2、高通成立于1985年,是美国较大的无生产线半导体生产商、无线芯片组及软件技术供应商。 高通是5G研发、商用与实现规模化的推动力量之一,致力于发明突破性基础科技,改变了世界连接、计算和沟通的方式。 高通的芯片在GPU性能上具有优势,在游戏过程中表现突出,且兼容性好,是移动CPU中兼容性最好的。 3、英伟达始创于1993年,是全球知名的电脑显卡供应商,也是较早推出图形处理器技术的公司。 Nvidia的芯片架构能够在通用性和效率之间实现良好的平衡,在此基础上,一套易用且能充分调动芯片架构潜力的软件生态则让Nvidia在机器学习模型社区拥有巨大的影响力。 4、联发科技是台湾上市公司,始创于1997年,是一家专注于创造横跨信息科技、消费电子及无线通信领域的IC解决方案的现代化企业。 目前,联发科技已经是全球第四大半导体公司,旗下研发的芯片一年会驱动超过15亿台智能终端设备。 5、海思是华为技术公司旗下的企业,自1991年起专注于制造消费电子、通信等领域的光网络芯。 海思芯片虽然大多数自用,但仅是华为手机的销量,就已经让海思在国内手机芯片市场超过高通,并曾进入全球半导体前十大供应商,显示出海思的强大实力。 6、博通是全球基础架构技术供应商,创立于1991年,专注于提供半导体和基础设施软件解决方案。 博通的ETC芯片占据市场份额七成,但ETC占博通收入只有约10%,ETC芯片在博通集成公司收入占比微不足道,可以忽略不计。 7、AMD创立于1969年,在2006年收购了芯片巨头ATI公司,是一家专注于微处理器设计和制造的大型跨国公司。 自成立以来,AMD在半导体产品领域进行了多项突破性的行业创新,始终处于行业前沿。 8、TI德州仪器始于1930年,以开发制造半导体和计算机技术而闻名,75年来TI公司卓有成效地推动着社会发展。 从默默无闻地开发德州油田到在全球市场占据领先地位,TI在其员工理念的指引下逐步发展壮大。 9、ST意法半导体是意大利的SG微电子公司与法国Thomson半导体公司合并而成的,成立于1988年,是目前世界较大的半导体公司。 旗下不仅有知识产权含量高的专用产品,还有多领域的创新产品,如安全性智能卡芯片、高性能微控制器等。 10、NXP源自于荷兰,前身是飞利浦旗下的分支公司,是全球性汽车半导体品牌,全球前十大半导体公司之一,总部位于荷兰Eindhoven。 NXP的电源管理芯片可以开发新的工艺、封装和电路设计技术,也将出现性能更好的设备,进一步功率密度,延伸电池寿命,减少电磁干扰,增强电源和信号完整性,提高体系安全性,让国际各地的工程师可以创新国际。
只占营收1.3%的汽车业务,值得英伟达全力以赴吗?
英伟达交出了一份非常漂亮的财报,拿到了非常漂亮的市值,但这其中也许并不包含汽车业务。
在规模达到70亿美元的中国AI芯片市场上,英伟达的市场占有率超过90%。 中国市场超过80%的智能驾驶芯片,都来自英伟达。 但英伟达智能驾驶软件的发展,却与芯片的强势地位并不匹配。
“我们始终处于危险之中”。 这是英伟达创始人兼首席执行官黄仁勋的口头禅,用来表达英伟达在汽车业务上的挑战,并不为过。 虽然英伟达在汽车业务上几近垄断了智能驾驶的基础设施,是当之无愧的“组委会”,但当各个“参赛运动员”并不希望完全受制于英伟达时,英伟达同样也在应用层面加快布局,亲自下场赛跑。
英伟达不是智能驾驶芯片的唯一解法从2022年伊始到2023年结束,英伟达的季度收入从82.88亿美元增长至221.03亿美元,但是汽车业务的季度收入一直在2亿美元左右徘徊。 汽车业务在英伟达总收入的占比,到去年第四季度,已经只剩1.3%。
汽车业务,是英伟达在数据中心、游戏、专业可视化之后的第四大板块。 黄仁勋对汽车业务的预期收入,是要达到百亿美元级别。 而目前,至少还差出两个数量级。 2022年的GTC大会(GPU Technology Conference)上,黄仁勋甚至当英伟达收入达到万亿美元时,汽车业务要占到30%。
但是,英伟达在智能驾驶芯片,尤其是高端市场的智能驾驶芯片,已经处于垄断地位。 原因无他,就是算力高、生态开放。 挑选英伟达智能驾驶芯片的客户,也基本都是希望建立技术门槛、愿意投入的车企。
根据英伟达的数据,现在智能驾驶模型所基于的Transformer架构没有出现之前,算力需求大致是每两年提升8倍。 但自从Transformer架构开始大范围应用后,算力需求变成了每两年提升275倍。
英伟达Orin现在是多数车企高阶智能驾驶几近“唯一”的选择,但却不会一直都是“唯一”的选择。
英伟达在AI芯片领域的垄断地位,客观上会激发大厂入局造芯的动力,这是产业绕不开的趋势。 这里不仅有技术原因,还有成本原因,尤其是时间成本。
大模型已经步入一个需要快速迭代更新的阶段,车企更希望将产品迭代的节奏掌握在自己手上,而不是等待英伟达固定周期的性能升级。 而且,车企如果只是想用AI芯片去做智能驾驶,虽然非常烧钱,但实际上并不存在多少生态门槛。 因为跑自家的大模型,并不一定要依赖英伟达的通用并行计算架构CUDA。
如果类比“挖矿”的话,相对通用的GPU最终都会被绝对专用的ASIC所取代。 所以,实力强、资金强、野心强的车企,会去积极研发适合自家模型的专用芯片,比如明年蔚来即将在ET9上首发上车的5nm神玑NX9031。
高算力的AI芯片,在很长一段时间内都将是AI竞争的核心。 智能驾驶作为AI的应用领域之一,自然也不例外。 智能驾驶越是深化,头部车企开发自研芯片的脚步,也会越快。
英伟达要“硬”更要“软”在国内大家熟知采用英伟达智能驾驶芯片的车企,往往只是采用了英伟达的硬件、基础设施和开发环境,软件层面都是自主开发。 但是,海外车企与英伟达的合作,同样也有“交钥匙”的形式,比如奔驰。
英伟达不仅要为奔驰提供智能驾驶的架构、硬件、算法,还会与奔驰共同组建和分享数据库。 当然,英伟达这样做的结果,是要和奔驰“收入分享”,从奔驰智能驾驶系统的收入中抽取四成。 但如此重磅的合作中,英伟达预计于今年年中交付的解决方案,目前却在遭遇延期的危机。
奔驰甚至都已经准备让Momenta负责这一代车型在中国市场的智能驾驶。
于是,英伟达找来了小鹏汽车原自动驾驶副总裁吴新宙,并且在北京、上海、深圳开启了与智能驾驶软件相关的上百个职位的招募。 当下最紧迫的任务,就是把奔驰服务好,让这一代奔驰S级具备高阶智能驾驶的能力。
尽管从第四季度的财报来看,汽车业务只占英伟达营收的1.3%,与之对应的是数据中心业务则要占到83.3%。 但是,此前中国市场对这项最赚钱业务的收入贡献都在20%-25%左右,而在美国出口禁令发布的2023年第四季度,中国市场在英伟达数据中心业务收入的占比,已经掉到了个位数。
早在2022年,美国就发布针对中国市场的AI芯片出口限制,当时英伟达A100和H100芯片在禁售之列。 虽然此后,英伟达做出调整,推出符合美国规定的中国市场定制款芯片H20,理论算力相比H100下降了大约80%。 但这种性能,其实已经失去了相对国产芯片的竞争优势。
美国对中国的芯片禁令,让很多中国客户开始加紧部署AI芯片的国产化替代。
比如,英伟达已经在GPU等加速计算芯片、自研芯片的云服务商、Arm架构CPU芯片、网络产品四个领域里,都将华为视为竞争对手。
所以,尽管英伟达现在的计算卡卖得很好,但地缘政治的不确定性谁都无法预测。 尽管英伟达的智能驾驶芯片现在同样卖得很好,但是倒逼头部车企自主开发以及缺少平价方案,同样也会阻碍收入的进一步提升。
只有卖软件、卖软硬融合的方案,才能开启英伟达的第二增长曲线,才能帮助英伟达实现万亿营收的野心。
即便现在汽车业务的收入放在英伟达的大盘子里几近可以忽略不计,但遥想20年前英伟达开始开发CUDA,让图形显示卡可以进行通用并行计算,同样也是顶着10年看不到未来的压力,把这事持之以恒地做了,于是才有了今天英特尔在AI领域的地位。 汽车业务同样如此。
写在最后汽车的智能化,改写了汽车产业的供应链格局。 原先的供应商层级、供应议价权,已经被打乱。 放在燃油车时代,芯片厂商对整车厂是Tier 2,如今会变为Tier 1。 而在中央计算架构驱使的软硬件融合方案实现后,“英伟达”们甚至会变成Tier 0.5或者所谓的“超级供应商”。 而主机厂原本把控的供应议价权,也会因为供应商层级的变化,而开始部分让渡给供应商。
所以,汽车业务在英伟达当下的业务结构中,可能还很弱小,但却应当是潜力巨大的增长点。 英伟达对于营收的野心,远远不止于现在的体量。 因为,英伟达全年609.22亿美元的营收规模,与它市值接近的几家巨头相比,实在还是太小了。