未来已来，the future is now

发表于 2024-03-25 更新于 2026-05-10

零、题记

以前我以为英伟达只是造GPU的，机缘巧合赶上了LLM的浪潮才爆发，但看完黄仁勋在GTC2024的分享，我发现英伟达不光只有GPU，还有很多黑科技。2h的GTC大会信息量还是很大的，演讲最后的一幅图总结了整体内容

我不想复述或提炼老黄的Keynote，大家感兴趣可以看原视频或是视频解决，这里只说下自己的笔记和思考，

未来属于「加速计算」
为什么AIGC是革命性的技术？
AI还可以生成什么数据？
Blackwell：更强大的GPU架构
NIMs：不让中间商赚差价
具身智能：英伟达在机器人领域的布局
未来已来

一、未来属于「加速计算」

在老黄的论述中，依赖于CPU（中央处理单元）执行的计算任务被称作「通用计算」。在过去十年的发展历程中，集成电路上晶体管的密度增长趋势已逐渐减缓。随着晶体管尺寸的持续微缩，从10纳米（nm）演进至7nm、5nm，并展望未来的更小节点，量子力学效应及其他物理制约因素日益显著，导致单纯依赖晶体管尺寸缩小来提升性能的摩尔定律面临严峻挑战。

利用GPU（图形处理单元）进行的计算被称为「加速计算」，加速计算的核心在于通过并行处理能力的提升来加快计算速度，解决传统CPU计算无法高效处理的大规模数据和复杂计算问题，比如科学计算、图像处理、机器学习等。

通用计算逐渐失去动力，而加速计算在性价比上远超通用计算。2016年英伟达向OpenAI赠送世界上第一台DGX-1超级计算机；2017年Transformer模型的论文发表，世界进入了AI加速发展的阶段，DGX-1, HGX等平台通过A100, V100, H100, H200为AI的训练和推理提供了充足的算力；2022年底ChatGPT的发布，标识着AIGC达到了一个新的里程碑。

2、为什么AIGC是革命性的技术？

之前只觉得AIGC很牛，但没想明白这意味着什么。老黄认为之前的内容是获取式的（Retrieved），互联网并不理解原始数据的含义，只能一股脑抓取过来供人来分析，得到结论。而在AI能理解文本、视频内容之后，可以综合分析并给出最终结论（Generative），这中间消耗的所有带宽、时间、精力都可以被省略，这会是一个新的时代，生产力会得到极大提升。

说到这里，可以顺带着提一下最近火爆的Kimi，Kimi是我认为中国产品化最好的一款LLM应用，基本上就是中文版的New Bing，用搜索的结果解决大模型的幻觉问题。反观前厂的文心一言app还是走娱乐化的幼稚Agent路线，很不看好李厂长啊

3、AI还可以生成什么数据？

AIGC之所以先从生成文本、生成图像开始，是因为这些内容的数字化程度最高，理论上只要可以被数字化的内容，都可以被AI理解，一旦可以被理解，就可以被AI生成。视频、音乐已经不在话下了，还有比如蛋白质数据、基因数据、脑电波数据、气象数据等等。AIGC不仅仅能生成供用户娱乐的内容，它具备把世界变成数字孪生的能力，在digital twins中可以做各种模拟，对真实世界做出更准确的预测。

比如，NVIDIA的Earth-2模型，能将原本天气预测精细度提升12.5倍，可以利用这套模型来预测更精准的台风路径与位置，利用更高品质的资讯来进行早期疏散，最大程度减少人员伤亡。

4、Blackwell：更强大的GPU架构

这部分看得不是很明白，整体就是Blackwell架构相比于Hopper架构，GPU在AI推理性能上比前一代产品提升了30倍，而能耗却降低了25倍。这无疑会成为驱动AI进步的新一代引擎，AGI在5年后来临，看来真的有希望

5、NIMs：不让中间商赚差价

NVIDIA的NIMs（NVIDIA Inference Machines）平台，是专为AI推理工作负载设计的，它不仅包括高性能的GPU硬件，还整合了优化的软件堆栈和AI模型，旨在为用户提供端到端的AI推理解决方案。

说大白话就是，英伟达不仅仅要做GPU，还要往上层做AI模型了，不让中间商赚差价。在GTC大会上，老黄show了跟很多大型企业的合作，包括尼桑、西门子，甚至还有比亚迪。（看好BYD啊）

6、具身智能：英伟达在机器人领域的布局

在GTC 2024大会上，英伟达在具身智能领域也有很多新产品发布，包括全球首个人形机器人通用基础模型“Project GR00T”、Jetson Thor计算平台、NVIDIA Isaac机器人平台升级以及一系列机器人预训练模型、库和参考硬件。总而言之都是为了推动机器人和具身智能方面的突破，使机器人能够学习技能并执行各种指令，实现与物理世界的交互。

7、The future is now 未来已来

看完GTC2024，最大的感受是“未来已来”，很多科幻电影中的场景已经出现在了现实世界中，并且这个过程还在加速，scaling law还没有失效，现在才刚刚开始…

上周听一个内部分享，硅谷的头部AI公司都是AGI驱动，还在疯狂卷大模型，国内的头部AI公司都是商业驱动的，已经在考虑如何跟自己的业务结合起来商业化了。再想想国内的算力紧缺，内容还在各种限制，国内AI发展与硅谷的差距肉眼可见的越拉越大。在这种情况下，做头部的创新基本不太可能，即使是follow就已经很不容易了，保持对新技术的关注，投资相关企业，把最新的技术用好也是退而求其次的思路