未来已来,the future is now

零、题记

以前我以为英伟达只是造GPU的,机缘巧合赶上了LLM的浪潮才爆发,但看完黄仁勋在GTC2024的分享,我发现英伟达不光只有GPU,还有很多黑科技。2h的GTC大会信息量还是很大的,演讲最后的一幅图总结了整体内容

我不想复述或提炼老黄的Keynote,大家感兴趣可以看原视频或是视频解决,这里只说下自己的笔记和思考,

  1. 未来属于「加速计算」
  2. 为什么AIGC是革命性的技术?
  3. AI还可以生成什么数据?
  4. Blackwell:更强大的GPU架构
  5. NIMs:不让中间商赚差价
  6. 具身智能:英伟达在机器人领域的布局
  7. 未来已来

一、未来属于「加速计算」

在老黄的论述中,依赖于CPU(中央处理单元)执行的计算任务被称作「通用计算」。在过去十年的发展历程中,集成电路上晶体管的密度增长趋势已逐渐减缓。随着晶体管尺寸的持续微缩,从10纳米(nm)演进至7nm、5nm,并展望未来的更小节点,量子力学效应及其他物理制约因素日益显著,导致单纯依赖晶体管尺寸缩小来提升性能的摩尔定律面临严峻挑战。

利用GPU(图形处理单元)进行的计算被称为「加速计算」,加速计算的核心在于通过并行处理能力的提升来加快计算速度,解决传统CPU计算无法高效处理的大规模数据和复杂计算问题,比如科学计算、图像处理、机器学习等。

通用计算逐渐失去动力,而加速计算在性价比上远超通用计算。2016年英伟达向OpenAI赠送世界上第一台DGX-1超级计算机;2017年Transformer模型的论文发表,世界进入了AI加速发展的阶段,DGX-1, HGX等平台通过A100, V100, H100, H200为AI的训练和推理提供了充足的算力;2022年底ChatGPT的发布,标识着AIGC达到了一个新的里程碑。

2、为什么AIGC是革命性的技术?

之前只觉得AIGC很牛,但没想明白这意味着什么。老黄认为之前的内容是获取式的(Retrieved),互联网并不理解原始数据的含义,只能一股脑抓取过来供人来分析,得到结论。而在AI能理解文本、视频内容之后,可以综合分析并给出最终结论(Generative),这中间消耗的所有带宽、时间、精力都可以被省略,这会是一个新的时代,生产力会得到极大提升。

说到这里,可以顺带着提一下最近火爆的Kimi,Kimi是我认为中国产品化最好的一款LLM应用,基本上就是中文版的New Bing,用搜索的结果解决大模型的幻觉问题。反观前厂的文心一言app还是走娱乐化的幼稚Agent路线,很不看好李厂长啊

3、AI还可以生成什么数据?

AIGC之所以先从生成文本、生成图像开始,是因为这些内容的数字化程度最高,理论上只要可以被数字化的内容,都可以被AI理解,一旦可以被理解,就可以被AI生成。视频、音乐已经不在话下了,还有比如蛋白质数据、基因数据、脑电波数据、气象数据等等。AIGC不仅仅能生成供用户娱乐的内容,它具备把世界变成数字孪生的能力,在digital twins中可以做各种模拟,对真实世界做出更准确的预测。

比如,NVIDIA的Earth-2模型,能将原本天气预测精细度提升12.5倍,可以利用这套模型来预测更精准的台风路径与位置,利用更高品质的资讯来进行早期疏散,最大程度减少人员伤亡。

4、Blackwell:更强大的GPU架构

这部分看得不是很明白,整体就是Blackwell架构相比于Hopper架构,GPU在AI推理性能上比前一代产品提升了30倍,而能耗却降低了25倍。这无疑会成为驱动AI进步的新一代引擎,AGI在5年后来临,看来真的有希望

5、NIMs:不让中间商赚差价

NVIDIA的NIMs(NVIDIA Inference Machines)平台,是专为AI推理工作负载设计的,它不仅包括高性能的GPU硬件,还整合了优化的软件堆栈和AI模型,旨在为用户提供端到端的AI推理解决方案。

说大白话就是,英伟达不仅仅要做GPU,还要往上层做AI模型了,不让中间商赚差价。在GTC大会上,老黄show了跟很多大型企业的合作,包括尼桑、西门子,甚至还有比亚迪。(看好BYD啊)

6、具身智能:英伟达在机器人领域的布局

在GTC 2024大会上,英伟达在具身智能领域也有很多新产品发布,包括全球首个人形机器人通用基础模型“Project GR00T”、Jetson Thor计算平台、NVIDIA Isaac机器人平台升级以及一系列机器人预训练模型、库和参考硬件。总而言之都是为了推动机器人和具身智能方面的突破,使机器人能够学习技能并执行各种指令,实现与物理世界的交互。

7、The future is now 未来已来

看完GTC2024,最大的感受是“未来已来”,很多科幻电影中的场景已经出现在了现实世界中,并且这个过程还在加速,scaling law还没有失效,现在才刚刚开始…

上周听一个内部分享,硅谷的头部AI公司都是AGI驱动,还在疯狂卷大模型,国内的头部AI公司都是商业驱动的,已经在考虑如何跟自己的业务结合起来商业化了。再想想国内的算力紧缺,内容还在各种限制,国内AI发展与硅谷的差距肉眼可见的越拉越大。在这种情况下,做头部的创新基本不太可能,即使是follow就已经很不容易了,保持对新技术的关注,投资相关企业,把最新的技术用好也是退而求其次的思路