作者stpiknow (H)
看板Tech_Job
标题[新闻] 辉达不满足在GenAI领导的现状,推出新架
时间Fri Mar 22 07:53:30 2024
辉达不满足在GenAI领导的现状,推出新架构和软体服务,往全方位AI公司前进
原文网址:
https://bit.ly/43pXnwC
原文:
辉达在2024年GTC会议上,提出了其未来营运的两大重点。第一:重塑下一的底层架构,
使其GPU晶片成为GenAI革命中极其重要的一部分。其次,它宣布了一系列广泛的工具和合
作夥伴关系,使各种类型的企业将GenAI应用程式投入生产的过程变得更加容易。
在此过程中,辉达也强调了其成为软体和服务公司的雄心壮志,发布了AI Enterprise
5.0和新NIM(Nvidia Inference Microservices)。 该公司还成功扩大了应用范围以及
致力於提供关键GenAI运算解决方案的产业,包括:医疗保健、重工业、汽车、机器人、
制造、电信(6G)、天气预报等。
在晶片方面,自两年前推出Hopper架构以来,新一代Blackwell GPU架构诞生。辉达表示
,Blackwell提供的20 PetaFLOPS人工智慧效能在AI训练工作负载上快了4倍,在AI推理工
作负载上快了30倍,最值得注意的是,其能源效率比Hopper提高了25倍。
尽管单一Blackwell GPU的功能已经很强大,但在MoE(Mixture of Experts ) AI「超级
模型」的新时代,迫切需要将大量的GPU连接在一起。因此,新的NVLink 5.0技术就变得
很重要,因为它允许最多576颗GPU以高达1.8 TB/Sec的速度连接在一起。
与上一代产品一样,辉达还整合了一款“超级晶片”,将其最新的GPU与基於Arm的CPU设
计结合起来。最新的超级晶片版本称为Grace Blackwell 200(或简称 GB200),它包括
两个Blackwell GPU和一个Grace CPU。
该公司还推出了一系列新的交换机,包括基於InfiniBand的Quantum-X800交换器和基於乙
太网路的Spectrum-X800。两者都利用该公司的BlueField技术来加快将资料透过数据中心
输入GPU进行处理的过程。
即使主要的云端供应商都正在研发自己的解决方案,但其和伺服器制造商仍都宣布很快就
会推出基於Blackwell设计的服务或系统。此外,还有一些软体供应商也宣布他们将在其
应用程式的下一代版本中支援Blackwell和这些最新设计。
至於软体,辉达的重大软体是引入了NIM的微服务,它是AI Enterprise 5.0版本的一部分
。这些微服务是在CUDA软体平台之上运行的Web原生容器,专门设计用於简化创建和开发
可利用CUDA和辉达硬体的GenAI应用程式的过程。
未来这些新的微服务可以为辉达创建全新的营收来源和业务策略,因为它们可以按每个
GPU/hr(以及其他变体)进行授权。这是辉达新营收的尝试,值得关注。
总之,辉达不仅在硬体上,期望拉大与竞争者差距,也想利用新的软体应用程式和微服务
希望将公司定位为更广泛、更重要的GenAI产业长期推动者。显然,辉达不满足於现今的
领先地位,而想要拉长领先产业的时间,成为真正AI的王者呢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 203.145.192.245 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1711065212.A.40D.html