学习理财博客空间

理财鱼

您现在的位置是:理财鱼 > 原创专题 >

原创专题

英伟达(NVDA.O)|2022 GTC:全新架构GPU,硬件、软件能力进一步升级

发布时间:2022-03-25 08:47原创专题 评论

英伟达于近期举办2022GTC大会,发布Hopper架构GPU,并更新在AI硬件、软件平台、软件应用等领域最新产品进展和动态。全新一代Hopper架构GPU在制程工艺、晶体管数量、大模型支持、内存带宽等核心技术特性方面较上一代安培架构大幅升级。同时在CPU、高速网卡、芯片互联(NVlink)等产品&技术层面亦进展明显,叠加底层软件平台CUDA等的升级,我们看好公司在数据中心领域的持续领先优势。同时公司在应用层的软件布局亦进展喜人,包括Omniverse cloud、自动驾驶(Drive)、医疗(Clara Holoscan)、人形机器人(Metropolis)等,软件业务有望逐步成为公司重要的营收来源,以及长期成长性的支撑。持续领先的产品,叠加软硬一体化平台能力,我们持续看好公司的短期、中长期投资价值。

▍AI硬件:英伟达在2022GTC大会上发布基于最新Hopper架构及NVLink和Switch的计算加速卡H100、计算平台DGX H100、超级计算机Eos等,同时公布了CPU产品Grace的最新进展。

1)H100:(a)从参数配置来看,H100含有800亿个晶体管(上代产品为540亿个),采用台积电4nm工艺。同时支持Transform引擎(性能较上代产品提升六倍)、机密计算(首次支持机密计算功能)、NVLink(最多可实现256个H100 GPU的链接)、DPX指令(性能较上代产品提升7-40倍)等技术。目前H100共包含SXM、PCIe 5.0两种形态,以满足下游不同客户的需求。(b)从应用场景来看,H100 可部署于各种数据中心,包括内部私有云、云、混合云和边缘数据中心。公司预计最新的H100将于2022年下半年开始出货。

2)DGX H100:(a)从参数配置来看,DGX H100系统集成八颗H100芯片、搭配两颗PCIe 5.0 CPU处理器(Intel Sapphire Rapids四代可扩展至器),拥有总计6400亿个晶体管、640GB HBM3显存、24TB/s显存带宽。(b)从AI能力来看,AI算力32PFlops(每秒3.2亿亿次),浮点算力FP64 480TFlops(每秒480万亿次),FP16 1.6PFlops(每秒1.6千万亿次),FP8 3.2PFlops(每秒3.2千亿次),分别是上代DGX A100的3倍、3倍、6倍,而且新增支持网络内计算,性能3.6TFlops。

3)DGX SuperPOD架构。从参数配置来看,通过公司最新的NVLink技术,最多可将32个DGX H100实现链接。通过公司最新的NVLink Switch系统,可将DGX系统链接到Quantum-2 400 Gbps InfiniBand 交换机,最多实现数千个H100的链接与共享。(b)从用途来看,公司依托DGX SuperPOD努力打造Hopper AI工厂。

4)发布Eos超级计算机。通过上述系统级工程技术,公司发布Eos超级计算机,主要是由576个DGX H100服务器系统和4608个DGX H100显卡组成,可提供18.4 EFLOPS的AI计算性能,比目前世界上最快的超算——日本的「富岳」快4倍。

5)Grace:Grace是英伟达面向数据中心打造的CPU芯片,专注于处理海量数据处理。在此次GTC大会上,公司公布了Grace芯片的最新进展。Grace产品主要包括Grace Hopper(CPU+GPU的结合体)、Grace CPU Superchip(两个CPU结合体)两种,公司预计该款芯片将于2023年出货。

6)从公司在AI加速领域的产品布局来看,公司依托GPU加速卡、DGX系统、NVLink技术、Switch系统、CPU产品等,实现了产品模块的布局,在很大程度上降低了定制化开发的研发成本及应用场景有限的弊端。

展望未来,我们持续看好公司在数据中心“底层芯片、加速堆栈、行业垂直方案、具体应用的全栈式产品线”的布局。中长期来看,千行百业数字化转型是未来发展趋势,推动AI训练、AI推理、HPC等并行计算相关的需求快速爆发;从竞争格局来看,英伟达凭借丰富的产品矩阵以及强大的AI能力,应用场景不断丰富,系统级竞争优势突出。

▍AI软件:GTC大会新更新60多个SDK应用程序,CUDA生态系统建设不断加速。

1)英伟达致力于做AI全栈式布局的供应商,涵盖AI计算硬件、软件领域。近些年来,公司依托CUDA架构,不断加大在AI软件领域中的产品布局。截至目前,全球已有超过数百万研发人员使用英伟达SDK来加速他们的处理工作。在此次GTC大会上,公司更新了约60多个SDK应用程序(2021年更新约65个SDK应用),不断加速推进CUDA生态系统的建设。

2)从此次SDK产品更新的进展来看,主要涉及Riva语音2.0、Maxine视频通话模型、数据处理引擎(RAPIDS)、多代理多约束路线规划(CUOPT)、网络安全深度学习框架(Morpheus)、量子电路加速仿真器(cuQuantum)、5G无线电加速软件(Ariel)、6G通信研究框架(Sionna)。

▍AI平台软件:加大在Omniverse&机器人平台领域中的布局。

1)公司认为,经过若干年的发展,TensorFlow和Pytorch已成为AI框架中必不可少的部分。未来AI的发展方向将沿着机器人或AI规划行动展开。为抢占后续市场份额,公司将依托Omniverse加大在数字机器人、虚拟形象和实体机器人领域中的布局。

2)Omniverse进展:Omniverse定位于虚拟世界的仿真引擎,可以将虚拟世界、真实世界中的设计开发者、虚拟&真实机器人进行链接。可以实现设计师之间的协同办公、工业数字孪生等功能。(a)从产品开发进展来看,Omniverse软件链接数不断增加,由2021GTC大会的8个提升至2022GTC大会的82个,包括Chaos、Autodesk、EPICS Maxon等专业软件。(b)针对工业数字孪生领域:公司新推出Omniverse计算系统OVX。该系统由8个英伟达A40 RTX GPU、3个ConnectX-6 200Gbps网卡(NIC)和2个英特尔至强Ice Lake CPU组成。同时新发布26个制造业格式转换器,以期不断将工业工作流程链接到Omniverse领域。

3)机器人平台进展:英伟达构建了多个机器人平台,具体包括:自动驾驶领域中的DRIVE平台、医疗器械机器人Haloscan平台、机器人自主式基础架构Metropolis、机器人操纵和控制系统Isaac。(a)DRIVE是英伟达针对智能汽车提供的端到端全栈式平台,主要面向开发者&研发人员使用。(b)在此次发布会上,公司公布了医疗机器人开放平台Clara Holoscan,预计将于2022年5月上市,2023年Q1完成医疗级准备。(c)截至目前,Metropolis平台的下载量已经达到30万次,拥有1000多个生态系统合作伙伴,并在超过100万个设施中运营。(d)在此次发布会上,公司发布了Isaac 自主移动机器人(AMR)架构,该产品主要包括四大核心技术:用于真值生成的NVIDIA DeepMap、用于训练模型的NVIDIA AI、搭载Orin的AMR机器人参考设计、Isaac机器人技术堆栈中的新Gem及基于Omniverse的新版Isaac Sim,每个都单独可用且完全开放。

▍AI应用:汽车业务和机器人业务进展不断加快。

共2页: 上一页下一页

>相关《英伟达(NVDA.O)|2022 GTC:全新架构GPU,硬件、软件能力进一步升级》内容:


1、 英伟达(NVDA.US)周四领涨标普500指数 科技股重拾涨势上演王者归来?

智通财经APP获悉,周四美股,由于英伟达(NVDA.US)承诺将投资扩张其核心业务,其股价飙升近10%,并带动了半导体和科技股上涨,推动整个股市延续过去几个交易日的涨势。 数据显示,英伟达股价周四上涨9.82%,成为标普500指数中涨幅最大的公司。此前,该公司...【继续阅读】


2、 美股芯片股领涨 英伟达涨近10% 苹果、特斯拉喜提八连涨

美股高开高走,三大指数集体收涨,纳指涨1.93%,标普500指数涨1.43%,道指涨1.02%。 大型科技股涨跌不一,Meta涨近3%,谷歌、苹果涨超2%,特斯拉涨超1%,奈飞、亚马逊微涨。 英伟达涨近10%,创始人、CEO黄仁勋在3月23日晚间接受媒体电话采访时表示,英伟达...【继续阅读】


3、 黄仁勋表态:英伟达有兴趣让英特尔代工生产芯片!对台积电意味什么?

理财鱼小提示:黄仁勋表态:英伟达有兴趣让英特尔代工生产芯片!对台积电意味什么? 图表视界讯:周三(23 日),在接受媒体采访时,英伟达(Nvidia)CEO——黄仁勋( Jensen Huang)表示,对于找英特尔代工芯片,英伟达确实有兴趣。 那么黄仁勋这个表态背后有何...【继续阅读】