学习理财博客空间

理财鱼

您现在的位置是:理财鱼 > 理财方法 >

理财方法

“中国英伟达”的虚与实

发布时间:2021-12-22 11:48理财方法 评论

比如GPU(图形处理器)。

某种意义上,它当前是通往AI世界那道命门:由于AI算法属于计算密集型算法,海量的数据处理任务和人工智能的训练和推理更适合GPU、FPGA、ASIC等并行计算能力强的芯片。

众所周知的是,这些先进芯片的生产和制造基本都被把握在海外厂商手上。

故而对于中国科技产业来说,自建GPU等核心AI底层硬件,是一件既刻不容缓又需要极大耐心的工程。

自2017年以来,多个中国新一代初创型GPU研发公司相继成立,正逐渐走上历史舞台。而作为二级市场中独一份的国产标的,A股GPU 第一股的景嘉微(SZ:300474),也凭借股价的年内翻倍走势而愈加受到关注。

本文作为我们聚集中国GPU产业的系列研究开篇,将以景嘉微为线索,在探究其虚实同时,力求延伸出更多的产业维度思考。

01、乌龙研报

2016年,GPU业界诞生了一块被戏称“老黄手抖切多了”的神卡:GTX1080。

这块显卡是英伟达(NASDAQ:NVDA)在新架构(Pascal)上的第一个作品,作为首发先锋,秒掉了上一代架构(Maxwell)的所有卡。该卡在314mm的核心面积里面塞进去了72亿晶体管。时至今日,GTX1080都能被称之为是一块高性能卡,能够满足绝大部分游戏需求。

不过根据某券商在9月17日的一份报告中提到,景嘉微拥有完全自主知识产权的的JM9系列GPU流片成功了,“产品性能与GTX1080相当”。如果该产品性能真的如研报所示,那么该产品一旦量产成功可直接改写中低端GPU国内市场势力格局。

“中国英伟达”的虚与实


图片来源:公司公告

上图是公司目前公布的技术指标。可以看到的是,理想很美好,现实仍骨感:

视频解码方面能够达到目前的主流水平,支持4K60支持H265,已经足够日常看视频使用了。3D图形支持OpenGL 4.0,目前最新的OpenGL是4.6,也算是跟上前沿步伐。

最后是支持的平台,支持X86和ARM,这意味着可以支持x86下的linux操作系统。这使中标麒麟、UOS、银河麒麟等国产操作系统的支持就有了可能。

但,在算力层面,JM9系列跟GTX1080还不在一个级别。

“中国英伟达”的虚与实


像素填充率表示的是GPU每秒能够渲染填充进画面的像素数量。单精度浮点性能是GPU每秒能完成计算的数量。简单来说这两个指标都能表达GPU的算力情况。如果说从数据推算上能打赢GTX1080的话,唯一能比的就是功耗算力比。

可问题在于,脱离了绝对性能和架构PK功耗算力比,完全是关公战秦琼了。按这个说法,高通骁龙888功耗10W,但其所集成的GPU算力在1.7TFlops,比景嘉微JM9还要高一截。于是把骁龙888装进PC里就能比GTX1080更强大么?恐怕不是这么比的。

出现这种说法应该是研究员在数据比对中出现了什么误会。

“中国英伟达”的虚与实


图:相关券商研报

从使用场景来说JM9 系列图形处理芯片产品可满足地理信息系统、媒体处理、CAD 辅助设计、游戏、虚拟化等高性能显示需求和人工智能计算需求。

对于前面的专业需求来说,景嘉微作为国产自主设计GPU厂商在政采和军供方面是必须要满足的。在游戏和虚拟化层面,由于JM9支持Linux内核的操作系统,这样的性能还是能够玩一些“老游戏”的。但是支持人工智能计算又是从何说起呢?

02、AI命门

CPU(中央处理器)和GPU(图像处理器)在设计目标上都是为了完成计算的用途。两者的区别在于芯片内部的设计结构差异。CPU擅长完成较难和较长的任务,而GPU凭借多运算核心可以同时执行多个较为简单的任务。

例如在把不同像素填充进图形的渲染任务中,CPU的执行方式是分别计算出每一个像素的具体颜色再填充进图形。而GPU可以凭借核心数量多的优势同时计算全部的像素颜色,再同时填充进图形。虽然CPU可以凭借足够快的计算速度来完成这一工作,但小汽车就算开得再快也难于与大货车的运货能力相抗衡。

“中国英伟达”的虚与实


图片绿色区域是运算核心,来源:NVIDIA CUDA技术文档

人工智能中使用的机器学习模型是通过模拟生物神经系统来建立的数学网络模型,需要大量数据来训练模型,对计算机处理器的要求是需要大量并行计算。这就要求芯片能够提供多核并行计算能力,核心数量多,拥有更高的浮点运算能力和访存速度的能力,以此来提升深度神经网络的训练速度。

在当前AI应用中,计算芯片在神经网络训练中需要解决两个限制。第一是芯片内部到外部的带宽以及片上缓存空间对运算的限制。第二是在控制功耗的同时不断提升专用计算能力,解决对卷积、残差网络等各类AI计算模型的大量计算。虽然在今天能够满足上述两种需求的芯片主要是GPU、ASIC、FPGA,但这三者同时也具有不同的优缺点。

“中国英伟达”的虚与实


当前AI发展还处在一个相对早期的阶段,应用层面分化仍不明显。例如在挖矿工作中,需要计算芯片连续不断执行同一种简单逻辑操作,ASIC作为最快速的芯片就比较适合。在通信行业中,针对接受不同信号并转码的任务交给单一软件逻辑的FPGA是当前主要的研究方向。

但在机器视觉、自动驾驶方面,由于算法更迭快,不能支持ASIC每次特定设计的生产成本。同理,FPGA不能支持神经网络的逻辑递归处理。中长期来看,GPU得益于通用性和制程仍有进步空间的优势,仍然是主流AI研究和开发平台。甚至可以说,AI行不行,得先在GPU上跑通了再说。

在未来,通过AI处理或辅助的方式能够大大优化生产过程和提高生活质量。对AI科技公司来说,拥有更多开发人员和更多前言研究论文固然重要。但在没有或受限的硬件条件下进行AI研究,无疑是空中楼阁。

国产自有GPU补充前沿科技研究的需求,呼之欲出。

03、引申思考

高新科技的研究和进步远远不是单一领域突破就能实现的,一味追求追高追新的心态有可能会重蹈2003年的“汉芯事件“。

共2页: 上一页下一页

>相关《“中国英伟达”的虚与实》内容: