学习理财博客空间

理财鱼

您现在的位置是:理财鱼 > 保险知识 >

保险知识

阿里云12年:向下扎根,向上生长

发布时间:2021-10-22 19:09保险知识 评论

过去十多年,云计算从零起步发展到万亿规模,且仍以两位数增速持续攀升。Gartner预测2021年全球云计算市场规模预计将达到1.7万亿元。

在规模持续攀升的同时,作为云计算领域的头部企业,阿里云更在意的是自己为数字化转型做出什么有价值的贡献。

“我们今天最大的挑战是如何去定义云计算未来是怎么样子的,去引领数字化转型的进程。在这个进程里面提供有竞争力、差异化的能力和产品。”在2021杭州云栖大会期间,阿里云智能总裁张建锋表示,公司近几年推出的一系列产品就是为了能够引领未来。

过去两天,阿里云连续发布了多款重磅产品,包括自研通用CPU、自研服务器磐久、神龙4.0、龙蜥云操作系统、阿里灵杰AI平台等等。此前一周,发布了钉闪会、钉钉文档、钉钉项目等多款协同办公工具,并宣布低代码平台在8个月内新增86万应用、入驻开发者已达90万人。

这一系列动作,展示了阿里云对于未来发展的思考:双向生长。向下,持续夯实云基础技术;向上,为数字化提供一个标准化的开发平台。

阿里云12年:向下扎根,向上生长


不止步于云计算

云计算深入硬件领域,始于2017年。时年冬,亚马逊AWS发布了一款自研的云服务器硬件——Nitro,这一消息让整个科技圈一片沸腾。这意味着,云服务商——这一典型认知上的软件企业开始“杀入”硬件领域。

而在45天前,阿里云发布了第一款由云厂商自主研发的云硬件——神龙云服务器。

地球东西两端的两家云厂商,不约而同地走到了同一个路口,开始钻研硬件。他们其实都是为了解决同一个问题:用一款为云而生的硬件架构,解决云虚拟化损耗的问题。

虚拟化损耗是云计算行业的一大难题。云的一项基本工作是将物理服务器虚拟化,再将虚拟化后的“云服务器”提供给用户使用。例如,用户性能需求高时,用8核16G服务器;需求低时用2核1G服务器,以此来实现云的弹性。

然而,因为虚拟化的过程中需要分出一部分CPU用于调度,因此会造成性能“损耗”,极端场景下,损耗甚至能超过一半。

2015年,阿里云的虚拟化技术架构从KVM更换至Xen,将虚拟化的损耗从极端场景下的50%降低至10%左右。那已是软件算法的极限,再进一步的可能性几乎为零。

想要彻底解决问题,只能从硬件入手。

2016年,阿里云秘密启动了一项代号为“X-Dragon”项目,将外部云盘存储、VPC网络等资源嵌入专属板卡,专门做调度工作,从而避免了调度“打架”造成的损耗。一年多以后,神龙云服务器正式面世,这款搭载了专属硬件板卡的裸金属服务器,史上首次将云计算性能损耗降至0。

阿里云12年:向下扎根,向上生长


▲2021年云栖大会,神龙架构升级至4.0

自此,云计算开始向下进入硬件领域。

亚马逊AWS推出了针对EC2 Inf1机器学习应用的芯片AWS Inferentia,谷歌发布了一款为数据中心设计的机器学习芯片,直接命名为“Cloud TPU”。阿里旗下的平头哥推出了RISC-V处理器玄铁910、自研AI芯片含光800、自研通用服务器CPU。

目前,平头哥拥有处理器IP、AI芯片及通用CPU等产品,旗下玄铁系列处理器出货量已达25亿颗;两年前问世的阿里第一颗芯片含光800已实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户。

“我们芯片团队这两年能力成长还是非常快的,因为含光是ASIC的芯片,它的功能、复杂度可能与通用CPU来比还是有很大不一样的。所以你能设计通用CPU,就是能力很大的检验。”张建锋认为,能力主要体现在大型工程的管理能力、技术判断、芯设计到中间交付等。

迄今为止,全球云厂商中只有阿里云和AWS成功研发了通用服务器CPU。此前,AWS推出也曾推出自研Garviton 2服务器CPU。

构建以云为核心的IT技术体系

为何云计算厂商非要“死磕”自研服务器、CPU等硬件产品?

首先,最直接的考量是成本。

阿里云、AWS、微软管理着数百万台服务器规模的大型数据中心,以100万台服务器体量计算,CPU芯片成本可达到10亿乃至几十亿美元。若采用自研服务器,可以有效降低成本。以手机行业类比,安卓手机采购一枚高通骁龙800系列旗舰处理器,价格约120美元,而苹果自研iPhone处理器A系列成本价不足50美元,且性能甚至更优。

几年前,为了解决虚拟化损耗问题,阿里云、亚马逊AWS分别推出神龙和Nitro,大幅降低了云计算的使用成本。在2019年的AWS技术峰会中,亚马逊透露,基于Nitro架构的计算实例、内存实例、GPU实例价格分别下降35%至49%不等。

另一重考量,是构建一个以云为核心的IT技术体系。

云的核心价值是“按需使用”形成弹性,用户计算高峰时配置高性能,低谷时则降低性能。这背后就是云的“池化”能力,通过虚拟化,将计算、存储等几项工作分离,形成一个个大资源池,需要时随时提供。

然而,云计算的解耦模式与传统IT中计算、存储、内存绑定模式所需的能力大相径庭,市场上的IT硬件都是为传统模式设计的,没有专门为云设计的IT架构。比如,传统IT像是一条广阔公路,注重的是单条公路的修缮能力;而云是100条公路同时开通,重要的是这100条公路的协调能力。

“我们的交换机都是自研的,这些交换机并非与其他产品有技术代差,但它们更适合在云计算的超级数据中心中使用。”张建锋认为,构建更适合云的硬件体系,是云计算步入深水区的关键一役。

云是天然的平台属性,当千行百业迈向数字化转型时,云就是数字底座。阿里云反复强调“做深基础”,就是不断强化数字底座的能力,基础越深,底座就越稳。在此基础上,足够强大的自研产品体系就是这个底座的有力支撑。

张建锋认为自研CPU是“为云而生”,他介绍说,“云上负载是大规模、高并发的情景,而CPU有两类,一类是单核性能非常强,第二类是有很多核,多核工作。从测试结果看,多核表现明显优于单核表现,所以大家可以看到,自研CPU的核数多达128核。”

与自研CPU一同面世的,还有自研云服务器磐久、神龙4.0、龙蜥操作系统和阿里AI一体化平台灵杰,并迎来自研数据库PolarDB的重磅升级。

共2页: 上一页下一页

>相关《阿里云12年:向下扎根,向上生长》内容:


1、 上汽/阿里联手打造 智己L7 Beta体验版下线:首批共200台

理财鱼小提示:上汽/阿里联手打造 智己L7 Beta体验版下线:首批共200台 12月26日, 智己L7首批200台Beta体验版在上汽集团临港智能工厂正式下线并交付系统测试用户 。 官方表示,下线后的智己L7 Beta体验版,符合在公开道路上驾驶的法律法规要求,交付给系统测试...【继续阅读】


2、 “阿里云发现漏洞先向美国报告”其实反映了中国IT工程师文化有严重问题

理财鱼小提示:“阿里云发现漏洞先向美国报告”其实反映了中国IT工程师文化有严重问题 运营商财经 康钊/文 12月22日,阿里云被暂停工信部网络安全威胁信息共享平台合作单位6个月,原因是阿里云的工程师发现了近年来最严重的安全漏洞隐患后,第一反应不是上报国家...【继续阅读】


3、 阿里云漏了一个“洞”

阿里云因为一个安全漏洞,被推到了风口浪尖。 起因是11月24日,阿里云安全团队向美国开源社区Apache(阿帕奇)报告了一条安全漏洞。这是一条Log4j2远程代码执行(RCE)漏洞,全球各地的安全机构都已发出了警告。 这原本只是一个小圈子内的事情,但随着事态...【继续阅读】