在1999年阿里巴巴成立的时候,恐怕当时的创始人们怎么也想不到,仅在10年后阿里巴巴就开始投身到以云计算为代表的新一代计算技术体系研发中,并在20年后站上了世界现代计算架构之巅。2022年,阿里云不仅是世界前三朵“云”之一,更重构了现代计算体系最底层也最具创新力的硬件设备——从服务器、路由器、交换机等到CPU等核心部件。
在2022年11月的云栖大会上,阿里云智能总裁张建锋表示,以云计算为核心的新型计算体系正在带来三大变革:云重构了整个IT硬件体系,数据中心、芯片、服务器等产业链发生深刻变化;云和端加速融合,算力从端转移上云,未来万物皆是计算机;软件研发范式发生深刻变革,Serverless、低代码、AI大模型开源等趋势,大幅度的提高软件生产效率。
今天,阿里云自研的飞天云计算操作系统+CIPU云计算体系架构正在重构云计算整体技术体系,而自研的云服务器芯片倚天CPU系列和边缘设备芯片玄铁RISC-V处理器系列等正在重构云端算力,阿里云自研的AI、数据库、云原生等各类计算软件正在广泛重塑数据的生产力。可以说诞生于“云”中的阿里云,在“云”完成重生、刷新了现代计算体系。
从互联网到云计算,计算在重塑经济未来、未来经济也正在不断重塑今天的计算。
现代企业级计算主要是由数据中心基础设施以及数据库、中间件、操作系统等企业级基础软件所构成,自从形成IOE架构之后已经垄断市场数十年,直到云计算架构的出现。2009年,阿里云写下第一行代码,就以打破IOE对于企业级计算市场的垄断为努力方向。当然,早期的云计算仍然是基于IOE的技术体系,直到多年后才完全“去IOE”化——公有云发展到一定规模后产生足够的经济效益,再反过来支撑对软硬件体系的重构。
2022年6月,阿里云发布了全新的数据中心芯片——云基础设施处理器CIPU(Cloud Infrastructure Processing Unit),作为替代CPU而成为云计算的管控和加速中心。简单理解,CIPU是用硬件方案实现云数据中心的多种软件和虚拟化加速功能,以及进一步实现多种硬件资源的池化,从而再次提升云数据中心的效率和效益。
2022年5月,阿里巴巴集团发布了2022财年业绩,其中阿里云在该年度实现了13年来首次年度盈利——经调整EBITA从上一年的亏损22.51亿元大幅改善为2022财年的盈利11.46亿元,而阿里云在2022财年收入在抵销跨分部交易前和抵销后分别为1001.8亿元和745.68亿元,也达到了百亿美元规模。在Gartner发布的2021年全球IaaS市场统计结果中,阿里巴巴2021年的IaaS收入为87亿美元并且以9.5%的市场占有率再次成为全世界第三大IaaS公有云提供商,而全球IaaS市场从2020年的643亿美元也猛增到909亿美元,同比增长41.4%!
毫无疑问,无论是全球IaaS市场规模还是阿里云自身的规模以及首次实现盈利,都为阿里云投资基础计算架构和基础技术提供了坚实的基础。CIPU的诞生就是阿里云在首次实现盈利节点时的再度进化:CIPU在各种CPU、GPU、FPGA以及各种硬件加速器等处理器之下,各种闪存、硬盘和NVMe固态盘等本地存储以及远端存储和高速低时延数据中心网络互联之上,进一步加速云数据中心的服务器之间与服务器内部的数据访问与移动速度以及减少相关成本。CIPU作为云数据中心专用芯片,与飞天云计算操作系统配合,进一步加大各类硬件计算资源的池化能力与规模,提升了各类云计算软件的运行效率,同时再次降低了云数据中心即云服务的成本。
2021年,阿里云宣布飞天操作系统将全面兼容X86、ARM、RISC-V等多种芯片架构,实现“一云多芯”,为客户提供标准、高品质的云端计算服务。在2021云栖大会上,阿里平头哥发布了首颗CPU芯片倚天710,也是全球首个5nm制程的ARM服务器芯片。在2022云栖大会上,阿里宣布自研CPU倚天710已大规模应用——倚天710已在阿里云数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超30%,单位算力功耗降低60%。如今,倚天710云实例与飞天操作系统及CIPU融合,在数据库、大数据、视频编解码、AI推理等核心场景中的性价比提升超30%。
本次云栖大会,阿里云还带来了专有云的全新版本,首次将CIPU引入专有云场景,提供存算分离的技术架构,在用户自建数据库场景下,性能提升可达到30%-50%,整体时延可降低40%-50%。专有云还提供了一云多芯、一云多Region的能力,支持多种指令集架构和芯片混合部署,可帮助客户实现芯片架构的平滑迁移。通过专有云,阿里云将飞天操作系统、CIPU、倚天710等所构成的全新自研计算体系带入了企业级环境,重新定义现代计算架构。
边缘计算是云计算的另一面。所谓边缘计算,即在靠近数据发生地或源头的一侧,集成网络、计算、存储、应用等为一体的小型或微型计算平台,提供在工厂车间、分支办公室、零售店面等地点的就近计算服务,与云服务相配合实现云端一体计算架构。
什么是云端一体计算架构?以阿里云发布的无影终端系列为例。2021云栖大会上,阿里正式对外发布了无影云电脑,这是一款没有主机、硬盘和CPU的“PC”。云电脑从外形上看就只有银行卡大小,使用的时候只需接上显示设备,指纹登陆就能进入个人的云电脑桌面。别看无影云电脑如此之小,电影《刺杀小说家》的特效制作就是在云电脑上完成的。在2022云栖大会上,一批搭载阿里云无影架构的新终端形态对外展出:包括无影笔记本、Rokid Air+Station、谷东工业AR眼镜、MAXHUB智能显示器、5G本DEXBOOK等。
无影笔记本是第一款云笔记本产品,通过接入云上算力,这款产品的工程样机在Cinebench上跑分达到12万以上,被网友称为“机皇”。无影笔记本通过端侧AI超分等技术,实现高清画质下的极低能耗、超长续航;实验室多个方面数据显示,普通办公续航达到20小时左右;播放高清视频或3D渲染场景也可达12小时。而智能AR眼镜厂商Rokid新发布的Rokid Air+Station套件产品,通过仅重83g的AR眼镜,连接蓝牙键鼠,就可以使用无影云电脑,还可以完成大型设计、影视渲染等重协同工作。
目前,无影支持300多类外接设备,能够直接进行企业内网、外网、设备之间清晰独立的安全策略设置。而在无影终端系列之外,阿里平头哥推出的玄铁RISC-V系列芯片,正在定义更广泛的边缘计算架构和终端系列。RISC-V与ARM架构都来自于1980年代的精简指令计算机RISC,二者最大的不同在于RISC-V是彻底开放的模式。当然与ARM架构的成熟生态相比,RISC-V架构还有非常长的路要走。
2022云栖大会,阿里平头哥公布RISC-V能效探索的最新进展,推出全新的RISC-V处理器玄铁C908,推动RISC-V进入高能效计算领域。随着玄铁C908的发布,玄铁RISC-V处理器家族已基本形成3大系列的产品矩阵:C系列面向高端复杂计算场景,应用于视觉、语音、边缘计算等领域,包含C906、C908、C910及C920等4款处理器;E系列面向低功耗低成本场景,应用于微控制器、无线款处理器;R系列面向高可靠、实时处理场景,应用于工业控制、车载等领域,目前研发出的R910处理器具备高性能、高可靠、实时处理增强的功能特性,未来R系列将继续演进推出更多丰富处理器。
截至2022云栖大会,玄铁RISC-V处理器已在边缘计算、无线通讯、工业控制、通用MCU等30多个行业实现了商业落地,是中国RISC-V领域中应用顶级规模的处理器。值得一提的是,玄铁RISC-V处理器已适配RTOS、Yocto Linux、Android、龙蜥、统信等多款云、边、端国际主流及国产操作系统。而在打通RISC-V和安卓体系方面,平头哥进行了大量技术创新,增补修改了12万余行代码,主导推动了两大体系的深度融合。
简单理解,在阿里的全力推动下,RISC-V架构进入了服务器、桌面、工业等多种计算生态,进而有望进入主流计算架构。平头哥构建起了包括工具链、中间件与组件、操作系统、AI加速库、针对应用的SDK等在内的玄铁RISC-V软件生态,推出了完整的端云一体开发工具,提供AI部署工具HHB等,从而更好适配玄铁CPU。无剑系列是承载玄铁CPU IP的芯片设计及验证平台,包括无剑100、无剑300及无剑600等三大平台。曳影1520是首颗基于无剑600平台研发的多模态AI处理器SoC原型,目前已实现从硬件到软件的量产应用场景适配,并在阿里展开应用。
值得的一提的是,平头哥是RISC-V国际基金会的董事会成员,是公认投入力量最大的中国机构。目前,在RISC-V国际基金会中,平头哥参与了29个技术方向的标准制定,主导负责了11个技术小组,在过去一年里贡献11篇技术文章给基金会。RISC-V国际基金会CEO Calista Redmond在2022云栖大会上表示:“RISC-V是史上最丰富、最开放的指令集架构,目前已有100亿颗芯片采用RISC-V,分析师预测到2025年,将有800亿CPU核心采用 RISC-V架构。RISC-V 正在迅速建立强大的生态体系,阿里巴巴在RISC-V上尽心尽力的投入和众多贡献,对全球开发者、技术社区和产业界意义重大。”
可以看出,从基于ARM的无影终端系列到基于RISC-V处理器家族的广泛边缘计算终端生态,阿里云在边缘计算侧建立起了云端一体的计算体系和生态,为企业构建完整的云端一体化应用,提供了丰富和超高的性价比的选择。
云原生被喻为云计算的再次变革。所谓云原生,即容器、微服务、DevOps等。云原生技术再度提升了云计算的效率,将云计算的技术红利释放到极致,成为业务创新的支柱引擎,并且真正的完成了PaaS层的软件开发范式变革。从2007年开始落地网络技术架构到2020年阿里双十一全面云原生化,2022云栖大会阿里云进一步宣布全面无服务器化(Serverless),重新定义软件开发范式,不断推进云原生的技术和应用前沿。
云原生技术包括三大发展趋势:全面容器化、互联网中间件以及全面Serverless化。其中的全面Serverless化,是真正推动软件开发范式转型的基石。张建锋强调:Serverless的概念最早于2012年提出,当时刚刚兴起的云计算仍然以服务器为中心,客户购买的仍是计算资源,而云计算下一个十年的计算范式是Serverless化。从2012年到2022年正好十年,Serverless也成为今天IT开发的主流,也是基于云服务器提供计算能力的主流方式。
无论是2万用户还是2000万用户体量,基于Serverless构建的IT架构都可以自适应伸缩,峰值秒级自动扩容、峰谷自动缩容。目前,阿里云已拥有超过20款Serverless产品,包括函数计算FC、Serverless应用引擎SAE、Serverless容器服务ASK、PolarDB数据库、AnalyticDB数仓等。其中函数计算日调用次数超过 200 亿次,有效支撑历年双十一百万 QPS 洪峰,业务年均增速超 300%,整体规模位居国内首位。
阿里云在2022云栖大会宣布将坚定推进核心产品全面Serverless化,帮助客户更好地实现敏捷创新。今天基于Serverless化的云上组装式开发,实现了软件研发的服务化、模块化,构建应用就像搭积木那样可编排、可组装。随着阿里云的全面Serverless化,很多云产品都转变为模块化、API化、服务化,通过拖拉拽的方式就能够组装构建应用,彻底颠覆了传统软件开发方式,大幅度的提高开发效率。
除了小程序外,电商大促、音视频转码、AI 算法、游戏分发、物联网等慢慢的变多的企业场景也开始采用Serverless技术。世纪联华将会员系统、交易系统、支付系统等迁移到阿里云函数计算上处理,促销准备时间从周级缩短到小时级,研发运维提效30%,成本下降40%,将促销活动常态化。南瓜电影将系统部署到阿里云Serverless应用引擎SAE上,无需改造应用代码,直接上传部署WAR/JAR包,七天内完成了新架构的升级和部署,峰谷时按需自动缩容,总成本下降 40%,运维效率提升10倍,从容应对突发流量。
张建锋表示,Serverless让云计算从一种资源真正变成一种能力。未来,云将全面Serverless化,更接近“电网”模式,按计算的调用次数付费。Gartner预测,2025 年将有 50% 以上的全球企业采用 Serverless架构。2022年,阿里巴巴确立了以“云原生”作为集团整体技术架构的战略,向Serverless化迈进;9月,淘宝首页核心应用率先实现了Serverless架构升级,通过更轻量灵活规范地用云,实现业务快速迭代创新。
除了全面Serverless外,阿里达摩院联手CCF开源发展委员会在2022云栖大会上,共同推出AI模型社区“魔搭”ModelScope,旨在降低AI应用门槛。达摩院率先向魔搭社区贡献300多个经过验证的优质AI模型,超过1/3为中文模型,包括一批探索人工智能前沿的中文大模型,如阿里通义大模型系列、澜舟科技的孟子系列模型、智谱AI的中英双语千亿大模型等,不仅全面开源开放,更将模型转变为直接可用的服务。
在普惠软件开发能力方面,低代码开发提供了普惠、敏捷、低成本的方式,而基于阿里云的钉钉正在成为下一代应用开发平台。在广西柳钢,冷轧厂退火车间工人张亮用十分钟就在钉钉上开发了一个危险区域管理应用,只有作业任务或设备点修人员才能扫脸后进入。张建锋在2022云栖大会公布,钉钉上的低代码应用数突破500万,低代码开发者超过380万。张建锋表示,未来不懂低代码就和二十年前不会用word一样。
从全面云原生化到全面Serverless化,阿里云让专业的软件开发像搭积木那样可编排、可组装,300+开源AI模型让专业的AI应用开发从被掌握在少数算法人员手中到走向大众化,而钉钉低代码开发平台进一步让一线业务人员获得强大的软件开发能力……今天的阿里云,正在重新定义软件开发范式。
总结而言:阿里云历时13年,站在了世界现代计算架构之巅。今天,阿里云已经几乎自研了所有软硬件技术,从而重构了企业计算架构与体系,而其中哪怕是一个芯片的自研,都需要投入大量的人力与时间,解决无数个问题才能逐渐完备。阿里云已经走出了一条中国式现代计算架构与计算体系之路,背后是无数阿里技术人员的坚持、坚守与不懈奋斗。可以说,在云计算的“赶考之路”上,阿里云交出了一份大开大合的中国答卷。(文/宁川)
专注于云计算时代的科技商业变革,广泛讨论云计算、大数据、企业互联网、人工智能、智慧城市等话题。