算网时代新征程,移动云推出技术内核3.0、COCA计算架构

  • Post author:
  • Post category:其他


09a5b9c7be701a0702cc298dcfdea0af.gif

dbbe0bad280e1af48176f5a3848c6245.jpeg

4月25日,2023移动云大会在苏州拉开帷幕。本次大会全方位展现了移动云走过“云改”三年后亮眼的成绩单。在大会上,发布全新移动云战略,启用全新品牌形象、自研核心技术等,强势开启未来新征程。

99681048ba24a378d862cff7339d6102.png


锚定“一流云商”,强势开启新三年之路

作为云计算“国家队”,一直以来移动云践行“为国建云”使命。2019年,中国移动启动“云改”。三年来,移动云成绩单亮眼,中国移动董事长杨杰表示,2022年移动云收入突破500亿元、较三年前增长25倍,发展创新力、市场竞争力、生态聚合力、品牌影响力明显提升,综合实力跃升至国内云服务商第一阵营。

杨杰表示,未来,将锚定“世界一流信息服务科技创新公司”定位,以移动云为关键载体,加快推进算力网络从泛在协同到融合统一再到一体内生,推动实现网络无所不达、算力无所不在、智能无所不及,为网络强国、数字中国建设贡献更多移动技术、移动智慧、移动方案。具体有以下举措:一是完善资源布局,打造一流的算网基础设施。二是攻坚关键技术,铸就一流的算网能力优势。三是深耕信息服务,壮大一流的算网应用集群。四是汇聚产业合力,共建一流的算网产业生态。五是面向安全绿色,夯实一流的算网发展保障。

移动云开启“新三年”,在大会上发布移动云全新品牌形象。新LOGO由两部分组成,外层为“环抱呵护的云”,内层为“抽象的两手相握”,体现了算网融合的时代大主题,全新品牌 LOGO 以“3C+S”为核心元素,代表移动云坚持核心技术自主研发、以客户为中心构筑云服务能力底座,助力网络强国战略落地的信心。全新品牌口号为“云擎未来,智信天下”,寓意移动云“乘势而上,登高望远”向一流云服务商迈进,以更智慧、更贴心的技术,服务更广大客户的决心。

601a09bfa74d2fc4747914828373d242.jpeg


46831670403aeab3fb37f37fb324e5d4.png


算网时代,移动云技术内核3.0

回顾云计算的发展历程,可划分为三个阶段:阶段一是云计算应用普及,大家对算力的需求主要集中在标准化、低成本的通用算力,资源池建设以大规模集中化建设为主。阶段二是5G技术与应用融合,随着信息技术的发展,对算力的需求量在增长,对算力需求有了更多要求,这个阶段的云资源部署从集中式向分布式转换。阶段三是随着数字经济的高速发展,AI技术发展,对算力需求爆发式增长。

那么如何满足泛在计算需求?如何提供多样性高性能能力?如何保障全链路的安全可靠?

中国移动云能力中心董事长万国光表示,中国移动给出“算力网络”方案,希望能做到网络无所不达,算力无所不在,智能无所不及的目标。这个目标分三个阶段走,从泛在的协同到融合统一最后到一体共生,目前我们正在从融合统一阶段逐步向一体共生阶段的过程。

针对这些发展趋势,2020年,发布移动云技术内核1.0,超大规模云平台;2021年,发布移云技术内核2.0,分布式云;会上,发布面向算力网络打造的新型技术架构体系“移动云技术内核3.0”。具有泛在接入、海量算力、异构协同、能力汇聚、算网大脑、安全可信六大特性。

该体系分为三层:

底层是算网基础设施层。以云专网打造算网融合泛在接入,目前云专网覆盖304个城市,提供508个直连局向,提供百T级的带宽容量,把百公里传输时延降低到0.8毫秒。

SRv6云间互联技术实现确定性路由,从最短路径、最短时延等各方面为网络服务提供最优解。还提供了各种接入方式。通过5G UPF和云端口连接来实现分钟级开通路云。

在资源布局上,不断优化“4+N+31+X”分布式资源布局。围绕8大国家算力枢纽,建设热点和中心区域,边缘云节点超1000个,覆盖全国100%城市。支持超过400种算力规格。

打造三级智算中心资源架构,低成本中心用来做集中式训练,在AI资源做分布推理,做边缘推理。

云定制化硬件释放极致性能,自研大云磐石3.0DPU,加速计算、存储、网络能力。基于大云磐石3.0DPU,推出第五代云主机,性能提升超50%。

在异构算力集成上,提出COCA加速软硬一体。

第二层是算力大脑层。算网大脑是算力网络演进过程中的核心部件,助力网络资源和算力资源的联合调度。通过算网大脑,创新打造东视西渲、东数西存、中训边推等任务式服务,利用闲置算力降低运营成本和客户成本。

算网大脑包含3个中心。一是编排中心,通过智能算法从多个维度,包括价格、时延、性能等为用户推荐最优的编排方案;二是调度中心,目前已实现每分钟上万次,每天数千万次的调度能力;三是能力中心,将 ABCDENTS 3000多种原子能力进行管理。

最上层是大脑运营层。

同时升级云原生安全自适应架构,构建面向多云环境的“端、网、云、数、服”全栈云安全产品体系。


28eb51beecc417581ec29f284493437e.png


发布COCA软硬一体片上计算架构

为了创新关键核心技术,重构算力基础设施,中国移动正式发布移动云COCA软硬一体片上计算架构(Compute on Chip Architecture),来造国家级自主可控的高性能算力底座,从布局国产化智算生态、共建自主GPU+DPU产业联盟、联创高性能网络技术三大方面。“抓住云计算技术定义权,引领云计算市场下一个黄金十年。”中国移动副总经理赵大春表示。

据了解,移动云COCA架构由GPU、DPU、HPN三大核心单元构成,以COCA为核心可打造基于自研可编程DPU、多元异构智能算力、高性能RDMA网络、Diskless存储架构引擎等技术的大模型算力基础设施,来统一实现计算、存储、网络、安全、管控能力的硬件卸载加速。

e338a95ebf8cd6aea6513afe9ecf540d.jpeg

1、COCA-GPU单元异构协同

在GPU单元上,与合作伙伴共建自主GPU联合生态,统一算子接口标准、提供统一北向接口,兼容各GPU的深度学习框架。通过AI抽象降低客户迁移成本;通过AI加速提高训练+推理效率;通过AI池化提升GPU资源利用率。

2、COCA-DPU单元实现软硬一体化

在DPU单元方面,以COCA架构为基础,打造网络引擎、存储引擎、管控引擎、虚拟化引擎、安全引擎等五大卸载引擎,软硬融合重构算力基础设施,助力编程加速单元DPU成为新算力核心,重新定义算力时代云计算技术新标准,构建算力时代新技术曲线。

3、COCA-HPN单元突破算力连接瓶颈

在HPN单元方面,COCA架构融合X-Link + 自研“乌蒙协议”+ 分布式通信库等技术,其中,X-Link聚焦算力物理连接提升单机内部算力交互效率,自研“乌蒙协议”聚焦打造端到端高性能网络连接,分布式通信库聚焦算力调度及连接。三者协同配合攻坚大模型等应用场景的算力供给,突破算力连接瓶颈,推动算力新基建能力跃升。

值得一提的是,在最新发布第三代磐石服务器上,磐石服务器所搭载的磐石DPU由COCA DPU单元纳管,可有效提升整体算力、整机存储与读写资源等核心性能。

目前,COCA已接入合作伙伴超30家,收获国家级自主知识产权成果50余项,支撑行业落地案例10余个,覆盖政务、金融、科学计算等领域。同时组建COCA联合生态工作组,将于2024年,打通DPU、GPU、HPN三大单元,来推动COCA生态繁荣发展。

从以上大会发布来看,移动云从战略上锚定“一流云商”,从技术上坚持自研,并积极携手合作伙伴,稳打稳扎在算网时代不断向前。

374139236e304fde9e35d803cae8dea9.gif