自研芯片,正成为越来越多科技公司的选择。在国内,阿里巴巴推出了含光、玄铁、无剑,腾讯推出了紫霄、沧海、玄灵,百度也有昆仑;在国外,亚马逊云科技推出了Amazon Nitro、Amazon Graviton和Amazon Inferentia,谷歌则很早便发布了自研AI芯片TPU。

各种类型、各种架构芯片的涌现,给市场提供了更多可选项,与此同时,市场也希望作为“超级底座”的云计算,能够屏蔽底层硬件的架构差异,并能依据上层应用特点完成资源的自适应调度和统一管理,因此,“一云多芯”也成为云平台需要具备的一项核心能力。


(资料图)

近日,浪潮云海OS完成了业界首个“一云多芯”SPEC Cloud基准测试。而围绕“一云多芯”的话题,浪潮数据董事长张东在接受记者采访时表示,“一云多芯”已成为云计算平台的一种“刚需”,也是一项全球化的重要趋势,在这个过程中,中国市场会走得更快,其中很重要的一个原因是中国已经具有一定的技术基础。

张东指出,目前,我国从芯片、整机、操作系统、云平台、中间件到应用软件等技术领域的创新链、产业链已初步形成,以X86、ARM、Power等不同架构处理器为基础的产业生态框架已基本就绪,在这些基础之上去推动一云多芯,整个节奏会更快。

但是,“一云多芯”在落地过程中依然面临诸多挑战。首先是理念的转变,IT基础架构经过长期的发展,从大机、小机时代逐步演进到云计算时代,开放计算深入人心。但直至今日,芯片指令集、操作系统架构上的差异化依然制约着架构的横向协同,比如一个应用需要同时适配多个指令集和操作系统的问题仍然很严重。

其次是市场缺乏统一的“一云多芯”建设标准、规范。目前,各厂商因技术能力差别导致理解和落地模式均有所不同,比如部分厂商将纳管多个独立的不同芯片架构资源池的这种模式也包装成“一云多芯”,由于无法实现真正的互联互通,对业务的连续性造成很大的风险。

最后是生态离散化的挑战。从产业链协同上看,芯片多元化的发展趋势,使得芯片产业出现大量规模较小的芯片初创公司,导致生态呈离散化发展,众多小生态并行存在且互不兼容,难以形成产业合力,同时又给行业客户在使用环节带来困扰。

此外,以不同架构处理器为基础的产业生态涵盖了从芯片、国产整机、操作系统、云平台、中间件到应用软件的整个产业链,而芯片初创公司要想完全打通延展度极高的产业链条,困难重重。

对此,张东向记者表示,IT产业需要新的理念、新的路径、新的设计,要基于以系统设计为核心的思维,采用以场景驱动的“硬件重构+软件定义”的融合架构,是数据中心体系结构的发展方向。

“一云多芯是一个技术理念,仅靠个别厂商推动很难做到,它需要整个生态的共同努力才能真正实现。”张东称,比如从客户角度,当他打算建云并选择技术路线时,就应该考虑到一云多芯,而不是把宝完全压到某个厂商或某个芯片架构上。再比如芯片厂商和做整机的厂商,也不能只想着让云厂商适应自己,而是应该从系统视角,以应用为导向去思考芯片的设计。

“一云多芯最后形成的不是一个云产品,而是包含了芯片厂商、整机厂商、云产品以及应用厂商的一套规范,只有整个生态的构建都按照它来进行,才能达成一云多芯的最终目标。”张东说。

而一云多芯的最终目标,是要让不同架构的芯片共存在一个云里,且上层业务能够在不同架构之间平滑切换。

张东指出,要实现一云多芯的最终目标,需要经历三个发展阶段:第一个阶段是以云为入口,通过云操作系统实现异构处理器服务器的统一管理;第二阶段是进一步实现应用的低成本跨架构切换;第三阶段则是实现应用与芯片架构的彻底解耦。

目前,“一云多芯”的发展正步入第二阶段,且仍有诸多困难需要克服。而对于第三阶段的实现,张东强调称,“这需要硬件、云以及应用等产业链上下游的共同协同,完善异构架构下有效算力的量化方法,以支持应用在不同架构处理器间的等价切换。”

此外,张东还提到了“一云多芯”对于降低供应链风险的重要性。他表示,当前,全球化的衰退带来了更多的不确定性,客户出于业务连续性的考虑,不得不未雨绸缪选择x86架构之外的处理器架构,规避可能因部分芯片“断供”而引发的业务风险。而“一云多芯”的出现,使得客户可以最大程度降低技术路线的选择风险,极大提升业务稳定性以及业务改造的灵活性。

推荐内容