科技行者
算力行者
科技行者 10月22日 上海消息(文/周雅):去年,华为把公有云业务从it产品线剥离出来,成立了一个独立的部门——“cloud bu”,组织架构上与华为三大bg(运营商bg、消费者bg、企业bg)并列。一时间,华为云的品牌slogan铺满各大机场、车站广告牌,“有技术、有未来、值得信赖”成为华为云朗朗上口的头号标签。
云服务早已经是华为整体业务和凯发k8娱乐的解决方案的底座,华为云也逐渐在市场崭露头角,引用一项来自今年4月初的gartner最新报告《market guide for cloud infrastructure as a service, china》作为佐证,当中cloud iaas第一梯队 "hyperscale(超大规模)"的云厂商名单里,成立仅一年的华为云赫然在列。
然而快速扩张之余,华为云开始思考如何决胜未来。2018华为全联接大会期间,华为云bu cto张宇昕接受了包括科技行者在内的媒体采访,阐述了华为在cloud2.0时代的准备。
华为云bu cto张宇昕
张宇昕认为,cloud2.0时代来临,相对于过去十几年互联网的发展有显著的不同,有几个很明显的特征:
第一,企业开始上云,尤其是企业的关键应用上云。相比过去云仅应用于个人娱乐和消费领域,cloud2.0时代的云进入了生产领域,带来一些明显的问题,比如企业的关键应用上云如何支撑,关于企业应用的数字化、智能化如何支撑?
第二,cloud2.0时代,即便是传统的互联网应用也发生了很多变化。在过去十几年,互联网厂商的成长模式基本靠做流量红利,谁能获得更多的流量,谁就能发展壮大。但是流量红利终有天花板,且流量红利模式容易被复制。cloud2.0时代要想做好新的互联网业务,核心是从流量红利变成数据红利,比拼的是人工智能和大数据。由此带来技术的变化、全系统架构的变化,明显与cloud 1.0时代通过流量来堆规模不同。
“所以,我把cloud1.0时代的技术简单总结为常见名词:分布式、自动化、大规模弹性。但是cloud 2.0时代光有这些技术是不够的,云服务商需要思考的问题是,如何支持更好的可靠性和安全性,以满足企业关键应用上云”,张宇昕表示。
第三,无论是企业应用还是互联网应用都要智能化,如何让智能应用做得更简单,性价比更高,让用户用得起、用得好、用得放心,这是云服务商在技术方面遇到的挑战。
显然,如果说cloud1.0时代的云服务更多聚焦在软件创新,cloud2.0时代则更进一步,芯片和硬件创新将是常态。
华为积极拥抱变革。“cloud 2.0时代,华为云数据中心进行了全栈的技术创新”张宇昕介绍,从芯片、硬件、整个数据中心的管理到基础云服务,到应用开发平台,包括应用的开发部署运维平台和工具框架,一直到ai的基础模型算法以及面向各个领域的建模和算法……华为追求的是整个垂直轴的技术突破。
比如芯片方面,华为的ai芯片覆盖全场景、全栈式。计算领域,华为围绕ai构建普惠ai的实例,比普通的计算实例性能提升了16倍。另外,华为通过100g的云智能网卡实现了网络转发的能力,通过控制面架构重构实现在数据中心内部百万节点的网络连接,这可以进一步支撑从虚机到容器、到serverless应用之后的更大规模的计算节点。
张宇昕:我把华为公司的技术创新分为三类:基础技术的创新,长远的技术创新投入,以及面向客户场景的技术创新。
· 基础技术的创新。这些都是通用的技术,是围绕着计算机的基础技术,是没有行业特征的。比如芯片,无论是计算的芯片、存储的芯片、网络的芯片,华为均有涉猎。再比如软件,从操作系统、数据库到虚拟化,到分布式的一些技术,这些技术均没有明显的行业特征或者产品特点。再往上就是华为积累的大数据、ai的能力。华为早期积累了运营商业务,2011年开始涉足企业和消费者领域,更多技术得到积累。
· 面向长远的、长期的技术创新。这些技术可能还没有进入到华为的生产和研发领域,华为自己内部叫做三代战略——应用一代、开发一代和研究一代。目前市面上华为销售的产品和服务都是应用一代,开发一代未必对外公开,而研究一代相对而言更为神秘。华为在面向未来的准备上投入非常大,大家看到的华为技术可能只是冰山一角。
过去八年,从2009年开始到现在,华为研发投入将近4000亿人民币,2017年华为的研发投入将近900亿人民币,2018年肯定会突破这个数字,这么多钱投到哪里去了?我们不说国内的研发中心(国内的研发中心有产品的开发,也有一些超前的技术研究);仅就华为海外的研发中心都是以面向未来超前的技术为主,华为目前在北美约有20个研发中心,在欧洲已经有30多个研发中心,跟当地的研究机构、学校、公司都建立了很好的创新连接,可以讲,华为不惜以各种形式投入研发,包括对世界top100的学校、世界最顶尖的学者和教授进行资助,包括开放一些课题让学校来研究。这就是为什么华为的研发投入如此之大的原因。去年,华为研发投入在全球高科技公司排名第六。
通过这些侧面告诉大家,华为在冰山下面的部分是非常庞大的,而这些技术未来我们都会用到,可能明年,可能3-5年,甚至于5-10年都在做技术准备。华为的这些技术投入也是云bu可以利用的。
· 面向客户场景的技术创新。这当中包括在客户业务场景下的一些工程方案,和面向业务的一些使能技术。由于华为在2011年由单一运营商业务拓展到企业和消费者业务,使得华为形成了“端、网、云”协同的优势。几年时间,华为云全球也是主要的玩家,因此积累了丰富的经验。比如金融行业对于高可靠、安全的能力要求,这些在实验室里面是体会不到的,只有跟客户不断地进行联合创新,不断地进行交流和迭代,才能够理解,从而突破这一类的技术。很多互联网客户上华为云,为什么?我们基于intel v5的计算实例性能达到业界领先,可以帮助互联网客户提性能,支持客户的高峰流量能够平稳渡过,这也是面向客户场景经验的积累。
这三方面的技术加起来促使“云bu”站在华为巨人的肩膀上快速前进。
张宇昕:目前来看,华为过去30年所积累的无论是软硬件技术的能力,还是基于运营商在网络方面的经验,基于企业在行业里面的经验,还是哪怕基于终端消费者客户的经验,对我们来说都是一个很好的积淀。
大家觉得华为没有互联网基因,但是华为的vmall也是中国最大的几个电商之一,华为的消费者云去年已经达到了全球4~5亿用户,今年据估计有可能全球突破6亿用户,而他们都承载在华为云上。这就是很典型的互联网应用,对于华为云也是一个很好的场景积淀。
运营商业务到底对华为云有什么帮助?我刚才讲过一句话:华为是业界为数不多的能够把企业的数据中心网络、云接入网络、华为云数据中心的内部网络以及华为云骨干网络协同起来的进行端到端创新的云服务商,全世界没有几个厂商可以这么做。企业数据中心网络是华为私有云的网络方案;云接入和云骨干本质是运营商网络,华为一直在从事这个领域的工作;华为云数据中心里面的网络由华为云bu在持续创新。所以我们不仅仅具备全部能力,而且关键是能进行端到端的协同创新,这一点充分体现了华为在运营商和企业的技术积累。
比如华为的单芯片100g云智能网卡,其中有一个架构叫类np的架构。大家应该了解:一些中国的云厂商还没有做芯片的能力,而美国云厂商虽然也做了智能网卡,但是没有能力做单芯片的soc。我们之所以能够做类np的架构,是因为np架构过去是用于运营商领域的,华为有长期的积累,所以我们把这个架构用来做云智能网卡,我们能够快速支持单芯片soc,多协议卸载,性能是业界最佳的2.5倍,功耗低,这些都是我们传统运营商业务和企业业务的能力积累。
张宇昕:我们现在创新与传统创新有不同,也有相同。不同就是创新的方式变了,传统ict的创新是以产品的方式来做,周期比较长,需要长期提前的投入,提前3-5年,甚至提前5-10年,华为敢于投、舍得投,敢于对未来做预判。这种创新的方式很大程度上是一个预判,是一个对未来的投资,过去的创新大都是此类方式。
云时代的创新,有些技术仍然需要这样去创新(提前投入),尤其需要长期积累的底层技术、通用技术,越是需要提前投入的方式去创新。而且华为还有这样的优势,我们敢于投未来。然而我们发现,云的技术越上层越是接近客户的应用,创新节奏和创新形态的变化越多,这就需要新的创新模式。以造芯为例,芯片是长周期的,比如ai的基础框架(deep learning的基础网络模型和算法),都是长周期的投入,此基础上,ai面向业务领域的一些算法,华为一方无法做成,因此采取了另外的创新模式,比如与客户一起进行联合创新:华为提供专业的数据工程师和科学家,建立抽象业务的模型,做数据的分类标记,从而训练出的初始模型放到客户的系统去试用,通过试用来验证这个模型好与坏,再将验证的结果进行调优,然后进行训练,优化到一定精度了才能放到客户的业务系统里面去用。
所以越是上层的创新,越是一个交互式、迭代式的创新;越是底层的技术,越需要有耐心和长期的投入。所以,上层的一些技术,尤其是面向业务场景的技术,我们可以以全新的方式,与每个行业处于领导者地位、先行者地位的客户进行联合创新。比如金融领域,华为与工行、招行、建行有很多的合作;医学医疗基因领域,华为与金域、贝瑞都有很好的合作。这就是在做联合创新,这些创新的方式跟过去完全不同。
举例表面,华为芯片的架构毫无疑问是一个独创。
网络方面,华为在广域网络之上开创性的提出一个internet智能专线的技术,这个技术来源于高可靠要求的客户。具体而言,企业领域如果业务断了,问题很严重,所以我们借助了华为过去在电信领域的网络高可靠理念,在云骨干网络上提供双平面,在物理层面提供mpls专线网络,用sdn技术进行管理,又用类sdn的技术在internet上形成一个虚拟广域网,双平面进行协同。这样一来,关键客户如果一个平面走不通了,至少还有另外一个平面可以做逃生通道。
为什么用类sdn的技术在internet上建立虚拟广域网?好在两个地方,第一,它的流量性能比普通的internet高3-5倍。第二,在3-5倍性能基础之上,它本身的成本与物理网络相比只有三分之一。这样对于客户而言,internet的平面仅仅不是一个末日世界时候的逃生通道,性价比也有一定的竞争力。所以,这些创新得益于华为的跨界经验,否则可能是做不出来的。
张宇昕:华为从不把领先对手作为目标,华为的核心价值观最核心的一条就是“以客户为中心”,所以公司一直对于各个业务的要求是眼睛盯着客户。在华为公司,眼睛盯着对手那是没有出息的,基本上每一个华为人的认知都是服务好客户。当然,我们在服务好客户的同时,也要看到业界的技术进步。
所以华为进步的驱动力来源于两个方面,我们把它叫做双轮驱动:一个是客户需求驱动,一个是技术驱动。两者最终的目的都是让华为更好地服务于客户。领先不是我们追求的目标,而是我们业务不断发展壮大的一个自然的结果。
张宇昕:不应该单纯从价格来看ai,单纯的低价格也是没有出息的。华为推出了ai芯片后,结合自己软件的技术(比如虚拟化、容器),就打造了普惠ai的虚机实例和容器实力。这些技术出来以后,华为能实现计算实例对于ai处理器的共享,那么就可以充分地提升ai处理器的利用率。这些技术综合起来能够大幅地降低ai使用单位成本,使得单位的ai计算成本得到降低,使得大家用得起了,这时候我们带来更多的是ai应用的井喷。再结合华为在ai平台上所提供的算法,以及华为打造的全链条ai开发的环境,可以帮助华为的客户更好地开发ai应用,甚至于华为有技术帮助客户把现存的应用迁移到华为ai的系统上来,使ai的应用开发更简单。
我认为能够引发ai的井喷,让ai进入到各个行业里面去,才是普惠ai的价值,否则ai就仍然只是一小部分懂行的专家掌握的技术,如果ai停留在这个时代,ai永远不会成为一个普适的技术。
张宇昕:我们理性看待。我们不把arm用于x86替代,arm有适合于自己的场景,所以我们未来希望在arm的使用上形成多元计算的形态,把适合arm处理器的workload放到arm处理器上进行处理。
至于arm未来的前景,有几个场景在企业里面是非常适合的:
第一,边缘云服务。边缘意味着设备的形态比较小,功耗比较低,这种情况下,arm是有它的优势的。
第二,arm因为core相对比较多,所以对于高发的计算(比如某些场景下的hpc)需要的并发数是比较多的,单核并不一定特别强,这个应用在企业里面也是有的。
第三,华为现在逐步在把生态的边界打通。比如说,把原来手机上的生态通过arm引入到云里面去。请大家关注一下云手机,就是在云上用一个虚拟的手机,这样一来我就有两台手机,一台手机自己用,另一台手机在云上,可以做手机的备份,或者用于存放私密帐号。我们把终端的生态引入到企业里面去,我们用这样的方式给大家提供服务。
所以对于arm应用有两个方面,第一就是适合arm的workload,第二个就是形成不同生态的交互,这样可以为企业提供新的应用,这是我的想法。
好文章,需要你的鼓励
6月13日,在2022年阿里云峰会上,阿里云智能总裁张建锋表示,云计算进入了一个关键的突破期,“如果我们定义好下一代的云,中国云计算就有超车机会。”
如果要把企业的数字化转型进程比作一场球赛,神州数码云业务集团副总裁俞小冬指出,比赛已经开始进入下半场。
xp的成功以及后续几位继任者的失败,给整个技术行业带来了重要教训——总结来说:如果没出问题,请别“瞎折腾”。