华为最新的大模型不会有“盘古Chat”此类命名,也不“对标”业界产品。但从云计算技术,到产业链支持,华为参与大模型竞争,也有其自身优势。
作者/南溟
(资料图)
出品/新摘商业评论
华为终于又透露了大模型的消息。
大模型新产品将于今年7月初发布,据了解,这款大模型产品是一款多模态千亿级大模型产品,其客户主要面向To B/G政企端客户。
这也让华为在大模型领域的野心逐渐摆上台面。
天眼查搜索发现,华为申请注册了两枚“HUAWEI NETGPT”商标,国际分类为科学仪器、网站服务,当前商标状态为申请中。更有意思的是,华为已成功注册多枚“盘古”“PANGU”商标。
华为向媒体表示了,最新的大模型不会有“盘古Chat”此类命名,也不“对标”业界产品。
一系列的大动作让华为在大模型领域的布局从幕后走到了台前,面对国内大模型领域火热开赛,阿里,百度,科大讯飞,360等大厂已领先一步参与其中。相比之下,华为携此前多次提到的盘古亮相,背后也并非一日之功,从云计算技术,到产业链支持,华为参与大模型竞争,也有其自身优势。
一、华为跃跃欲试大模型
华为大模型最早于2020年11月在华为云内部立项成功,2021年4月对外发布,2022年4月,其升级到版本,目前,AI 大模型中的 NLP 大模型、CV 大模型以及科学计算大模型(气象大模型)均已被标记为即将上线状态。
对于华为盘古大模型,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
据了解,华为盘古大模型是首个千亿参数中文预训练大模型,CV 大模型则首次达到 30 亿参数。盘古 CV 大模型业界最大 CV 大模型、首次实现兼顾判别与生成能力、在 ImageNet 上小样本学习能力上的业界第一。
CV大模型是指用于计算机视觉任务的大型深度学习模型,通常采用卷积神经网络(Convolutional Neural Network,CNN)等深度学习算法来实现。
CV大模型的思路是将输入图像转换为输出结果,例如识别图像中的物体类别或位置等信息。
近年来,随着深度学习技术的发展和计算能力的提升,CV大模型在计算机视觉领域取得了很多重要成果,例如图像分类、目标检测、图像分割等任务。
据华为云官方发布的消息,目前华为“盘古系列 AI 大模型”基础层主要包括 NLP 大模型、CV 大模型、以及科学计算大模型等,上层则是与合作伙伴开发的华为行业大模型。
二、群雄逐鹿大模型,云计算为AIGC开路
随着去年ChatGPT的出现,大模型对科技社会的颠覆意义让整个社会陷入“AI焦虑”,焦虑之余,随之而来的,是国内各家大厂纷纷加入大模型战队,与其焦虑不如先人一步加入其中。
百度,阿里巴巴,科大讯飞等多家大厂都相继发布了自己的大模型,而云作为最前端可以售卖的TOB产品,显得更为直接。
在百度文心一言发布两个多月之后,5月29日,李彦宏宣布百度很快会正式推出文心一言(ERNIE Bot)大模型版本。与此同时,百度还宣布将设立规模为10亿元的文心投资基金,面向AIGC领域潜力股创企,提供涵盖资金、技术、业务资源在内的全面扶持,持续关注AI领域优质创业团队。
李彦宏在演讲中表达了对中国大模型领域发展前景的看法,在他看来:“未来将产生三大产业机会,分别为新型云计算公司、进行行业模型精调的公司,以及基于大模型底座进行应用开发的公司,即应用服务提供商。”
5月6日,科大讯飞正式对外发布讯飞星火认知大模型。科大讯飞董事长刘庆峰提出未来五年奋斗目标:达到十亿用户、实现千亿收入、带动万亿产业生态。
阿里巴巴的通义千问同样来势凶猛,不到两个月的时间,阿里云已经对外发布了通义千问和通义听悟大模型,在自然语言生成和AI音视频赛道火速布局,此外像天猫精灵和钉钉应用层面的产品也纷纷通过云的底层来实现更好地运转。
大厂动态频频,大模型背后依靠的,是算力,算法和数据的支持,这一切,最终都要归功于大厂云计算的实力。显然,目前百度,阿里大模型都在为云计算铺路。
大厂逐鹿大模型时代下,对云计算提出了更多元的要求,云计算的技术架构以及产品布局也会随着各家大厂大模型产品的调整而进行相应的适配和改变。
同样大模型的热点,也为云计算TOB带来了流量和关注点,让原本没有那么性感的产品让外界有了更深的认识。
AIGC的发展需要海量的数据资源做支撑,大模型算力需求的算力底座计算资源,网络连接,数据存储以及模型管理需求等,都需要云计算做支持。
以ChatGPT为例,其发布后一度引来巨量访问,使得其多次出现宕机,这足以见得,大模型对于稳定性的需求之高。从算力上来看,云计算能够借助通用服务器和专属硬件为大模型提供更优化的计算资源的调度和管理,以保证良好的运力稳定性。
纵观国内已经入局大模型的大厂,无一不是在云计算领域有着超前技术优势的企业。
三、携盘古入场,华为新大模型亮点何在
对于中国的大模型,李彦宏认为,中国会有自己的生态系统,拥有自己的大语言模型和基础模型。中国会出现至少一个、也可能是两个或三个基础大模型,可以支持人们开发各种AI原生应用。
基础大模型是基于更广泛更全面生态系统的支持上的,需要强大的数据和算力支持。
这一点,华为大模型也有其独特的优势。
据华为云官方数据,目前,华为云AI已在各行业落地了1000+项目,在大模型方面,华为云的AI技术多元化项目提供海量数据支持,同时,华为云自身有多年的市场积累,在用户群体的拓展,市场应用方面具备深厚的积淀。
从技术层面来看,华为冲击大模型的优势同样突出,据了解,华为盘古大模型涉及千亿参数,为此,华为团队调用了超过2000块的昇腾910,花费2个月时间训练。昇腾 910是业界算力最强的AI处理器,基于自研华为达芬奇架构3D Cube技术,实现业界最佳AI性能与能效。
在产业链建设方面,华为投入大量的财力,以及技术支持,2022年,华为研发投入1615亿元,约占全年收入的%,管理层表示研发投资是华为构建长期、持续竞争力的核心。
此前,华为宣布实现自主可控的 MetaERP 研发,并完成对旧ERP系统的替换。6月5日,有消息称,华为将于6月7日推出全新GaussDB数据库产品,是国内首个软硬协同全栈自主的数据库。
华为常务董事、华为云CEO张平安曾表示:“人工智能正对所有行业产生深远的影响,我们认为,AI大模型将会重塑各个行业的数字化转型和智能升级。”
华为盘古大模型的问世和发展,势必会给整个带来新的血液,与此同时,华为想要在大模型领域占得领先之地,还需要华为云在技术、人员、财力等多方面源源不断的贡献力量。