揭秘华为行业大模型:不作诗的盘古,只做哪些事?

本文来源:时代周报 作者:杨玲玲


【资料图】

“华为盘古大模型不作诗,只做事。”7月7日,华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安在主题发言环节如是说道。

图源:直播视频截图

他提到,今年全球已发布数百个大模型,中国发布超80个大模型,这些大模型的共性是基本都会“对话作诗”,而华为大模型要深入到各行各业,帮助其创造价值。

当日,华为盘古大模型3.0正式对外发布,这是一个面向行业的大模型系列。“盘古为行业而生,就要为行业着想,”张平安表示,如今,盘古大模型已在气象、金融、制造、医药研发等诸多行业发挥巨大价值。

重塑千行百业

“去年年底,ChatGPT的出现把人工智能推到了一个新风口,当前,通用人工智能已经成为人类社会最热门的话题。”7月6日,华为轮值董事长胡厚崑在2023世界人工智能大会的主题演讲中表示,并透露华为将在7月7日的华为云开发者大会上推出盘古大模型3.0。

次日,华为对外发布盘古大模型3.0,这是一个面向行业的大模型系列,包括“5+N+X”三层架构:

L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。

图源:企业供图

L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务、金融、制造、矿山、气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上训练自己的专有大模型。

L2层为客户提供更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景。

比如,在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,同时预测速度也有大幅提升。原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。

在金融领域,盘古金融大模型可以通过银行的各种操作、政策、案例文档进行预训练,根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。

对于制造领域,过去单产线制定器件分配计划,往往要花费3个小时以上才能做齐1天的生产计划。盘古制造大模型学习华为产线上各种器件数据、业务流程及规则以后,对业务需求进行准确的意图理解,并调用天筹AI求解器插件,1分钟即可做出未来3天的生产计划。

至于药物研发领域,张平安在现场举了一个例子,原来一款新药研发平均需要10年时间、花费10亿美金。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。

张平安在华为开发者大会2023(Cloud)媒体沟通环节表示,“华为在AI大模型领域投入非常大,而在商业化落地方面也为客户提供了多样化的服务模式,但现在谈AI大模型收益还为时过早。”

人工智能开启新黄金10年

2021年4月,盘古大模型正式对外发布。盘古大模型发布以来,已经发展出L0、L1、L2三大阶段的成熟体系持续进化。

去年9月,华为轮值董事长胡厚崑在世界人工智能大会上表示,华为云盘古预训练大模型已完成从学术大模型到产业大模型的转变,形成“基础大模型-行业大模型-细分场景大模型”的发展路径,并在医疗、互联网、金融、煤矿、农业、气象等领域中实现降本增效。

今年,胡厚崑则在世界人工智能大会上提出,人工智能的发展,关键要走深向实。围绕这个目标,华为表示,一方面要打造强有力的算力底座。另一方面,从通用大模型到行业大模型,真正让人工智能使能行业,助力科研。

算力是训练大模型的基础。在本次华为开发者大会2023(Cloud)上,张平安宣布单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。

图源:时代周报记者摄

同时,这些框架中90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。例如,美图仅用30天就将70个模型迁移到了昇腾,同时华为云和美图团队一起进行了30多个算子的优化以及流程的并行加速,AI性能较原有方案提升了30%。

根据胡厚崑透露,目前华为云生态已孵化20多个基础的大模型,同时还适配了10多个业界主流的大模型。另外,华为云盘古大模型已经深入金融、制造、政务、电力、煤矿、医疗、铁路等10多个行业,支撑400多个业务场景的AI应用落地。

据悉,盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,还可以单独升级能力集。

在L0和L1大模型的基础上,华为云为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户可以拥有自己的专属行业大模型。

不过,在华为开发者大会2023(Cloud)媒体沟通环节,华为相关负责人表示,华为云盘古大模型全栈技术均由华为自主创新的,没有采用任何开源技术,且华为云盘古大模型定位于赋能千行百业,这里面必将聚集无数行业大数据(涉及行业机密等),因此未来盘古大模型不会开源。

“我们非常有幸共同见证了科技革命的几次浪潮,从互联网到移动互联网,再到云计算,到人工智能,每一轮的变革都给社会带来了深远的影响。毫无疑问,站在今天,通用人工智能正给我们无穷的想象空间,也正带领我们走进下一个黄金的10年。”胡厚崑说道。

关键词: