盘古大模型加持,华为鸿蒙4.0能玩出什么新花样?
(本文系紫金财经原创稿件,转载请注明来源)
(资料图片仅供参考)
在近日的华为开发者大会上,鸿蒙 HarmonyOS 4 系统正式发布之际,华为告诉用户一个道理:当下的手机还不够智能,仍有更多想象空间。
以智能手机的“标配“——智能语音助手为例,虽名为智能助手,却始终做不到真正的智能交互。“我好像听不明白”,成为和语音助手对话时,出现频率最高的一句回答。
根据国家工信安全中心发布的《手机语音唤醒测评研究报告》显示,过度依赖关键词、抗噪能力有限、容易被误唤醒等问题,让语音助手的使用体验大打折扣。
自AI大模型狂飙后,语音助手迎来了新的“解药”。
外界纷纷期待大模型重塑手机智能语音助手的灵敏度,带来更为丝滑的交互体验。当然,在此话题被多次讨论时,更多的关注度落在了苹果的产品身上,自从苹果被曝研发大模型后,关于苹果AI大模型将如何赋能siri的猜测就从未停止过。
然而,还未等苹果“交卷”,华为已经弯道超车,给出了解决方案。
华为常务董事、终端BG CEO余承东表示,华为智慧助手小艺已经接入了AI盘古大模型能力。新升级的小艺可以实现更自然流畅的对话交互、拥有信息检索、摘要生成、多语种翻译等能力。借助大模型的技术能力,手机内的语音助手在智慧终端交互、生产力提升和个性化服务等方面,均能得到提升。
简单来说,以后华为手机的智能语音助手,更能听懂你在说什么,理解你潜在的真实诉求。
不过从华为的新进展难以展现出,AI大模型+手机带来的全新体验。将视角放大,苹果一直在尝试这类方向的研究,库克还在5月份表示,苹果将在更多产品中加入人工智能,但会在“深思熟虑的基础上”进行。
库克的发言表明,AI大模型+手机是当之无愧的发展趋势,而在这趋势中,强如苹果都在谨慎研发。抢先一步的华为,除了速度快,还有哪些技术底牌?
AI+大模型,手机更智能
发布新系统时,华为提出了一个新概念:“元服务”!
通过万能卡片的方式,将应用功能主动推送到手机桌面上。“服务前置”的方式,一定程度上会影响未来手机的交互模式。通过华为诸多细节的改动来看,借助AI大模型的能力,手机正在越来越智能,当下仅仅是个开始。
从底层逻辑来看,华为将传统的“人找服务”改为“服务找人”。以前,用户想得知热搜、股票、外卖配送进度等消息时,需要打开分散在桌面的不同APP。桌面十分臃肿的同时,操作链条较长。
虽然如此操作方式已成为常态,但这也恰恰表明,作为日常使用频率极高的手机,仍没有挖掘出用户潜在的真实需求。用户仍有更多使用偏好、使用习惯需要被定制化满足。
基于此,华为给出了两种解决方案,可以归类为,更能听懂需求,和主动满足需求。二者相加,最终导向余承东所说的“AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验。”
从更能听懂需求来看,在AI大模型加持下,华为语音助手小艺具备处理复杂要求,并找到准确信息的能力。举个例子,只需要和小艺描述菜系、人数、价格区间等基本要素后,小艺便可理解其中含义,并通过相关APP找到匹配的餐厅。
在更加智能小艺的支持下,节省了用户在APP内筛选的时间成本。用户可以根据不同需求,将小艺训练成更懂自己生活习惯的助手,例如,当戴上蓝牙耳机时,就自动播放收藏歌曲等。
此外,基于视觉技术的升级,小艺智慧搜图的体验也得到了极大提升,比如打开海报后,通过对话交互,可以让小艺直接识别海报中的活动地址,并导航到目的地。通过语音交互的方式,让“服务”主动来到用户面前,而非是用户逐步操作流程。
以上种种使用场景,主要的技术源于华为的NLP(自然语言处理)、CV(计算机视觉)等技术。
华院数据科学家曾表示,“语言可能是人类面对人工智能最后的壁垒,尤其是中文。”而华为的中文语言大模型,是业界首个超千亿参数的中文预训练大模型,也被业内认为是最接近人类中文理解能力的AI大模型。
相比于ChatGPT等AI模型,华为盘古大模型更注重针对中文语言的优化。在中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,总排行榜得分83.046,而人类水平是85.61分。
华为视觉大模型,是超过30亿参数的业界最大CV大模型,首次实现模型按需抽取,首次实现兼顾判别与生成能力。
如果说华为语音助手,听懂需求的能力得到提升,是基于华为技术的硬实力支持,那主动满足需求层面,则是华为更能洞察用户痛点的软实力所在。
华为的元服务卡片,通过外显服务卡片,将各类APP的实时动态显示出来,并支持跨设备运行。比如,当在电脑界面工作时,不用频繁翻阅手机,就能看到外卖配送的实时进度。旅行类出行卡片,会根据用户所在位置,实时推送,比如梦里水乡景区的元服务,当游客进入景区时,卡片会自动推荐附近的景点,并告知距离。到达景点时,卡片提供语音导览界面、附近餐厅等。
华为HarmonyOS所提出的元服务,从本质上来看更像是一个手机界的“产品经理”。能精准挖掘出,掩藏在“常态”使用方式之下的痛点。
值得注意的是,华为在技术侧飞速奔跑的同时,亦没忘记对用户隐私做出保障。华为表示,所有AI体验创新和场景设计的第一原则是安全与隐私保护,打造更负责任的AI。注重AI隐私性、以AI之长,革场景之命,华为的一小步,表明了智能手机在智能化道路上,还有大步的前进空间。
鸿蒙生态,藏在“第三空间”智能座舱
自2019年,华为首发鸿蒙系统以来,鸿蒙系统已经搭载在电视、手机、汽车等诸多终端中。
根据华为披露的数据显示,鸿蒙生态设备已达 7 亿台。这表明,华为将大模型技术赋能鸿蒙系统后,更多智能硬件都会迎来新的发展契机。在这其中,搭载大模型的鸿蒙系统4.0和智能座舱的融合后,打造出的“第三空间”更值得关注。
根据开发者大会显示,新版鸿蒙智能座舱的底座为引入盘古大模型的鸿蒙4.0。据华为介绍,该模型能提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化基础大模型,预训练数据中包含了超 3 万亿 tokens,推出了 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等全新能力集。
此外,在华为方舟图形引擎加持下,鸿蒙智能座舱将带来更加流畅的体验,例如在车机上进行地图导航的多指触控任意缩放、多任务自由切换、打通手机和座舱桌面等操作。
将上述能力具象化后,华为在智能座舱方面的升级,可以分为两个方向:
首先,基于AI大模型等技术,车载语音助手能和华为语音助手小艺一样,迎来自然语言理解层面质的飞跃;其次,交互层面可以进行多终端设备融合。从单人单设备体验,演进到多人多设备协同体验。鸿蒙智能座舱支持多屏同享功能,凭借超低的时延,可实现座舱内多屏同步观影。
在这两方面中,集大成者的功能为超级桌面。超级桌面中的头部应用,增加了语音操控,华为公布的数据显示,目前 87.6% 座舱操作均由语音助手小艺完成。
此外,超级桌面可以在汽车上运行手机的APP。目前已经适配了部分第三方应用,覆盖多种场景,例如在游戏方面,用户可以在座舱中通过超级桌面打开《巅峰极速》等手机游戏,使用手柄操控。
华为表示,首款搭载鸿蒙座舱4.0的车型,将会是今年四季度上市的问界M9。在开发者大会落幕后,余承东发微博表示,华为鸿蒙生态搭载的首款纯电轿跑,也即将面试。
实际上,通过华为鸿蒙4.0带给智能座舱的升级来看,华为正在逐步打造,属于鸿蒙生态的“第三空间”。
余承东曾阐述过鸿蒙系统的发展:“我们要打造鸿蒙操作系统的北向接口和南向接口,南向接所有分布式设备,北向接大量的应用,构筑未来的生态。”由此可见,华为一直不甘于只做系统,而是生态。
华为对于智能座舱赛道的竞争,充满信心。余承东曾说过“未来智能座舱分为两种,一种是鸿蒙,另一种是others。”
华为的优势十分明显,根据乘联会秘书长崔东树表示,汉语只有中国企业理解的更深刻。随着未来的底层赋能,国内汽车业界在应用层面将会有更多良好的人机交互效果。
虽然具备交互层面的技术优势,但华为也不得不直面行业现状。根据《中国车载OS行业市场前景及投资机会研究报告》显示,目前车载OS系统中黑莓的QNX,占比近半达到44%;Linux占比达34%,微软的WinCE,占比达10%。
由此可见,在智能座舱领域,华为的未来道阻且长。
虽然华为不造车,但在汽车“第三空间”中,华为已经深入产业,借助华为的技术能力,未来会有更多更智能的汽车上市。在精进智能座舱的技术时,华为也不单单只是在做汽车,汽车和手机的丝滑交互,也是在为华为手机销量添色。其次,所有终端所构建的鸿蒙生态系统,再次加深了华为的护城河。
从鸿蒙系统,窥见华为未来
2019年,鸿蒙系统首次亮相。对于华为而言,自研系统一方面属于华为整体的战略性布局,另一方面,也是华为在时代背景下,将底层技术掌握手中的重要环节。通过鸿蒙系统的加持,华为不仅在移动端实现“万物互联”,也逐步攻破B端场景。B端+C端的布局,才是鸿蒙系统真正的未来,也是华为主发展方向。
诞生五年来,在C端,鸿蒙系统已经覆盖手机、PC等移动设备。余承东表示,搭载HarmonyOS的华为设备已超过7亿台,鸿蒙生态开发者超过220万人,鸿蒙开发者活动超过350万人次参加,API的调用590多亿次。
经过五年的发展,据市场调查机构Counterpoint数据显示,鸿蒙系统在中国的市场份额已经达到8%,成为Android、iOS之后的第三大手机操作系统。不过在全球范围内,鸿蒙系统的市场份额仍然只有2%。
虽然在国内崛起迅速,但在全球范围内鸿蒙的声音还较弱。由此可见,C端范围内,鸿蒙的未来必定有出海环节。目前已有相关动作,在深圳,鸿蒙正在和华为另一个智能操作系统欧拉携手,加强技术的同时,也加速走出去的步伐。
相对于更能被外界感知的C端,鸿蒙在B端的动作虽显得较为安静,但进展速度不落后于C端。
在鸿蒙OS用户破亿之际,华为与国家能源集团联合推出了鸿蒙矿山系统,命名为矿鸿。标志着鸿蒙进军B端。
矿山正在智能化转型的节点,在操作系统上,企业可能使用Linux、Unix、Windows、VxWorks等多个操作系统,需要多种协议。使得智能化转型门槛极高,操作成本大。基于此,华为建立同一架构平台鸿蒙矿山系统,解决了操作系统碎片化的痛点。
此外,华为将鸿蒙系统的基础能力,全部捐献给了开放原子开源基金会。各行各业的厂家,都可以在开放原子基金会获得代码,根据业务诉求做自己的产品。华为消费者业务软件部总裁王成录表示,“我们华为也是从开放原子基金会拿回来代码,再叠加上我们的产品特性做的。所以后续企业是否采用鸿蒙系统,加入鸿蒙生态就是企业的商业选择了。”
可见,赋能各行各业、生态开源,才是华为鸿蒙系统在B端的注脚。目前,开源鸿蒙在教育、交通、金融、政务、超高清、安平、医疗、工业、城市等9大行业已经落地。
C端全球化、B端开源做大生态,这就是鸿蒙选择的征途。
总结:
提起华为,总是和“脊梁”、“情怀”等描述性词汇同时出现。
诚然,华为作为民族企业,取得的成绩担得起民族企业代表之一的称号。但太多过于花哨的形容词,难免会给华为增添“滤镜”。摘掉形容词后,华为的本身,只是一家默默耕耘的高科技企业。
精研技术,利用自身技术之长赋能其他行业,再通过回馈的数据继续迭代技术,华为正在这条闭环上步履不停。
当我们在探讨华为时,将更多的目光放在技术本身,才能看见更加真实的华为。
关键词: