明敏 发自 HDC2024

量子位 | 公众号 QbitAI

华为自研盘古大模型,跳级迭代!

HDC 2024上,没有4.0,直接发布5.0。

最新系列覆盖十亿、百亿、千亿、万亿四种规模,分别针对当下大模型领域的不同应用需求。

同时还强调了多模态强思维两方面属性。

具体能力有多强?

华为直接现场演示搭载了盘古大模型的人形机器人。

它能从多个物体中找到可以喝的那一个,递给口渴的人类。

据介绍,盘古大模型能让机器人完成10步以上的复杂任务规划。

而且盘古大模型还能生成机器人需要的训练视频,让它更快学习各种复杂场景。

同样的思路还被用在了自动驾驶领域。

盘古大模型能够理解并遵循物理规律,生成视觉上逼真、车辆行为、环境互动真实的训练视频。

比如让它生成在傍晚下雨行车场景,它在学习过程中自动理解到了“开车灯”这个行为,并在生成视频中模拟出了这个细节。

鸿蒙系统也用上了最新盘古。华为智慧助手小艺的多模态能力,就得益于盘古。

除了能力展示外,在现场,华为还直接揭秘盘古背后技术细节。从数据到训练方法,都做了更进一步说明。

当然还有原生鸿蒙的一系列最新进展,从架构到生态,这次都可谓是“有史最大升级”。

普通用户(P70、Mate60等)最早今年8月就能体验到Beta版了。

盘古5.0三大升级

盘古5.0主要包含4种参数规格:

  • 十亿级的Pangu E系列:支撑手机、PC等端侧的智能应用;
  • 百亿级的Pangu P系列:适用于低时延、低成本的推理场景;
  • 千亿级的Pangu U系列:适用于处理复杂任务,可以成为企业通用大模型的底座;
  • 万亿级的Pangu S系列:处理跨领域多任务的超级大模型。

强调的两大能力为:

  • 多模态
  • 强思维

多模态方面,盘古大模型5.0能够更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。

比如,它能从清明上河图中精准找到“赵太丞家有几口人”。在原画中,这部分的占比不到1/200.

在生成方面,盘古5.0,可以生成符合物理世界规律的多模态内容,让创新随心所欲。

得益于可控时空生成技术(STCG),模型有了对物理规律的理解能力。

在自动驾驶方面,盘古大模型可以生成六摄像头视角视频,而且对细节的把控很好,让自动驾驶系统可以直接获取到全方位、高仿真度的训练素材。

例如,车辆在不同摄像头视角间的平滑过渡,以及在不同天气和光照条件下行驶的自然表现,都显示了模型对空间和时间维度精准把握的能力。

强思维方面,复杂逻辑推理是大模型成为行业助手的关键。盘古大模型5.0将思维链技术 与策略搜索技术深度结合,极大提升了数学能力、复杂任务规划能力。

比如在具身智能领域,盘古大模型和乐聚人形机器人合作,让夸父机器人可以识别物品、问答互动、击掌、递水。

通过模仿学习策略,华为云与乐聚公司显著提升了人形机器人的双臂操作能力,实现了软硬件层面的协同优化,不仅增强了机器人综合性能,还克服了小样本数据训练的局限性,推动了泛化操作能力的边界。

多模态和强思维结合,让盘古大模型在行业中的应用更加广泛。

比如在工业设计领域,盘古大模型能够被用于汽车造型设计、工装设计、模具设计;在建筑设计领域,基于盘古大模型的可控生成能力,只需输入设计的黑白草图,即可生成彩色并带有纹理的建筑群360°实景视频;基于盘古3D重建能力,还可以构建出高真实感的建筑3D模型,将复杂建筑群的概念设计周期从数周缩短到数十分钟。

除了实际应用,华为对盘古背后的技术也进行了更深入揭秘。

包括数据科学、新型架构π以及如何训练万亿稠密大模型,都做了更进一步说明。

鸿蒙冲刺、仓颉亮相

除了一系列大模型成果亮相,这届HDC上的另一件大事,就是HarmonyOS NEXT了。

这被称为是“有史以来最大一次升级”。

HarmonyOS NEXT现在已正式开启面向开发者和先锋用户的beta升级。

在公布的计划中,今年8月P70、Mate60等机型也将能开始beta升级。

余承东也在现场宣布,鸿蒙原生应用已进入全面冲刺阶段, 5000多个常用应用已全部启动开发,其中超过1500家已完成上架。

据介绍,HarmonyOS NEXT采用端云垂直整合的全新系统架构,从操作系统内核、文件系统,到编程语言、编译器/运行时、编程框架,再到设计系统、集成开发环境,以及AI框架和大模型等,全面焕新。

鸿蒙内核完整替代传统内核,性能提升10%;华为研发EROFS文件系统,随机读性能对比EXT4提升3倍,为用户节省2GB以上存储空间;ArkData全新分布式智能数据底座,把华为高斯数据库带到了端侧,拥有多模态、更智能、高性能等特性。

在系统架构上,华为也进行了软硬芯云的深度整合,HarmonyOS NEXT的整机性能相比HarmonyOS 4提升30%。

值得一提的是,华为自研仓颉编程语言正式亮相,意味着鸿蒙生态补齐了“最后一环”。

2020年,华为被曝出正在自研编程语言仓颉,华为还在当年8月申请注册了“仓颉语言”商标。

在官方介绍中,仓颉编程语言面向全场景应用开发。它是一门多范式编程语言,支持函数式、命令式和面向对象等多种范式,包括值类型、类和接口、泛型、代数数据类型、模式匹配、以及高阶函数等特性。

目前,HarmonyOS NEXT仓颉语言开发者预览版Beta招募也已开启。

发布中,余承东表示原生鸿蒙正在全力冲刺,加入鸿蒙正当时。

鸿蒙实现了操作系统技术的全面突破,实现中国自主可控!

我们用10年做完了欧美30年才完成的事。

这番激动人心的发言也再次把老余送上热搜。

尽管有人发现,“小而美”似乎还没有被展示在鸿蒙生态里……但可以确定的是,今年鸿蒙系统一定还有惊喜可看。

— 完 —

量子位 QbitAI · 头条号

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com