华为发布盘古大模型：很酷，不聊天

2023-07-07 20:13:12 来源：蓝媒汇

千呼万唤始出来。

来源|AI蓝媒汇

ID:lanmeih001

(资料图片)

作者|伊柒

编辑|魏晓

“怎么上半年，就听不到你们的一点消息呢？”

外界对华为大模型最关心的这个问题，在今天的开发者大会上，华为高管开场便做了解释：

翻译翻译就是：很酷，不聊天。

2023年7月7日，华为开发者大会2023在东莞举办。会上，华为常务董事、华为云CEO张平安最先登台演讲，并发布了盘古大模型3.0，强调称 “华为做AI的方向始终是AI for industries（工业人工智能）”。

本次发布的盘古大模型3.0，亦是 面向行业。

区别于最早一批发布的通用大模型，如百度文心一言、讯飞星火等低门槛接触、随意对话的新一代人工智能，华为并未将自家大模型的重心放在C端。

从现场演示来看，盘古并非没有对话和问答功能，而是华为选择将这些ToC功能先放在行业场景中，再来看效果。

对于这家国内科技巨头而言，多年以来专精于B端业务的模式，或许已经成为惯性。

大模型之战，华为有备而来

没有写作绘画，没有诗和远方，华为给盘古大模型的定调就是 “完全面向行业”的大模型。

背后，则是一套系统——包括自然语言、多模态、视觉、预测大模型和科学计算五个基础大模型，以及针对政务、金融、制造、矿山等行业设计的专用大模型，和台风预测、药物制造等场景大模型。

早在2021年年报中，华为就已经提及“盘古预训练大模型”和生物医学、图文音多模态等数个应用案例，公司的布局远早于2022年末掀起的这场AI之战。

图/2021华为年报

显然，老师傅有备而来。

会上，华为以盘古大模型在气象和采矿等场景的作用为案例做了演示。

在煤矿行业，华为将盘古大模型应用到矿山开采及运输等7大业务流程、1000余个场景中，实现无人、少人安全作业。据悉，盘古矿山大模型已经在全国8个矿井规模使用。

而在气象领域，盘古大模型也提前十天成功预测了台风玛雅的移动路径，以及寒潮的来临。资料显示，盘古气象大模型是首个精度超过传统数值预报方法的AI模型，速度相比传统数值预报提速一万倍以上，可以在秒级时间内完成未来全球一个小时到7天的天气预报。7月6日，国际科技期刊《nature》刊发盘古气象大模型文章，审稿人称，“华为云盘古气象大模型让人们重新审视气象预报模型的未来，模型的开放将推动该领域的发展。

只是略显遗憾，或者说略有欠缺的是，本次开发者大会上华为演示的台风预测、矿山开采等大模型应用， 实际上都是在2022年年报中已有场景。

惊喜不多，华为给外界的印象仍是沉稳。

卡脖子的GPU，搞定了？

值得注意的是，华为还在会中提及了自身的AI算力底座。

大模型行业的一个现状是——算力决定能力，而在GPU芯片等硬件领域，华为被卡脖子已有多年。

张平安一句话点出了华为在AI赛道的硬件阻力—— 没有现成的装备，华为只能依赖自研AI根技术。

好在，华为很争气。

“我们在最底层，构建了以鲲鹏、昇腾为基础的，AI昇腾云算力底座。并在昇腾之上，提供了计算框架CANN…… 昇腾云的效能不仅不落后，反而领先于业界主流GPU。”

资料显示，华为通过针对技术、传输以及使用场景的优化，使盘古大模型训练效率对比业界主流GPU平均提升1.1倍。

并且，这些算力底座除了支持自家AI框架昇思MindSpore外，还支持Pytorch、Tensorflow等主流AI框架。针对昇腾云服务的商用，华为在贵安和乌兰察布两地上线了两个新的AI算力中心，用以承载客户的算力需求。

目前，美团已陆续将数十个AI应用迁移到昇腾云，大模型算法也将迁移到云端。按照华为的盘算，依托算力硬件和自研技术等优势，未来将会有更多B端客户，带着场景排队上门，即插即用。

只是，在半数大模型厂商已经卷向B端，谋求对接企业的当下， 盘古大模型在B端绝非没有对手。