来源:ZAKER科技
(资料图)
华为推出盘古Chat,或将成为国内最强类ChatGPT产品
6月4日消息,钛媒体消息,华为公司将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为"盘古Chat"。
而在此前,华为就已经宣布,将于HDC.Cloud 2023开发者大会将于7月7日开启,届时将公布华为最新的技术、产品等等。
据悉,盘古大模型于2020年11月在华为云内部立项成功。根据华为公布的一份论文数据显示,华为盘古PanGu-Σ大模型参数最多为1.085万亿,基于华为自研的 MindSpore 框架开发。整体来看,PanGu-Σ大模型在对话方面可能已接近GPT-3.5的水平。
据介绍,这是首个千亿参数中文预训练大模型,CV大模型则首次达到30亿参数。盘古CV大模型业界最大CV大模型、首次实现兼顾判别与生成能力、在ImageNet上小样本学习能力上的业界第一;盘古气象大模型提供秒级天气预报;紫东.太初是全球首个图、文、音三模态大模型。
对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
具体来看,与本次发布的Chat有关的盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配,这一模型在智能舆论以及智能营销方面都有不错的表现。
不过,本次发布的盘古Chat将主要面向To B/G政企端客户,普通用户可能前期难以直观体验到该产品的魅力。
而除了盘古Chat之外,按照以往惯例,华为还会在这次开发者大会上发布鸿蒙4.0,对各方面能力进一步提升,尤其是车机上也会是重大亮点。
标签: