当前位置: 主页 > 资讯 > 详情
国内AI大模型群雄逐鹿,大厂竞相出手,得算力者抢占先机 焦点报道

来源:大洋网 2023-07-04 10:14:41

7月2日,“2023全球数字经济大会人工智能高峰论坛”在京举办,众多重量级嘉宾围绕人工智能大模型技术发展的机遇和挑战,以及企业的探索和实践等,进行了深入交流,再度掀起行业热潮。


(相关资料图)

大模型发展如火如荼

自2022 年底ChatGPT这一语言AI模型横空出世,引发了普罗大众对AI应用的热情的同时,也引燃了AI大模型的战火。3月15日,OpenAI发布GPT-4,将这一战火再度升级。

相比于传统的人工智能模型,大语言模型在很多任务上已经达到甚至超出了人类的水平,使人们看到了通用人工智能的曙光。从科技巨头到互联网大厂,从创业届到学术届,AI大模型正在成为各方抢滩市场的关键。

据不完全统计,截至目前,参数在 10 亿规模以上的大模型全国已发布了近80个。在本次人工智能高峰论坛期间,中国电信公布TeleChat大模型;金堤科技联合华为云,运用大模型能力推出"天眼查"可信商业助理;企查查发布全球首个商查大模型命名“知彼阿尔法”。不久前,360发布360智脑大模型;讯飞星火认知大模型V1.5发布;金山办公旗下全新产品WPS365、WPSAI也悉数亮相。

不同于二三月份的纯粹大模型发布,新一轮发布潮是基于大模型的应用产品开始大规模升级上线为走进千家万户准备。在360集团创始人周鸿祎看来,大模型必须具有通用性,才能赋能千行百业。大模型未来是多元化的,发展趋势是做小做专,真正的机会在企业市场。

随着新一轮AI大模型产品升级上线与产品应用发布,大模型AI监管政策整体呈现积极推进的态势:一方面政府发布《生成式人工智能服务管理方法》、《纸鸢开放人工智能模型许可证(征求意见稿)》等政策统筹大模型AI产业链各环节的权责关系,为大模型AI应用落地打下法律基础;另一方面各地持续跟进大模型AI促进相关政策,为AI应用落地提供资源扶持。

新一轮军备竞赛

衔远科技创始人、清华大学惠妍讲席教授周伯文认为,此次AI浪潮的不同之处在于,AI从“与人竞争”变为“协同交互”,将带来更大的市场价值。

发人深省的是,技术总是在短期内被高估,但是在长期又被低估。人工智能大模型技术的流行和产业的发展需要大量玩家的参与和资金的投入,在激烈的竞争和热点退潮之后,谁能笑到最后?

华泰证券TMT研究组负责人、科技与电子首席分析师黄乐平认为,在中美竞争的情况下,大模型能不能成功,需要关注是否有数据,是否有算法,是否有算力,这三个是必备的条件,现阶段能满足这三个条件的是一些互联网大厂和一些政府的机构。

联储证券研究认为,最终能留下的市场赢家通常只有一两家。而这一两家企业一定是可以持续保证技术先进性,解决市场和下游需求痛点,打造市场热门产品的公司,最终完整的塑造出属于自己产品的生态链场景。这需要真金白银的投入以及战略路线的清晰规划布局,否则人工智能大模型与AIGC也将像诸多科技概念一样,昙花一现。

以GPT模型为例,其快速发展的核心原因之一正是微软作为投资方给予了大模型在开发资金与算力芯片方面的支持,从而打通了堵点。在我国AI领域蓬勃发展的今天,市场上参与者甚众,其中不乏诸多资金实力雄厚的头部玩家。因此核心堵点仍在于较晚的起步时间与难以获取的核心算力。可以预见的是,在本轮人工智能发展的过程中,以算力为代表的产业链上下游将成为率先受益的主要领域。

科技巨头抢跑

综上看来,大模型还是大厂的生意,离不开综合算力资源、算法人才、数据积累及产品先发几大核心要素。事实也正是如此。目前,以BAT为代表的科技巨头处于领先态势,正在不断夯实通用大模型,打造产业模型,助力AI大模型产业化。

从大模型参数量看,阿里通义千问大模型参数在10万亿级以上、腾讯混元大模型和华为盘古大模型参数量均在万亿级以上、百度文心一言大模型参数量在2千亿级以上、京东言犀大模型的参数量为千亿级;垂直行业科技企业已经上线的参数量普遍在千亿级以上;科研院校大模型的参数量则在千亿级及以下。

从大模型的布局体系来看,科技大厂在算力层、平台层、模型层、应用层进行了四位一体的全面布局。百度、阿里、华为三家均从芯片到应用进行自主研发的全面布局,如百度的“昆仑芯+飞桨平台+文心大模型+行业应用”、阿里的“含光800芯片+M6-OFA底座+通义大模型+行业应用”、华为的“昇腾芯片+MindSpore 框架+盘古大模型+行业应用”。

从产业应用方向看,百度文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系,打造大模型总量约40个,产业应用也较为广泛,例如电力、燃气、金融、航天等。

腾讯产业化应用方向则主要是腾讯自身生态的降本增效,其中广告类应用表现出色。

阿里更重技术,例如M6大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力压缩到极致;另外其底层技术优势还有利于构建AI的统一底层。

华为的优势则在于其训练出业界首个2000 亿参数以中文为核心的预训练生成语言模型。目前发布了盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项较为重磅的行业大模型。

联储证券认为,本次发展过程将形成头部厂商提供大模型,中小微企业聚焦商用落地的竞争格局。头部厂商以其在资金、人才以及技术等方面的资源优势将率先完成大模型的搭建。下游中小型企业将更加聚焦大模型的商用落地,并且在现实复杂、琐碎的应用场景之中实现错位竞争,在子领域实现垄断。

相关资讯