AI大模型博鳌破局:端云结合,驱动新质生产力

在“博鳌时刻”,vivo蓝心大模型等被明确定调为,是打造“新质生产力”的孕育沃土。

在“博鳌时刻”,vivo蓝心大模型等被明确定调为,是打造“新质生产力”的孕育沃土。

  作者|杨  铭

 编辑|刘珊珊

海阔风清,椰林葱郁中,风口上的AI大模型,站上博鳌亚洲论坛2024年年会多个主题分论坛的C位。

“未来是属于AI大模型的,千行百业将被重塑或被革新挑战。”众多嘉宾、参会人士在博鳌的激昂热情,再次明确一个趋势:尽管AI大模型发展并非坦途,却注定成为推动新一轮技术变革和产业变革的核心驱动力。

类似“惊呼”,时有耳闻。所不同的是,在“博鳌时刻”,AI大模型被明确为,是打造“新质生产力”孕育沃土的定调。

博鳌亚洲论坛年会期间,人民网正式发布《2024年中国AI大模型产业发展报告》,多维度探讨中国AI大模型发展现状和典型案例时,表达了AI大模型是加快发展新质生产力的关键要素,将对中国经济产生深远影响。

微信图片_20240401084527.jpg

不止人民网,工信部新闻发言人赵志国在谈及新质生产力时,同样明确表态,将加快推动大模型为代表的人工智能赋能制造业发展。

作为2024年以来大众最关注热点,“新质生产力”是以科技创新为主,摆脱传统增长路径、符合高质量发展要求的新型生产力。

从蒸汽机、电力到互联网,生产力迭代一直是人类文明发展内生引擎——其特点都是创新,关键在质优,本质是先进生产力的内生创新逻辑。

“历史不会简单重复,它会押着同样的韵脚。”对AI大模型而言,应如何去抓住新质生产力转型升级契机?如何加速推动AI大模型,走入千家万户甚至我们每个人?

01

进入下半场,AI大模型痛点犹在

截至2024年3月,国内大模型数量超243家,以通用大模型为主,发展到行业大模型、端侧、端云结合等多种模式并行的“百花齐放”阶段。

其中,通用AI大模型以百度文心一言、阿里通义千问、科大讯飞星火为代表;行业大模型涵盖容联云赤兔、用友YonGPT等;端侧AI大模型以蔚来NOMI GPT为代表。既是通用大模型,也是“端云结合”的AI大模型,以vivo蓝心大模型为代表。

落地应用看,语音识别、人脸识别、机器翻译、内容生成等应用领域以外,大模型逐步在制造、教育、医疗、金融、化工等垂直领域得到广泛应用。比如,AI大模型已在部分医院影像AI、智能导诊、辅助诊断等场景发挥作用,农村用户“足不出户”也可以完成诊断。

这就是在打造新质生产力。工信部赛迪研究院数据显示,2023年,我国生成式人工智能企业采用率达15%,市场规模约14.4万亿元。

这仅仅是AI大模型与千行百业结合,助力实体经济突围的开始。

微信图片_20240401084531.jpg

新质生产力代表着新技术、创造新价值、适应新产业、重塑新动能的新型高质量生产力。”博鳌“实体经济的突围”论坛上,vivo执行副总裁、首席运营官、vivo中央研究院院长胡柏山就认为,在实体经济如何突围商,制造行业没有选择,只有顺应新技术革命和产业变革趋势,跑出加速度,才能满足新时代下的用户需求。

但从大趋势而言,AI起起落落、沉沉浮浮数十年,中国AI大模型想真正成为孕育“新质生产力”的沃土,依然面临诸多艰巨挑战。

“当前大模型产业挑战包括算力分散不足、Transformer 结构是否为最优的疑问、领域数据稀缺、缺少现象级应用等问题。”vivo副总裁、vivo AI 全球研究院院长周围认为。

算力局限是首要挑战。算法是大模型训练速度与产出质量的基础,其能力取决于高性能、高成本的AI芯片。

比如,H100 GPU是英伟达专为AI大模型设计的芯片,售价高达每块3万美元。去年仅Meta、微软就分别购买了15万块 H100 GPU,花费高达45亿美元。

算力采购成本高昂外,目前中国企业还受进出口限制影响,获取的只是性能弱于H100的替代品英伟达A800,且依然供不应求情况——尽管国产自研AI芯片进展快速,性能仍与国际顶尖水平存在一定差距。

而东西部算力供需失衡、跨数据中心算力调度难、算力基础设施能耗大、企业利用算力成本高等等,都是国内企业算力技术痛点。

高质量数据匮乏,是不可忽视的第二大挑战。数据对大模型训练重要性不言而喻,当前国内AI大模型数据主要来自电商、社交、搜索等渠道,高质量数据成为稀缺品。

中国工程院院士高文曾在演讲中提到,全球大模型产业普遍面临训练数据瓶颈,其中中文数据尤为匮乏,全球通用50亿大模型数据训练集里,中文语料仅占1.3%。这一痛点,在要求更高专业垂类数据领域更加凸显。

大模型架构的局限性,也亟须破局。当前主流大模型无一例外都建立在Transformer架构堆叠的基础上——该架构源自谷歌大脑团队2017年发表的《Attention is all you need》论文,推动整个AI领域重大突破。

微信图片_20240401084534.png

最大问题是,这种架构对计算资源消耗特别大,存储设备要求非常高、应用群体也有局限性。

比如,面向C端大模型的应用产品都是通用大模型,专业性不足,存在成本高昂、安全性问题;垂直行业大模型,针对C端应用又不足。更严重问题是,架构一样下,很多大模型能改动的是训练方法、数据配比,出现大模型同质化趋势。

相比国外,国内AI大模型至今没有出现爆款级应用,是产业化落地一大难题。原因在于,因为算力稀缺,缺乏满足客户需求的个性化应用——很难将大模型像微信、抖音那样,包装成大范围使用的C端产品。

加上AI大模型诞生以来,就伴随的道德、安全风险争议,如何让每位用户可以充分享受大模型真正便利,推动各行各业数字化进程落地,是当下AI大模型的共同考验。

02

破局有道,“端云结合”为核心

理想照进现实。从根本上转变AI大模型的技术路线——“把大模型和终端结合”,成为业界心照不宣的破局共识。

最近半年来,从高通、英伟达、AMD、英特尔等上游芯片厂商,微软、Meta、亚马逊等科技巨头,再到vivo、华为、OPPO等手机头部厂商,联想等PC厂商,甚至是SOTA这样的闭源大模型,都在集体向终端挺进,开辟AI大模型新战场。

集体抉择背后是,相比单一通用、专用大模型的局限性,手机、PC、可穿戴等智能设备,才是AI大模型普惠终点:一方面,在底层就可以和AI芯片适配;另一方面,终端产品形态个人化、小型化,就意味着普及和便携,更容易走向大众。

微信图片_20240401084538.jpg

如同当年瓦特改良的“蒸汽机”一样,智能手机无疑是行业和场景结合最深,连接万物最好的“AI入口”。2023年7月以来,国内主要手机厂商纷纷将生成式AI带入终端——包括苹果,最新消息称将和百度AI合作。

事实上,受体积、性能、耗电等诸多限制,相比其他应用领域,手机是大模型最难落地场景之一。

比如,直接在端侧(手机)轻量化、本地部署大模型——尽管这是当前部分主流手机厂商所选择技术路线,就失去云端联网大规模计算优势,处理速度不及预期,且终端耗电加快。如果直接将大模型上传到云端,又存在失去个性化定制、隐私安全难以保障、成本高昂等难题。

“vivo有3亿中国用户,如果每天用10次,一天运算成本大概是3000万元,一年需要花费约90亿-100亿元。”vivo副总裁周围就曾如此简单计算。

因此,基于对AI大模型不同理解,各家手机厂商目前形成了端侧为主,以及端云结合的两种部署方案。

“极点商业”综合业内诸多人士观察,目前vivo、华为、OPPO选择的“端云结合”路线,被普遍视为推动大模型走向大众的主流思路。

所谓“端云结合”,是在架构设计上云、端协同,即在云端部署百亿、千亿级别的通用大模型训练模型,在手机端侧部署十亿级别的大模型,推出大模型矩阵。简单来说,它既有通用大模型的C端普惠功能,又在矩阵大模型下,拥有个性化、定制化能力。

其好处是,复杂内容和任务,可以交给云端大规模算力;部分任务也可转移给终端,大幅降低算力成本,个性化服务,端侧断网情况下稳定运行,并有效保护用户隐私。

其中最重要的,就是矩阵化布局。人民网发布的《报告》中,就以vivo自研“蓝心大模型”(BlueLM)为例,观察这种“端侧化大模型+大模型矩阵化”另辟蹊径的方式,如何成功破解行业痛点。

vivo“蓝心大模型”中,其打造10亿、70亿、700亿、1300亿、1750亿模型参数5个矩阵,涵盖从亿级到千亿级不同规模的模型,使其适配不同应用需求和算力条件。

微信图片_20240401084541.png

“这源自对大模型普及痛点的洞察和预判。”周围曾如此解释,一是矩阵模式可解决多模态大模型不同研发阶段需求;二是让用户在云上使用大模型的同时,在端侧本地化运行关键数据,满足隐私及安全需求;三是有效平衡云端算力成本过高问题。

其中,10亿量级模型(1B)和70亿(7B)由本地端侧算力支撑。1B是主要面向端侧场景打造的专业文本大模型,使用不需要成本。7B是面向手机打造的端云两用模型,语言理解、文本创作能力优秀。同时,两者在保证数据安全同时,展现出词快、内存低、全天候、真安全的强大端侧运行优势。

更复杂逻辑推理能力的应用,仍然需要运行在云端,是vivo算法优势的体现。比如700亿模型综合能力,在C-Eval、CMMLU、SuperCLUE等榜单中均处于中文大模型第一梯队。另外1300亿、1750亿模型也在不断迭代中,在更复杂场景中带来更专业的智能体验。

微信图片_20240401084545.jpg

当端侧化+矩阵化大模型持续成长,vivo就得以在刚刚发布的vivo X Fold3系列上,实现“端侧7B”+“云侧70B”的AI蓝心大模型超大组合部署,作为当下“最轻、最强”的折叠旗舰,亮相2024年博鳌亚洲论坛,成功中国科技“新质生产力”的代表。

03

既要又要,打造生产力的“超级智慧体”

在《报告》看来,类似vivo将大模型装进手机的“端云结合”,有望打开对AI大模型更广泛的应用想象,成为发展新质生产力的关键驱动力。

从vivo官方数据来看,已有很多用户体验到AI大模型带来的便利:蓝心大模型目前覆盖超过2000万用户,实现2761万次高质量问答、生成1757万张画,写了649万份报告,“AI 修图”功能消除了85万个路人。

不同参数量级的大模型矩阵下,这背后既有用户在本地化端侧个性化AI修图、AI写报告,也有用户云端在线回答,AI作画。

一切技术、产品规划出发点都是用户需求。从用户角度来看,当前对手机AI大模型的期望,是为用户提供个性定制、智能交互、专属陪伴、安全可信等产品体验,打造个性化专属私人助理。

这正是所有AI手机厂商竞争核心所在。而在用户体验方面,“端云结合”也体现出自己的独特优势。

微信图片_20240401084548.png

比如,搭载蓝心大模型的vivo X Fold 3,支持超过700种手机相关功能,提供超能问答、超能创作、超能搜索、超能管理、超能交互等五大AI超能服务。

值得一提的是,实现上述超能服务,是在vivo“蓝科技”品牌生态中,依托蓝晶芯片技术栈、蓝海续航系统、蓝心大模型、蓝河操作系统等多项创新技术,汇聚加持而来。

例如,全局智能辅助应用“蓝心小V”、自然语言对话机器人“蓝心千询”等,和Origin OS 4的不断迭代融合后,用户可以在vivo手机上万张图片管理中,直接向“蓝心千询”说出照片内容,“蓝心小V”就可主动识别有对应内容的照片。

“蓝科技”整体技术储备和加持下,“端云结合”下的蓝心大模型,带来个性化体验时,还围绕生产力进行更多挖掘。在vivo X Fold 3中,一句话查找影像素材、一句话视频剪辑、小V帮记和AI笔记创作等功能,让AI蓝心大模型成为剪辑视频、记录会议、实时翻译、整理摘要和笔记创作等多场景发挥个性化赋能作用。

值得一提的还有,AI大模型给vivo X Fold 3带来的交互入口变化,眼动捕捉和隔空手势功能交互模式变化——听懂我们的需求,感知我们的意图后,给出正确反馈,及时帮助决策。

这意味着,vivo X Fold 3这样的AI大模型手机,早不是简单的私人助理,而是深入赋能出行、学习、生活、工作等众多场景,更懂你,更个性化,更互联的“超级智慧体”。

实际上,“端云结合”AI大模型给手机带来的价值,并不局限在应用闭环内。AI赋能下,持续打磨的vivo办公套件,能够实现行业唯一支持手机、平板、网页、Windows、Mac五端协同,满足商务办公全场景需求。

微信图片_20240401084552.png

这可以理解为,通过vivo办公套件或手机,可以协同苹果Mac笔记本、iPhone手机,能借助AI能力执行、管理。同时,众多小型开发者可调用vivo的大模型能力,提升开发效率,在新应用领域找到机会。

这正是业内人士此前所提及的,“如果手机厂商AI助手,能理解用户需求,控制和调用别的应用,用户体验会变外,手机厂商、第三方应用关系也会发生彻底的变化。”

“智慧体”+“协同开源”,让用户场景不断迭代,或许是AI大模型走向大众普适化,加速跑出“新质生产力”的主要思路。

但是,AI大模型价值,很多时候并不完全局限于商业生产,很多时候也有着“人情味”,比如vivo专为特定人群打造的vivo看见和vivo读谱的功能,人文关怀得以更智慧。

04

跑出加速度,大模型已成新质生产力

最近几年,手机行业陷入持续低迷。当AI大模型浪潮汹涌而来,所有人都在期盼,AI大模型+智能手机的结合,能在人与设备结合更紧密间,成为推动新质生产力的重要引擎。

因此,当vivo通过“蓝科技”品牌赋能,打造出vivo X Fold3这样革命性、开创性折叠产品,就被业界视为拥抱“新质生产力”的典型范本。

微信图片_20240401084555.png

人民网就在《报告》中评价,vivo通过对“端云结合”的大模型模式有效探索,将带动商业模式创新,牵引产业升级,为手机未来发展指明方向。

IDC也预计,2024年全球新一代AI手机出货量将达到1.7亿部,约占智能手机整体出货量的15%。在中国市场,新一代AI手机所占份额将在2024年后迅速攀升,2027年达到1.5亿台,市场份额超过50%。

无论如何,AI大模型只是技术,技术不是拼参数,最大考验依然是,技术如何真正服务用户,让应用更好落地。这需要行业所有企业,都要真正“以用户为导向”核心,懂得和理解每一位用户。

这并不容易。以vivo为例,作为较早布局人工智能的先行者,在2017年开始筹备人工智能全球研究院,并在2018年正式组建,是首批设立专攻人工智能方向研究院的中国手机公司之一。截至目前,vivo每年在人工智能上的投入保守估计在20亿到30亿元。

如今,在人工智能的四个要素——数据、人力、算法、算力方面,vivo均已做到了领先。但更重要的,是在ECR管理方法下,围绕用户痛点,展开系统性创新和持续创新,坚持“用户为导向”,在AI、影像、芯片、续航、重量等领域都做到极致,始终做最正确的事,才能稳定穿越周期,满足用户不同场景下实际需求,也才能让新生产力真正普惠到每个用户。

在胡柏山看来,通过科技创新温暖“万家灯火”,是vivo这样的科技企业需要具备的使命感。“不仅关注社会福祉和人类发展,也积极推动产业跃升和协同发展。”

根据vivo规划,将在拥抱“新质生产力”中跑出加速度,预计在明年30周年之际发布MR眼镜,同时对人形机器人赛道保持高度关注。

微信图片_20240401084558.jpg

类似vivo对新质生产力的拥抱,也为实体经济突围提供了新思路。从趋势来看,C端用户正成为端侧主要客群,垂直行业将是大模型主战场。“端云结合”趋势下,算力成本大幅降低,无人巡检、智能家居、工业物联网、医疗健康、智能汽车等领域,都有望通过拥抱“新质生产力”,创造新的价值、适应新的产业、重塑新的动能。

最终,AI大模型落地应用的爆发,又会助推实体经济和产业生态体系不断优化调整。“推动中国经济走出一条质量更优、动力更充沛的增长路径。”

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论