科大讯飞正式发布星火V3.5,多模态理解达到GPT-4V 91%

“讯飞星火有信心在上半年赶上GPT-4目前最好水平。”作者:杨雪编辑:tuya1月30日,科大讯飞举行星火认知大模型V3.5升级发布会,科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。据介绍,星火V3

“讯飞星火有信心在上半年赶上GPT-4目前最好水平。”

作者:杨雪

编辑:tuya

1月30日,科大讯飞举行星火认知大模型V3.5升级发布会,科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。

据介绍,星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。

讯飞星火自去年5月首发以来,不断迭代升级其大模型能力。截至目前,基于讯飞听见、讯飞星火APP、讯飞输入法等应用已累计赋能亿万用户。在星火大模型的帮助下,越来越多的用户拥有专业AI助手。据统计,在讯飞开放平台上,大模型总开发者已超35万,其中企业开发者超22万。

同时,科大讯飞正式发布了星火语音大模型。“科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍。25年了,我们的目标和梦想一天都没有变。”刘庆峰指出,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”

星火语音大模型效果国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,而在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。

搭载语音大模型的讯飞翻译机,即将上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。多语种自动识别让国际沟通更加便捷,增强式翻译技术让翻译机化身AI翻译助手。据介绍,此次讯飞翻译机多语自动识别升级,将支持35种语言,为跨语言沟通提质增效;增强式翻译提供中英双语服务,让跨语言交流更加省心出彩。

在汽车、客服、家庭、陪伴机器人等场景中,星火语音大模型还有更多用武之地,带来人机交互领域的变革。举例来说,星火语音大模型将进一步优化智能驾舱、智能座舱、智能导航等汽车交互体验,陪伴机器人、导购机器人、辅诊机器人、智能家居、穿戴式设备等产业也将随着语音大模型的赋能进一步被引爆。

展望2024年讯飞星火大模型的发展,刘庆峰指出:“一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。”我们要清醒理智看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。

刘庆峰强调,“今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等需要整个创新的生态,但我们一定要有勇气、有期许走在最前列。”

共享源代码、开发出更好的软件,是广大开发者、高校、企业自主研发热衷于开源的关键原因,也是共建第一开发者生态的重要途径。会上,首个基于全国产化算力平台”飞星一号”的开源大模型──星火开源-13B正式发布。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关股票

相关阅读

评论