清华评测更新!国产大模型强势出击,硅谷独霸已成历史

随着技术的日益成熟和应用领域的不断拓宽,我们满怀信心地期待,我国大模型行业将不断砥砺前行,在探索新的技术高峰的同时,享受到人工智能技术带来的便捷与美好。

4月18日晚间,Meta正式发布全新一代开源模型Llama3。本次发布的Llama3涵盖了两个版本,即Llama3-8B和Llama3-70B,它以其8B的模型规模,超越了去年70B模型的性能。Meta宣称Llama 3-8B和Llama 3-70B是目前同体量下,性能最好的开源模型。

在开源与闭源路线的长期“较量”中,Llama 3的问世,无疑为开源社区注入了一剂强心针,不仅是对开源模式潜力的有力证明,更激励更多的企业和开发者加入到这一开放、协作的生态系统中。

针对Llama 3的具体能力表现,前不久,国内人工智能权威机构清华大学基础模型研究中心正式发布《SuperBench大模型综合能力评测报告》,测试了国内外数款大模型在语义、代码、对齐、智能体和安全五个评测集中的表现

大模型的技术革命,不仅为人工智能赋予了“涌现”的能力,也为行业逐渐“涌现”出了各种机会,我国人工智能企业也在积累中迎来爆发,全球AI发展的态势也逐渐将人工智能摆在了关键竞争高地。智谱AI CEO张鹏曾多次表示,智谱要将“实现大模型生成AI的全链路自主可控”作为企业的核心竞争力。

在学术领域,中国大模型从业者在多项研究领域都走在行业前沿。例如在近期研究中,智谱团队证明了依靠更好的预训练质量,在更小模型上也能实现了更优的模型能力,颠覆了大模型行业“大力出奇迹”的思维定势。

清华评测更新!国产大模型强势出击,硅谷独霸已成历史

此外,智谱AI带来了提升大模型与人类偏好一致性的强化学习系统——ChatGLM-RLHF框架,该框架由三个主要部分组成:数据收集与处理、奖励模型训练和策略模型训练。首先,ChatGLM-RLHF通过从SFT模型生成的两个输出中选择一个更优的响应,完成数据的收集。再利用收集到的偏好数据来训练一个奖励模型,预测最符合用户偏好的回答。最后,使用奖励模型来指导模型的优化过程,通过最大化累积奖励来提升模型的表现。

清华评测更新!国产大模型强势出击,硅谷独霸已成历史

在三个步骤的协同工作下,大模型能够更加“通人性”,更清晰地理解人类的喜好与需求,才能够更好地为用户提供服务

在众多权威评测中的亮眼表现以及在研发领域的累累硕果,见证着中国大模型企业的创新能力得到了国际认可。国内丰富的应用场景,也让大模型产业落地走在世界前列,无论是智慧城市、智能制造,还是医疗健康、金融科技等领域都在探索利用大模型技术实现降本增效。

以智谱AI为例,在商业领域前已经有超过2000家生态合作伙伴,1000家规模化应用和200 家深度共创客户。智谱清言作为一款免费的AI工具,为大众用户提供了一个接触和体验生成式AI的窗口。

未来,随着技术的日益成熟和应用领域的不断拓宽,我们满怀信心地期待,我国大模型行业将不断砥砺前行,在探索新的技术高峰的同时,享受到人工智能技术带来的便捷与美好。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论