清华评测更新！国产大模型强势出击，硅谷独霸已成历史-格隆汇

清华评测更新！国产大模型强势出击，硅谷独霸已成历史

04-28 11:00

3,788

随着技术的日益成熟和应用领域的不断拓宽，我们满怀信心地期待，我国大模型行业将不断砥砺前行，在探索新的技术高峰的同时，享受到人工智能技术带来的便捷与美好。

4月18日晚间，Meta正式发布全新一代开源模型Llama3。本次发布的Llama3涵盖了两个版本，即Llama3-8B和Llama3-70B，它以其8B的模型规模，超越了去年70B模型的性能。Meta宣称Llama 3-8B和Llama 3-70B是目前同体量下，性能最好的开源模型。

在开源与闭源路线的长期“较量”中，Llama 3的问世，无疑为开源社区注入了一剂强心针，不仅是对开源模式潜力的有力证明，更激励更多的企业和开发者加入到这一开放、协作的生态系统中。

针对Llama 3的具体能力表现，前不久，国内人工智能权威机构清华大学基础模型研究中心正式发布《SuperBench大模型综合能力评测报告》，测试了国内外数款大模型在语义、代码、对齐、智能体和安全五个评测集中的表现。

大模型的技术革命，不仅为人工智能赋予了“涌现”的能力，也为行业逐渐“涌现”出了各种机会，我国人工智能企业也在积累中迎来爆发，全球AI发展的态势也逐渐将人工智能摆在了关键竞争高地。智谱AI CEO张鹏曾多次表示，智谱要将“实现大模型生成AI的全链路自主可控”作为企业的核心竞争力。

在学术领域，中国大模型从业者在多项研究领域都走在行业前沿。例如在近期研究中，智谱团队证明了依靠更好的预训练质量，在更小模型上也能实现了更优的模型能力，颠覆了大模型行业“大力出奇迹”的思维定势。

清华评测更新！国产大模型强势出击，硅谷独霸已成历史

此外，智谱AI带来了提升大模型与人类偏好一致性的强化学习系统——ChatGLM-RLHF框架，该框架由三个主要部分组成：数据收集与处理、奖励模型训练和策略模型训练。首先，ChatGLM-RLHF通过从SFT模型生成的两个输出中选择一个更优的响应，完成数据的收集。再利用收集到的偏好数据来训练一个奖励模型，预测最符合用户偏好的回答。最后，使用奖励模型来指导模型的优化过程，通过最大化累积奖励来提升模型的表现。

清华评测更新！国产大模型强势出击，硅谷独霸已成历史

在三个步骤的协同工作下，大模型能够更加“通人性”，更清晰地理解人类的喜好与需求，才能够更好地为用户提供服务

在众多权威评测中的亮眼表现以及在研发领域的累累硕果，见证着中国大模型企业的创新能力得到了国际认可。国内丰富的应用场景，也让大模型产业落地走在世界前列，无论是智慧城市、智能制造，还是医疗健康、金融科技等领域都在探索利用大模型技术实现降本增效。

以智谱AI为例，在商业领域前已经有超过2000家生态合作伙伴，1000家规模化应用和200 家深度共创客户。智谱清言作为一款免费的AI工具，为大众用户提供了一个接触和体验生成式AI的窗口。

未来，随着技术的日益成熟和应用领域的不断拓宽，我们满怀信心地期待，我国大模型行业将不断砥砺前行，在探索新的技术高峰的同时，享受到人工智能技术带来的便捷与美好。

格隆汇声明：文中观点均来自原作者，不代表格隆汇观点及立场。特别提醒，投资决策需建立在独立思考之上，本文内容仅供参考，不作为实际操作建议，交易风险自担。

清华评测更新！国产大模型强势出击，硅谷独霸已成历史

相关阅读

评论