申请认证
格隆汇公众号矩阵
格隆汇App
下载格隆汇APP
诊股宝App
下载诊股宝App
汇路演App
下载汇路演APP
极调研
加入我们
首页
社区
快讯
事件
深度
主题
专栏
行情
会员
数据
财富圈
文章
更多相关文章
快讯
更多相关快讯
查看全部股票/文章/快讯/事件/用户/财富圈搜索结果
热门股票
搜索历史
清空历史
登录 / 注册
温馨提示
跟大家分享一下你的想法吧
首页
>
快讯
>
快讯详情
李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成
2025-02-06
格隆汇2月6日丨据科创板日报,今日有消息称李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。
调查后发现,s1模型的训练并非从零开始,其基座模型为阿里通义千问(Qwen)模型。s1用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对千问模型进行微调而成。
事件播报
查看更多
巴克莱上调康宁目标价至180美元
大行评级
6分钟前
RBC Capital下调Lyft目标价至18美元
大行评级
11分钟前
大行评级丨小摩:医保目录调整加速创新药商业化,首选信达生物、药明康德等
大行评级
15分钟前