首页 > 快讯 > 快讯详情

幻方量化重磅发布DeepSeek-V3：性能媲美GPT-4，训练成本创新低

2024-12-29

格隆汇12月29日丨幻方量化12月26日晚发布全新一代大模型DeepSeek-V3，展现出惊人的技术突破。这款采用MoE（混合专家）架构的模型不仅在性能上媲美顶级闭源模型，其低成本高效率的特点更是引发业界关注。根据开源论文披露，按每GPU小时2美元计算，模型全部训练成本仅为557.6万美元。这一突破性成果得益于算法、框架和硬件的协同优化。OpenAI联合创始人Karpathy对此给予高度评价，指出DeepSeek-V3仅用280万GPU小时就达到了超越Llama3的性能，计算效率提升了约11倍。

事件播报

海利得(002206.SZ)：已有LCP-FCCL小批量生产线，正处于工艺测试阶段

公司信息刚刚

联泓新科(003022.SZ)：参股的绵阳达高特所生产的BCB单体可应用于PCB、半导体先进封装等领域

公司信息刚刚

瑞银上调哈门那目标价至320美元

大行评级 2分钟前

幻方量化重磅发布DeepSeek-V3：性能媲美GPT-4，训练成本创新低

海利得(002206.SZ)：已有LCP-FCCL小批量生产线，正处于工艺测试阶段

联泓新科(003022.SZ)：参股的绵阳达高特所生产的BCB单体可应用于PCB、半导体先进封装等领域

瑞银上调哈门那目标价至320美元