首页 > 快讯 > 快讯详情
幻方量化重磅发布DeepSeek-V3:性能媲美GPT-4,训练成本创新低
格隆汇12月29日丨幻方量化12月26日晚发布全新一代大模型DeepSeek-V3,展现出惊人的技术突破。这款采用MoE(混合专家)架构的模型不仅在性能上媲美顶级闭源模型,其低成本高效率的特点更是引发业界关注。根据开源论文披露,按每GPU小时2美元计算,模型全部训练成本仅为557.6万美元。这一突破性成果得益于算法、框架和硬件的协同优化。OpenAI联合创始人Karpathy对此给予高度评价,指出DeepSeek-V3仅用280万GPU小时就达到了超越Llama3的性能,计算效率提升了约11倍。