DeepSeek-V3：AI推理年代的降临与算力新趋势_网带链板

产品介绍

在AI职业革命性改动的浪潮中，深度求索DeepSeek-V3如一道闪电划破夜空，其预练习本钱的惊人低价引发了人们的热议。这个具有671B参数的大模型，仅用2048块GPU练习了两个月，费用仅557.6万美元，成为了评论焦点。但究竟是算力需求“打骨折”，仍是AI职业行将迎来推理年代？

DeepSeek-V3的优化技能让人拍案叫绝，选用多头潜在注意力（MLA）和DeepSeekMoE，使其在预练习阶段就能展现出优异的功能，乃至比肩或逾越其他顶尖模型。但是，业界对这一现象的观念并不共同。有观念以为，其极低的练习本钱意味着未来AI大模型关于算力的需求将明显下降。但是，细究其间，DeepSeek的计算口径仅计算了预练习阶段，组成数据的生成和清洗依旧需求强壮的算力来支撑。

LeptonAI的创始人贾扬清指出，单机GPU的显存才能现已难以包容大型模型，分布式推理在此布景下成为了新的必然选择。一起，中信证券的研报也标明，DeepSeek的新一代模型在提高推理速度的一起，也代表着AI大模型将更趋普惠化，推进算力的高增长。

在AI职业的革新背面，一些重量级人物如OpenAI的联合发起人Ilya Sutskever以为，AI预练习年代已然挨近结尾，未来的竞赛焦点将转移到推理计算上。快速的推理才能成为了开辟下一代AI使用的要害，从语音到视频，推理的提高无疑为智能使用带来了新的可能性。

不同职业分析师的猜测也标明，根据AI使用的推理算力需求正在上升，豆包大模型的兴起将推进对硬件算力、数据中心规划和通讯网络的多方面需求。比较传统的预练习，推理所需的算力开销将明显地添加。各大科技巨子如字节跳动和小米正在加大在AI算力上的出资，然后增强本身在这样的范畴的竞赛力。企业客户们也面临着在2025年前更大规划的AI出资，尤其是投入推理阶段。

跟着AI技能的不断演进，推理年代已悄然降临。让我们拭目而待这一切将为未来的AI使用和职业格式带来怎样的推翻之变。回来搜狐，检查更加多