最近,DeepSeek在X平台上引发了广泛关注,甚至登上了App Store下载榜的第一名。然而,伴随着其热度上升,一些质疑声也随之而来。比如,Scale AI的创始人Alexandr Wang在X上指出,DeepSeek实际使用的GPU数量远超论文中披露的数字,甚至可能涉及禁运的高端GPU。这一事件不仅引发了技术圈的讨论,也让人们开始思考:DeepSeek的成功是否会对NVIDIA的股票产生影响?如果有,这种影响会在何时显现?
DeepSeek的技术突破与NVIDIA的依赖
DeepSeek的V3和R1论文已经在GitHub上公开,详细披露了模型训练的诸多技术细节。例如:
FP8减少内存消耗:通过低精度计算优化内存使用。
多标记预测提高速度:加速模型训练和推理过程。
多头潜在注意力(MLA)节省内存:减少对显存的需求。
这些技术创新表明,DeepSeek在模型训练中并非单纯依赖GPU的算力,而是通过算法优化减少了对硬件资源的依赖。
众所周知,训练大规模模型需要庞大的GPU集群。这是因为模型参数数量庞大,必须依赖大量GPU的显存才能容纳。而要连接几万甚至十万张GPU,NVIDIA的NVLink和InfiniteBand技术几乎是唯一的选择。
DeepSeek的示范效应
DeepSeek的V3和R1论文的价值在于,它向业界展示了一种新的可能性:通过算法优化,可以在不依赖极端硬件堆砌的情况下实现高性能模型训练。这种“第一个吃螃蟹”的成功,无疑会吸引更多实验室和公司效仿。如果其他团队也能通过类似的方法达到或超越O1水平,那么对NVIDIA的需求可能会大幅减少。
DeepSeek-V3的预训练时间约为56天,这意味着到2月底,业界可能会有更多关于其训练效率的消息传出。如果事实证明,不再需要堆砌大量GPU就能达到O1水平,那么NVIDIA的股价可能会受到冲击。
对其他芯片制造商的利好
DeepSeek的技术突破不仅对NVIDIA构成潜在威胁,还为其他芯片制造商(如AMD、Groq和Cerebras)带来了希望。此前,这些厂商在NVLink和InfiniteBand的技术壁垒前举步维艰。然而,如果未来模型训练不再需要庞大的GPU集群,NVLink和InfiniteBand的重要性将大大降低。这将为AMD等厂商打开市场空间,使它们有机会在AI硬件领域分一杯羹。
投资策略的潜在机会
DeepSeek的成功不仅影响了技术圈,也可能为投资者带来机会。例如,幻方作为一家投资公司,如果在DeepSeek论文发布前采取以下策略:
做空NVIDIA:基于对NVIDIA需求可能减少的预期。
做多AMD:基于对其他芯片制造商市场机会增加的预期。
这种对冲策略可能会带来可观的收益,甚至足以覆盖一个GPU集群的成本。
总结
DeepSeek的技术突破为AI模型训练提供了一种新的范式,减少了对硬件资源的依赖。这种趋势如果持续下去,可能会对NVIDIA的股价产生负面影响。与此同时,其他芯片制造商则可能迎来新的发展机遇。
对于NVIDIA来说,未来的挑战在于如何应对这种技术变革。是继续依赖硬件优势,还是加大在算法优化和软件生态上的投入?
无论如何,DeepSeek的成功已经为AI硬件市场带来了新的变数,而NVIDIA的应对策略将决定其未来的市场地位。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。