名家专栏

DeepSeek让AI行业失去价值?/奕帆丰顺

在中国初创公司DeepSeek引起关于美国在人工智能(AI)领域竞争力和领导地位的担忧后,美国科技公司股价出现显著下跌。

在去年十二月底,DeepSeek通过推出一个免费、开源的大型语言模型(DeepSeek V3)引起了市场轰动。据报道,该模型仅在两个月内开发完成,成本不到600万美元(约2640万令吉)。

最新的开源DeepSeek R1在强化学习阶段之前,使用了多阶段训练和冷启动数据,在全球技术领域引起了轩然大波。

成本更低

简单来说,DeepSeek R1声称能够以更低的训练成本击败其他聊天机器人,比如OpenAI的ChatGPT或Meta的LLAMA。这一进展引发关于大型科技公司是否在人工智能模型和数据中心上投入巨资的激烈讨论。

DeepSeek展示了通过算法和架构改进,可以使用较旧款的GPU以明显更低的成本实现类似的结果。

这对人工智能资本支出快速扩张的合理性构成了挑战,甚至可能比近期围绕“规模定律”(Scaling Law)瓶颈相关争论更为严峻。

规模定律瓶颈争议主要指出,在预训练阶段增加更多GPU的边际回报正在减少,但这在短期内难以验证,且很容易被反驳。

例如,规模定律在微调(fine-tuning)阶段仍然适用,Meta和Grok等公司目前正在使用10万个GPU预训练大型模型。

不过,在资源受限下,DeepSeek此次确实取得成果。

鉴于之前的规模定律瓶颈争议,加上关于ASIC(专用集成电路)与通用GPU(图形处理单元)的讨论持续了一个多月(从11月14日至12月20日),DeepSeek所引发的质疑不会在短短几天内就消散。

话虽如此,投资者正在关注大型科技公司的财报,这些公司如何克服这一问题将至关重要。尽管GPU需求可能会有所放缓(相较于过去一年飙升的增长),但我们认为未来增长潜力仍然巨大,投资者应继续看好该领域。

效率提升刺激需求

我们认为此次市场回调,主要是由近期反弹后的避险行为所引发,尤其如今正值大型科技股的财报季,同时还受到美联储最新的货币政策路径影响。

投资者的关注点集中在这点——如果成本/模型计算效率显著提高,市场对人工智能资本支出和计算需求的预期是否会出现短期错配。

我们认为开源模型可能会通过提高推理效率,最终推动AI在边缘计算等领域的更广泛应用,进而颠覆行业格局。

随着开发者能够更轻松地获取强大的AI模型,而无需支付昂贵的许可费用,我们预计这可能将加速人工智能在更广泛的设备和应用中的整合。

这可能会为医疗、制造业和智慧城市等行业的人工智能驱动解决方案创造新的机会,尤其是在本地设备实时处理需求日益增长的情况下。然而,我们并不认为DeepSeek的推出会彻底改变行业并降低高端GPU的需求。

DeepSeek训练的推理成本不包括数据抓取和训练成本,因此无法与OpenAI从零开始、耗资数亿美元训练模型的成本进行直接对比。

随着DeepSeek推出,行业参与者再次站在同一起跑线上,预计将有更多的训练和推理过程,以抢占先发市场份额,进而支撑GPU需求。

大型科企收益更多

DeepSeek已经展示了可以更高效、更低成本地训练模型,我们相信大型科技公司将通过整合DeepSeek的创新技术,如专家混合(Mixture-of-Experts)架构来优化自身模型。

据报道,Meta已组建了工程师团队,以评估如何重新配置公司的人工智能Llama,从而能够采用DeepSeek性价比更高的训练和推理方法。

通过采用这一成本效益高的技术,大型科技公司也将能够从其人工智能资本支出中获得更多收益,从而转化为更高的利润率和投资回报率。

此外,计算成本的降低并不意味着大型科技公司会减少在人工智能资本支出上的投入。相反,它们可能会利用对高端芯片的掌握,并将其与DeepSeek的技术相结合,从而扩大美国与中国AI科技之间的差距。

DeepSeek的崛起,可能会迫使像OpenAI和Alphabet等公司降低其大模型订阅的价格。然而,价格降低也可能带来更高的收入,因为较低价格会被消费者和企业更广泛的采用所抵消。

全新开始并非终结

在日本低油耗汽车占据北美市场的一半份额后,北美家庭的原油消费量不降反升。同样,当小米将智能手机价格由5000元降至1999元时,供应链公司的利润也显著增长。DeepSeek可以理解为一种“民主化”——更多的参与者加入了这个领域。

在互联网泡沫时代,市场对“互联网”产品的兴趣和使用量急剧上升。这一新兴数码领域的热潮不仅没有因高估值担忧而让人却步,反而激发了更多个人和企业进入互联网行业。

互联网科技的广泛采用和探索创造了一个创新蓬勃发展的生态系统,后续出现的搜索引擎、电子商务和社交网络等,塑造了我们今天所熟知的现代互联网。

这是一种自我强化的循环:繁荣吸引了人才、投资和雄心,推动了领域的加速发展,即使在泡沫破裂后仍未止步。就像互联网的“民主化”一样,进入门槛被降低,参与者增多,推动了各个行业的发展,甚至超越了之前的高峰。

英伟达霸主地位稳固

GPU市场正在经历结构调整,但英伟达的主导地位仍然稳固。DeepSeek的科技创新可能会减少部分训练对GPU的需求,但持续的人工智能军备竞赛和对通用人工智能(AGI)的追求仍然高度依赖于超级计算集群。

英伟达在高性能计算方面表现出色,其强大的CUDA生态系统仍是其核心优势。与此同时,DeepSeek的开源策略可能会吸引开发者,但英伟达可以通过战略合作来维持其影响力,例如支持混合精度训练框架等。

投资者不应对最新动态过度解读。我们鼓励投资者将此视为在颠覆性浪潮中寻找投资机遇的良好时机。

视频推荐 :

 

 
 

 

反应

 

国际

黄仁勋2日中国行程 中媒:未与DeepSeek梁文锋会面

(北京20日讯)半导体公司英伟达(NVIDIA)总执行长黄仁勋结束了为期2天的中国行程。据中媒引述消息报道,黄仁勋此行在北京与上海同中国官员会晤,但并未与人工智能(AI)新创公司深度求索(DeepSeek)创办人梁文锋见面。

黄仁勋此次访中,正值美国政府加强限制英伟达AI芯片对中出口之际,引发外界关注,包括深度求索在内的中国AI企业,未来能否取得符合规定的芯片备受瞩目。

中国《第一财经》19日引述知情人士透露,黄仁勋行程中并未如外界传闻与梁文锋会面。不过,从与官员交流的情况来看,尽管面对复杂局势,英伟达仍展现持续支持中国AI产业、坚守服务中国市场的态度。

据悉,这次中国国务院副总理何立峰和上海市市长龚正,分别在北京与上海接待了黄仁勋。

英国《金融时报》早前援引消息人士指出,黄仁勋在北京亦与英伟达在地客户,包括梁文锋,就开发符合中美规范的新一代芯片进行交流,但此一说法尚未获得官方证实。

美国因应国家安全,自2022年禁止英伟达最先进AI芯片输出至中国,防止技术流用至军事领域。英伟达随后推出降规版“H20”芯片,目前为唯一符合规范可销售中国的产品。

但近期美中贸易紧张升温,美国进一步要求,未来英伟达出口H20芯片需申请许可证,且无设定期限。市场预测,此举恐将导致英伟达本季营收损失高达55亿美元(约243亿令吉)。

反应
 
 

相关新闻

亚亦君令补选
南洋地产