名家专栏

DeepSeek让AI行业失去价值?/奕帆丰顺

在中国初创公司DeepSeek引起关于美国在人工智能(AI)领域竞争力和领导地位的担忧后,美国科技公司股价出现显著下跌。

在去年十二月底,DeepSeek通过推出一个免费、开源的大型语言模型(DeepSeek V3)引起了市场轰动。据报道,该模型仅在两个月内开发完成,成本不到600万美元(约2640万令吉)。

最新的开源DeepSeek R1在强化学习阶段之前,使用了多阶段训练和冷启动数据,在全球技术领域引起了轩然大波。

成本更低

简单来说,DeepSeek R1声称能够以更低的训练成本击败其他聊天机器人,比如OpenAI的ChatGPT或Meta的LLAMA。这一进展引发关于大型科技公司是否在人工智能模型和数据中心上投入巨资的激烈讨论。

DeepSeek展示了通过算法和架构改进,可以使用较旧款的GPU以明显更低的成本实现类似的结果。

这对人工智能资本支出快速扩张的合理性构成了挑战,甚至可能比近期围绕“规模定律”(Scaling Law)瓶颈相关争论更为严峻。

规模定律瓶颈争议主要指出,在预训练阶段增加更多GPU的边际回报正在减少,但这在短期内难以验证,且很容易被反驳。

例如,规模定律在微调(fine-tuning)阶段仍然适用,Meta和Grok等公司目前正在使用10万个GPU预训练大型模型。

不过,在资源受限下,DeepSeek此次确实取得成果。

鉴于之前的规模定律瓶颈争议,加上关于ASIC(专用集成电路)与通用GPU(图形处理单元)的讨论持续了一个多月(从11月14日至12月20日),DeepSeek所引发的质疑不会在短短几天内就消散。

话虽如此,投资者正在关注大型科技公司的财报,这些公司如何克服这一问题将至关重要。尽管GPU需求可能会有所放缓(相较于过去一年飙升的增长),但我们认为未来增长潜力仍然巨大,投资者应继续看好该领域。

效率提升刺激需求

我们认为此次市场回调,主要是由近期反弹后的避险行为所引发,尤其如今正值大型科技股的财报季,同时还受到美联储最新的货币政策路径影响。

投资者的关注点集中在这点——如果成本/模型计算效率显著提高,市场对人工智能资本支出和计算需求的预期是否会出现短期错配。

我们认为开源模型可能会通过提高推理效率,最终推动AI在边缘计算等领域的更广泛应用,进而颠覆行业格局。

随着开发者能够更轻松地获取强大的AI模型,而无需支付昂贵的许可费用,我们预计这可能将加速人工智能在更广泛的设备和应用中的整合。

这可能会为医疗、制造业和智慧城市等行业的人工智能驱动解决方案创造新的机会,尤其是在本地设备实时处理需求日益增长的情况下。然而,我们并不认为DeepSeek的推出会彻底改变行业并降低高端GPU的需求。

DeepSeek训练的推理成本不包括数据抓取和训练成本,因此无法与OpenAI从零开始、耗资数亿美元训练模型的成本进行直接对比。

随着DeepSeek推出,行业参与者再次站在同一起跑线上,预计将有更多的训练和推理过程,以抢占先发市场份额,进而支撑GPU需求。

大型科企收益更多

DeepSeek已经展示了可以更高效、更低成本地训练模型,我们相信大型科技公司将通过整合DeepSeek的创新技术,如专家混合(Mixture-of-Experts)架构来优化自身模型。

据报道,Meta已组建了工程师团队,以评估如何重新配置公司的人工智能Llama,从而能够采用DeepSeek性价比更高的训练和推理方法。

通过采用这一成本效益高的技术,大型科技公司也将能够从其人工智能资本支出中获得更多收益,从而转化为更高的利润率和投资回报率。

此外,计算成本的降低并不意味着大型科技公司会减少在人工智能资本支出上的投入。相反,它们可能会利用对高端芯片的掌握,并将其与DeepSeek的技术相结合,从而扩大美国与中国AI科技之间的差距。

DeepSeek的崛起,可能会迫使像OpenAI和Alphabet等公司降低其大模型订阅的价格。然而,价格降低也可能带来更高的收入,因为较低价格会被消费者和企业更广泛的采用所抵消。

全新开始并非终结

在日本低油耗汽车占据北美市场的一半份额后,北美家庭的原油消费量不降反升。同样,当小米将智能手机价格由5000元降至1999元时,供应链公司的利润也显著增长。DeepSeek可以理解为一种“民主化”——更多的参与者加入了这个领域。

在互联网泡沫时代,市场对“互联网”产品的兴趣和使用量急剧上升。这一新兴数码领域的热潮不仅没有因高估值担忧而让人却步,反而激发了更多个人和企业进入互联网行业。

互联网科技的广泛采用和探索创造了一个创新蓬勃发展的生态系统,后续出现的搜索引擎、电子商务和社交网络等,塑造了我们今天所熟知的现代互联网。

这是一种自我强化的循环:繁荣吸引了人才、投资和雄心,推动了领域的加速发展,即使在泡沫破裂后仍未止步。就像互联网的“民主化”一样,进入门槛被降低,参与者增多,推动了各个行业的发展,甚至超越了之前的高峰。

英伟达霸主地位稳固

GPU市场正在经历结构调整,但英伟达的主导地位仍然稳固。DeepSeek的科技创新可能会减少部分训练对GPU的需求,但持续的人工智能军备竞赛和对通用人工智能(AGI)的追求仍然高度依赖于超级计算集群。

英伟达在高性能计算方面表现出色,其强大的CUDA生态系统仍是其核心优势。与此同时,DeepSeek的开源策略可能会吸引开发者,但英伟达可以通过战略合作来维持其影响力,例如支持混合精度训练框架等。

投资者不应对最新动态过度解读。我们鼓励投资者将此视为在颠覆性浪潮中寻找投资机遇的良好时机。

视频推荐 :

 
 

 

反应

 

国际财经

DeepSeek横空出世 美国名校生争相加入中国AI新创

(纽约21日讯)哈佛与斯坦福等美国知名学府的毕业生,正蜂拥加入中国前途无量的人工智能(AI)新创公司,今年初DeepSeek的横空出世可谓功不可没。

空间软体新创公司“群核科技”的共同创办人兼董事长黄晓煌接受彭博电视专访时表示,跟几年前相比,如今的状况根本是十年河东十年河西,该公司当时连从中国本地的大学招募工程师都困难。

他表示,扭转的契机发生在该公司被称为杭州市“六小龙”之一后,由于也是六小龙之一的DeepSeek,以价格低廉的AI模型在1月震撼了全球AI界,群核也同受惠,更容易招到人手。

黄晓煌表示,过去两个月“发生天翻地覆的变化”。

他说:“很多来自像北京清大、浙大、北大,甚至还有史丹福跟哈佛的毕业生寄履历给我们,有些都已经进入公司,开始上班”。

黄晓煌本人学经历也相当优秀,拥有香槟伊利诺大学(UIUC)计算机科学硕士学位,曾在英伟达工作。

尽管地缘政治紧张使中国公司对外行销产品造成困难,帮助用户设计内部空间的群核科技,却在全球范围内迅速成长。

随着全球各大产业及企业加速运用AI,人才短缺正成为瓶颈,像是机器学习与机器人方面,对人才的需求就远大于供给。

黄晓煌表示,该公司已在香港申请办理首次公开发行股票(IPO),计划招募近100名专业是最新AI科技的工程师,以跟上科技的快速进步。

新闻来源:世界新闻网

反应
 
 

相关新闻

南洋地产