近日,美科技股大跌,英伟达等与人工智能联系紧密之公司的股价暴跌。这一切都是因为中国一个名不见经传的初创AI公司推出的一款大语言模型引发的。这款大语言模型的名称,就是DeepSeek R1。
什么来头?什么样的技术能够引出太平洋对岸世界第一大股市的地震?
一早看美股,纳斯达克指数下挫612点,跌幅3.07%。标普500下跌1.46%。一些主打人工智能或与人工智能联系密切的公司股票大幅度下挫。英伟達下跌17%,博通下跌17.4%,甲骨文下跌13.8%,Vertiv Holdings惨跌29.9%,Vistra Corp更是下跌了28.3%。相比之下,与人工智能联系较小的道琼斯指数受到的影响较小,全日未降反而略升,微涨了0.65%,据认为这多半得益于债券收益率下降的防御性股票的上涨。
上图 受DeepSeek R1冲击,纳斯达克股指大跌
看来,DeepSeek引发的震荡不小。
什么是DeepSeek?
中文名“深度探索”,是杭州一家人工智能初创公司。该公司由对冲基金经理梁文锋于2023年7月份创立,其推出的DeepSeek R1,是一款大语言模型,几乎可以和著名的竞争对手相匹敌,包括OpenAI的GPT-4、 公司的Llama,以及谷歌公司的Gemini,而其开发成本只是这些巨无霸公司的百分之几。该公司宣称,其基础AI模型的开发仅仅花了560万美元,而同类美国公司在AI技术上的花费,少则数亿美元,多则数十亿乃至数百亿美元。
不仅开发成本相对极低,而且还有另外两个优势:一个是对芯片功率要求相对低。考虑到美国近年以来一直以国家安全为由限制向中国供应大功率人工智能芯片,令美国科技节震惊的是,这意味着,DeepSeek多半能利用功率相对较低的AI芯片实现和那些使用昂贵大功率芯片一样的表现。另一个优势是耗能相对很小,因为它使用的芯片数量较少。
过往一年,DeepSeek曾经发布过多款有竞争力的AI模型,这些模型吸引了业界的关注。据《华尔街日报》报道,其V3模型提高了人们对该公司的一些认识。但最初业界认为,其内容受到本国政府及领导层敏感话题的限制,不可能走多远。
然而,几个月之后的2024年年底,它发布的R1,以其强大的算力搅动了科技界。尤其是它所透露的极低的开发成本,引起了全世界的关注。而且它是开源的,这意味着其他公司可以测试和构建该模型来改进它。
DeepSeek APP在各大应用程序商店推出以来,下载量一路飙升,1月27日,也就是星期一超过了ChatGPT,被下载近200万次。这应被视为引发美科技股大跌的一个导火索。
何以DeepSeek引人注目?
人工智能是一种高能耗与高成本的技术,故而美国最强大的技术领导者正在出巨资收购核电公司,以便为其人工智能模型提供必要的电力。
公司近期宣布,2025年将在人工智能开发上投入650多亿美元。OpenAI首席执行官Sam Altman不久前预测,人工智能行业将需要数万亿美元的投资来支持开发高需求芯片,以及为运行该行业复杂模型的耗电数据中心供电。
与美国顶尖人工智能模型类似的功能可以以如此小的成本实现,且可在能力较差的芯片上运行,这标志着这个行业对人工智能需要投资规模的巨大变化,虽然这项技术有很多怀疑论者和反对者,但其倡导者一直承诺有一个光明的未来:他们认为,人工智能将推动全球经济进入一个新时代,使工作更高效,并在多个行业开辟新能力,为新的研究和开发铺平道路。
特朗普的支持者、硅谷风险投资公司Andreessen Horowitz的联合创始人Andreessen在X上的一篇推文中说,DeepSeek是“我见过的最惊人和最令人印象深刻的突破之一”!
如果这种潜在的改变世界的力量能够以大幅降低的成本实现,它将为人类开辟了新的可能性,同时带来新的威胁。
何以DeepSeek令美国朝野震惊?
这件事出乎美国政府和科技巨头们的预料。
美国政府向来认为,它可以助力美国企业在关键技术领域的主导,这将有助于加强国家安全。就在卸任前一周,拜登还出台了一系列法规,限制人工智能计算机芯片的出口,以防止中国等竞争对手获得先进技术。
但DeepSeek对这一设想投下一个大大的问号,同时打破了美国科技天下无敌的光环。美国可能已经为自己争取了时间,限制了芯片出口,但尽管采取了这些行动,其人工智能的领先优势却已急剧缩小了!
DeepSeek的横空出世多半表明,技术封锁并不一定意味着美国将获胜。这也是对特朗普实施孤立主义及“美国优先”政策的一个最大挑战。
DeepSeek会让美国失去优势吗?
AI界对于DeepKeep公司宣布的如此之低的成本,迄今无人提出有力的异议。这是资本市场之所以恐慌的一个重要原因。一家不知名的公司能做出如此大的突破,意味着它花费的成本再高也不会高过美国那些大公司。
华尔街多半是对这一发展趋向感到震惊,由此引发了股市大跌。
然而,这是否意味着美国AI公司的优势正在失去?对此,美国业界显然并不这样认为。
Truist公司分析师勒内(Keith Lerner)说:“DeepSeek模型的推出导致投资者质疑美国公司拥有的领先优势,花费了那么多钱是否有利可图?”,他认为,人工智能的支出依然将是巨大的,美国公司仍然是引领者。
虽然节省成本很重要,DeepKeep R1模型无疑是ChatGPT的强劲竞争对手,但它属于以消费者为中心的大语言模型,尚未证明它能够为目前仍然需要巨额基础设施投资的行业处理一些紧迫而棘手的问题,在这类领域的AI模型,依然需要巨额投资。
人工智能市场研究公司Reflexivity总裁塞特(Giuseppe Sette)认为: 由于美国拥有丰裕的人才和资本优势,因此未来仍然是人工智能开发最有前途的'家园',预计首个具有自我改进能力的人工智能将会在美国出现。
(本文主要参考了几篇英文文献及报道)
附录:关于梁文锋
由于这一突破,梁文峰一夜之间成名,被称作中国的奥特曼(Sam Altman),与美国人工智能技术引领者奥特曼齐名。他是从做对冲基金起家的,但在对冲基金运作中使用了大量人工智能技术,并将投资收益反投入人工智能的开发。
百度百科是这样介绍的:
梁文锋,1985年出生于广东省湛江市,2008年浙江大学本硕连读毕业,获信息与电子工程学学士和硕士学位。杭州幻方科技有限公司、DeepSeek创始人。
2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。2015年,幻方量化正式成立。2019年,其资金管理规模突破百亿元;同年,梁文锋在当年的金牛奖颁奖仪式上发表主题演讲《一名程序员眼里中国量化投资的未来》。2020年开始,幻方的AI超级计算机“萤火一号”正式投入运作。2021年,幻方投入十亿建设“萤火二号”。2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。2024年5月,DeepSeek发布了DeepSeekV2;同年12月27日,DeepSeek-V3面世。2025年1月20日, DeepSeek正式发布DeepSeek-R1模型;同日,梁文锋参加了中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,并在会上发言。
(2025/01/28晨读记于海南博鳌)
上一篇:没有了