2025年1月20日,幻方量化旗下AI公司深度求索正式发布DeepSeek-R1(以下简称“R1模型”),随即引发了全球的关注,仅7天时间用户量就突破1亿。随后,亚马逊、微软、华为、腾讯、阿里及国内三大运营商等国内外主流云服务商完成R1模型上线部署;文心一言、知乎直答等部分其他AI大语言APP也相继接入R1模型。同时,英伟达、AMD、华为、摩尔线程、海光等国内外主流GPU企业也迅速跟进,宣布适配R1模型。标普信评认为,本事件将自下而上对大语言模型
(LLM) 开发、云服务、互联网数据中心 (IDC)、终端硬件产品等多领域整体产生正向影响。
R1模型为全球LLM开发领域提供了一条新的成功路径,进一步加快了该领域的发展。R1模型不仅在数学、代码、自然语言推理能力方面比肩OpenAI
o1正式版,而且通过运用创新的训练方法显著降低了训练成本,证明在不具备先进算力的情况下,仍有开发出先进模型的可能性,激励其他开发者另辟蹊径。同时,与GPT、Gemini、文心一言和通义千问等先前国内外大语言模型主要采用闭源模式不同,R1模型作为一个开源模型,其他开发者亦可以利用R1模型通过输出、蒸馏等方式训练其他模型,整体降低了该领域的进入门槛,有助于该领域持续发展。