中国AI新创公司DeepSeek(深度求索)低成本的新AI模型DeepSeek R1 日前横空出世。图为2025年1月27日英国巴斯,智慧型手机萤幕在 Nvidia 网站前显示了中国人工智能公司 DeepSeek 应用程式的标志。(图片来源:Anna Barclay/Getty Images)
【看中国2025年1月29日讯】(看中国记者杨天资综合报导)中国AI新创公司DeepSeek(深度求索)低成本的新AI模型DeepSeek R1 日前横空出世,美国白宫发言人表示,官员正在调查中国人工智能(AI)应用程式DeepSeek对国家安全的影响。
美国总统川普回应DeepSeek爆火
北京时间1月27日中午,DeepSeek登上中国和美国苹果应用商店免费应用榜单第一位,引发广泛关注。
综合外媒报导,中国AI新创公司DeepSeek(深度求索)推出新AI模型DeepSeek R1,以惊人低成本实现与OpenAI等巨头相媲美的性能,不仅挑战美国在AI领域的主导地位,也标志着全球AI竞争格局可能迎来重大转变。
27日稍后,美国总统川普在佛罗里达州表示,中国人工智能模型DeepSeek是美国行业的警钟,但他说这是积极的进展。
他说:“希望中国公司发布的DeepSeek人工智能能成为我们行业的警钟。这提醒我们需要全力以赴进行竞争才可能获胜。”
川普称,目前的局势迫使硅谷以更加低成本的方式进行创新。
美国科技公司高管,前哈佛大学实验室主任陶瑞在社交媒体X发贴称:川普看问题很客观,他说DeepSeek敲醒了警钟,但这是一件好事情。你们也可以这样做,花更少的钱,得到同样的效果。DeepSeek的确给我们带来很多启示。第一,马斯克是对的,OpanAI变成CloseAI以后必将衰败。第二,DeepSeek团队的发展证明了我一直以来的观点,量化交易没有前途。这一点很重要!
川普看问题很客观,他说:DeepSeek敲醒了警钟,但这是一件好事情。你们也可以这样做,花更少的钱,得到同样的效果。
— 陶瑞 TaoRay (@realTaoRay) January 28, 2025
DeepSeek的确给我们带来很多启示。第一,马斯克是对的,OpanAI变成CloseAI以后必将衰败。第二,DeepSeek团队的发展证明了我一直以来的观点,量化交易没有前途。这一点很重要! pic.twitter.com/pE6KIG4BTa
此外,白宫发言人李威特(Karoline Leavitt)28日表示:美国国家安全会议(National Security Council)正在检视此一应用程式的影响。她说:“这对美国AI产业是一记警钟。”
她同时表示,白宫正致力“确保美国AI的主导地位”。
白宫AI和加密货币专家塞克斯(David Sacks)在福克斯新闻网(Fox News)被问及DeepSeek崛起是否涉及智慧财产权盗窃。塞克斯说:“嗯,有可能。AI领域有一种叫做蒸馏(distillation)的技术,你将经常听到这种技术,意思是一个模型向另一个模型学习。”
塞克斯补充说:“我认为,未来几个月你将看到的事情之一就是,我们的AI领头企业会采取措施尝试防止蒸馏…这肯定会减少一些模仿而来的模型。”
“AI天才少女”登热搜 外界质疑
DeepSeek模型在AI圈爆火后,DeepSeek-V2的关键开发者之一罗福莉也立刻成为热门人物,被称为95后AI“天才少女”。
“前DeepSeek天才少女从农村走向TOP开发者”也一度登顶微博热搜,但是不是当局操纵炒作,目前还不得而知。
据悉,罗福莉出生于1995年,毕业于北京师范大学电脑系,拥有北京大学计算语言学硕士学位。2019年在北大读硕士时,就在AI领域顶尖国际会议ACL发表八篇论文。毕业后第一份工作在阿里达摩院,从事预训练语言模型相关工作,主导开发多语言预训练模型VECO。
2022年,罗福莉加入幻方量化公司,从事深度学习相关策略建模与算法研究;再转到幻方量化旗下新创公司DeepSeek担任深度学习研究员,参与研发DeepSeek-V2。
罗福莉此前接受采访时表示:自己家庭条件并不好,但是家庭给了她勇气,让她相信相信的力量,一直通过努力改善生活状况。罗福莉却认为自己仅是电脑领域的“低起点者”。她毕业自一个小城市的高中,考进北京师范大学,误打误撞进入电脑专业,大学时期一度考虑转行做产品。转捩点出现在她被保送至北京大学计算语言学所,在AI领域展露天赋。
罗福莉的成名之路起源于北京大学的硕士研究。2019年,当她仍在学期间,便在人工智能领域的顶级国际会议ACL 上发表了8篇论文,迅速引起业界关注。此后,她加入阿里巴巴的达摩院,负责开发多语言预训练模型 VECO,并为 AliceMind 开源项目贡献了大量力量。
2022年,罗福莉转战量化金融领域,加入“幻方量化”,从事深度学习与策略建模研究。随后,她再度跳槽至 AI 新创公司 DeepSeek,担任深度学习研究员,并参与开发了 MoE 大模型 DeepSeek-V2。
🚨马斯克和Aleksandr Wang表示,
— 谢嘉琪 (@XieJackie) January 27, 2025
DeepSeek实际上拥有大约50,000个英伟达Hopper GPU,而不是他们声称的10,000个A100 GPU,
这归因于美国的出口控制。马斯克凭借在xAI的经验,同意Wang的评估。pic.twitter.com/9TcrAqwBjq
世纪骗局 #DeepSeek 这些视频被秒删,更是佐证了这是个骗局。 pic.twitter.com/vO6FhcKVgX
— 正视历史▪️传播真相🇺🇸 (@543dom_) January 28, 2025
R1:一场低成本的革命
美国有线电视新闻网CNN在27日撰文对DeepSeek进行详细介绍,并分析了DeepSeek将对美国与科技业带来的影响。
DeepSeek是中国对冲基金经理梁文锋在2023年底新成立的AI新创公司,这家公司以开源方式发布R1,使其他企业能基于相关模型进一步改进。R1推出后迅速引发市场关注,APP的下载量更在一周内飙升至200万次,超越ChatGPT,成为人工智能领域的一大焦点。
DeepSeek R1是2025年1月20日新开发出的AI模型,其能力据说可媲美美国科技巨头OpenAI的GPT-4、Meta的Llama,以及Google的Gemini等顶级模型。
然而,DeepSeek R1的成本只有区区560万美元,相较于其他科技巨头在AI技术上花费的数十亿美元,这一成本不过是它们的零头,有Meta员工更透露,相关数字在Meta不过是一名高层的薪水。DeepSeek指出,
R1可在低功耗芯片上运行,这在美国限制向中国出口高性能人工智能芯片的背景下更显得意义重大。
分析认为,R1的出现加剧了对美国企业支出规模及效益的质疑,未来AI产业可能迎来更有效率的营运模式,并对全球经济带来深远影响。
然而,DeepSeek的能力目前主要集中于大语言模型,仍无法满足一些需要庞大基础设施的高端AI功能需求。
此外,专家认为,美国仍拥有雄厚的科技与人才基础,短期内难以被取代。