百模大战:北京DeepSeek背后的秘密
ChatGPT的“经济”替代品爆红,也是中华人民共和国押注大公司和初创企业在开发最先进人工智能系统方面进行内部竞争的结果。从长远来看,围棋锦标赛的惨败比美国对中国出口先进微芯片的制裁更为严重。
米兰(亚洲新闻/通讯社)——最近几天,人们谈论了很多关于中国新人工智能模型DeepSeek V3的性能,以及它与Chat-GPT和该领域巨头的竞争。但这种竞争也有一个内部战线:即活跃于世界经济这一战略领域的中国企业之间的竞争。刚刚有消息称,北京电子商务巨头阿里巴巴推出了其人工智能模型Qwen 2.5的新版本,据该公司称,该模型已经超越了最近几天备受好评的DeepSeek-V3。与西方开发的模型相比,其性能更佳,成本更低,能耗更低(尽管 - 或者可能要归功于 - 禁止向中国公司出售先进芯片)。
阿里巴巴云部门在农历新年当天在其官方账号上发布的公告中表示:“Qwen 2.5-Max几乎全面超越了GPT-4o、DeepSeek-V3和Llama-3.1-405B。”人工智能技术领先企业OpenAI和Meta以及中国企业。Qwen 2.5-Max的发布与春晚直播云计算技术支持同步进行,春晚是中华人民共和国的最大的年度综艺节目,融合了音乐、舞蹈、戏曲、武术和喜剧于一体。
1月12日,也就是DeepSeek-R1发布两天后,TikTok母公司字节跳动也发布了旗舰AI模型的更新,声称其在AIME中已经超越了OpenAI的o1版本(由微软支持)这是一项基准测试,用于衡量人工智能模型理解和响应复杂指令的能力。
这种追逐中国模式的行为,以及将诸如DeepSeek之类的直到昨天才为人所知的主题进入市场并不是一个临时现象,而是北京实施的精确战略的成果。几周前,年轻学者Chase Young在美国康奈尔大学网站上发表了一篇有趣的文章并很好地解释了这一点。他解释道:“在ChatGPT取得成功以及美国对芯片实施制裁之后,许多人预计中国将集中资源在人工智能领域的竞争上。相反,北京正在推行一种在中国被称为“百模大战”的战略。这一策略似乎与电动汽车行业类似,中国提供了大范围的补贴,不仅催生出比亚迪和理想汽车等令人印象深刻的行业领军企业,还催生出200多家电动汽车制造商。其中许多都无利可图。同样,中国许多人工智能初创企业目前也面临财务困难。”
Chase Young说到,在这种背景下,去年夏天在上海举行的世界人工智能大会上,百度首席执行官李彦宏明确提出了这个问题,他问中国现在是否没有太多的人工智能初创企业,以及集中资源并不会更有利可图。
相反,DeepSeek的漏洞似乎表明我们将继续沿着“百模”的道路前进。也因为中国人工智能初创企业可以依赖一系列重要的优势。杨引用了经济合作与发展组织(OECD)的数据,称中国目前对人工智能研究的贡献超过20%,超过了欧盟和印度的总和。中国还在全球生成性人工智能专利竞赛中占据主导地位,过去 10 年里其专利数量“是排名第二的美国的6倍”。
在文章中,Chase Young还指出了中国在该问题上的政策的一个转折点,这与北京在一场单一竞赛中失败有关。2017年5月举行的围棋未来峰会通常被认为是‘下一代人工智能计划’的起源,两个月后,北京宣布了其到 2030 年成为‘世界领先的人工智能创新中心’的目标。人工智能”。发生什么事了?峰会期间,谷歌人工智能程序AlphaGo击败了五位中国围棋顶尖选手。“谷歌没有想到会以这种方式刺激中国对人工智能的大规模投资,”Chase Young评论道。然而,对于中国来说,其国家娱乐项目中最好的选手被一家美国公司击败这一事实被视为“斯普特尼克时刻”(苏联先于美国将航天器送入太空,从而引发了阿波罗计划)。除了在大学层面的投资外,2017年11月,中国还开始委托百度、阿里巴巴、腾讯和科大讯飞为人工智能的不同子领域建立“开放式创新平台”。如今,四大公司均继续在该领域进行投资,该计划已发展到至少15家公司。”