人工智能：北京希望合作，但要审查内容

作者 Silvia Torriti

在大型语言模型中，审查斧会检查聊天机器人的反应，以使它们“适应”“基本社会主义价值观”。 Hugging Face的使用也受到限制，这是一个流行的开源平台，世界各地的人工智能开发人员使用它来共享模型和资料集。尽管开发了大量本土演算法，但在中国高科技圈里，人们对所谓的“百模型大战”的有效性产生了怀疑。

米兰（亚洲新闻/通讯社） - 在引入“防火墙”（用于监控被视为敏感的外国网站的系统）约二十年后，中国审查制度的僵化目光也集中在人工智能（AI）上。这与最近几天义大利总理乔治亚·梅洛尼（Giorgia Meloni）访华期间多次提及的新技术前沿合作前景相冲突。

在阻止对ChatGpt 等国际人工智能平台的访问后，现在由中国主要科技公司和新创公司开发的大型语言模型（LLM），例如TikTok 的所有者字节跳动- 阿里巴巴、Moonshot 和0.1AI，现已被盯上了。

根据英国《金融时报》报道，中国政府的目标是确保这些能够理解和处理自然语言的先进技术工具体现“社会主义核心价值”。为了满足这项要求，负责监督和管理中国互联网的政府机构中国国家互联网资讯办公室（CAC）的官员需要审查大型语言模型对一系列问题的回答，其中许多问题涉及中国国家主席习近平（ Xi Jinping）以及统治政权认为有争议的政治或历史性质的议题。

例如，大型语言模型通过测试的中国聊天机器人将能够拒绝用户提出的有关 1989 年天安门广场事件或习近平与小熊维尼（经常被讽刺地与迪士尼人物联系在一起）的相似性的任何问题。对于这样的询问，百度的聊天机器人厄尼（Ernie）已经回答说他“尝试了一个不同的问题”，而阿里巴巴的通义千问（Tongyi Qianwen）反驳道：“我还没学会如何回答这个问题。”我会继续学习，更好地为大家服务。

同时，北京推出了一款几乎完全基于习近平思想的人工智能聊天机器人，旨在传播中国领导人的意识形态。

根据《华尔街日报》报道，北京的审查制度也可能进一步限制中国科技公司取得训练数据，而训练数据是利用各种文字来源建构人工智能系统的“基础”。去年，中国当局突然拒绝存取 Hugging Face，这是全球人工智能开发人员用来共享模型和资料集的热门开源平台。

据称，中国政府的意图是在与中国共产党官方报纸《人民日报》关系密切的机构的支持下，根据从意识形态角度被认为“安全”的信息创建自己的数据集。然而，业内人士表示，严格审查的资料集可能会导致人工智能模型失真，限制其处理某些任务的能力。

因此，很明显，透过实施这些限制，中国——第一个对人工智能的使用引入具有约束力的法规的国家——面临着破坏中国公司在该领域取得的巨大进步的风险，而该领域目前在国际舞台上占据主导地位。

目前，中国已开发约130个LLM，占现有模型的40%，仅比美国少10%。百度、阿里巴巴、华为、腾讯等中国高科技巨头之间的激烈竞争，甚至引发了所谓的“百模大战”，这个说法让很多人想起了人民网。彭德怀（Peng Dehuai）将军指挥的第八街军对日本侵略者进行的“百团大战”。

尽管这个由腾讯高阶主管创造的公式最初被官方媒体用来赞扬中国公司在蓬勃发展的人工智能市场中取得的成功，但一些技术专家开始质疑这种方法的有效性。

对此持怀疑态度的还有百度联合创始人兼首席执行官李彦宏（Robin Li Yanhong），他在7 月初于上海举行的世界人工智能大会(WAIC) 上发表演讲时表示，大型语言模型在中国市场的激增导致了“相当大的资源浪费”，因为其中许多模型在现实世界中没有实际应用。

进一步削弱中国科技公司竞争力的还有地缘政治议题，例如龙与美国之间持续不断的技术战。美国当局实际上已禁止中国购买美国巨头英伟达制造的高品质半导体，这些半导体被认为对实现人工智能模型至关重要。

尽管《华尔街日报》揭露了一个走私网络，将受限的晶片从东南亚走私到中国，但这些永远不足以满足该国的需求。从长远来看，中国政府决定透过拨出国家资金帮助中国科技企业开发国产晶片来弥补这一缺口。尽管由于美国的制裁而难以采购必要的设备来制造它们，但中国手机巨头华为似乎即将推出一款可以取代英伟达晶片的晶片型号。