
中国将开源AI模型打造成全球标竿的野心,已撼动美国企业与政府官员。他们担心美国的模型恐遭超越,并正加紧因应这项威胁。
华尔街日报报导,中国今年在AI领域的进展接连不断,1月由广受瞩目的DeepSeek R1推理模型打头阵,随后有阿里巴巴的Qwen,以及自7月以来的Moonshot、Z.ai、MiniMax等一连串新秀登场。
这些模型都提供用户可下载并修改的版本,这种「开源」或「开放权重」的模式,正推动中国AI技术在全球快速普及。
长期维持模型封闭的美国企业正感受压力。8月初,ChatGPT开发商OpenAI也推出首个开源模型gpt-oss。
科技史上不乏产业初期百家争鸣、最终由少数巨头垄断的例子,例如微软Windows系统、Google搜索引擎,以及智能手机的iOS和Android系统。
历史也显示,技术最先进的一方未必会成为产业标竿,泛用与灵活度也同样关键,这正是为何中国在开源AI的突破,令华府与硅谷倍感忧虑。
今年的美中贸易战显示,双方都能运用各自的产业优势来向对方施压。美国有辉达芯片,中国则掌握稀土矿产。美方官员担心,若中国AI模型在全球占据主导地位,北京将想办法将其转化为地缘政治上的筹码。
根据研究机构 Artificial Analysis的评估,自去年11月以来,中国表现最优秀的开放权重模型,整体表现已超越美国的开源代表。该机构针对数学、程序编码等多项能力进行评比,结果显示阿里巴巴的Qwen3某一版本击败 OpenAI的gpt-oss。
亚洲地区的工程师特别指出,他们发现中国模型在理解当地语言与掌握文化细节方面往往更细腻。中国模型在训练时使用更多中文数据,而中文与部分其他亚洲语言之间存在一定的相似性。
一位日本工程师透露,最近为客户开发聊天机器人时选择了阿里巴巴的Qwen,原因是发现使用美国模型时,聊天机器人「难以理解用户言语中隐含的意图,回复有时不够礼貌;Qwen处理这些细节时,表现似乎较佳」。
不过,Qwen的规模几乎是OpenAI的两倍,意味着在处理较简单任务时,可能需要耗用更多运算资源才能完成同样工作。OpenAI表示,他们的开源模型在推理任务上表现优于相近规模的竞争对手,并能以低成本提供稳定性能。
目前,在开源AI领域胜出的厂商实际收益有限,因为他们投入数亿美元开发模型,却无法直接收回成本。但若成功留住用户,业者就有机会用免费产品贩售其他服务,就像Google在Android操作系统中,搭配搜索、YouTube等能带来营收的产品一样。
上海86Research科技分析师柴克文(Charlie Chai)表示:「中国企业往往把用户黏着度摆在即时营收之前。」