
美国4月针对出口至中国的辉达H20芯片祭出管制,据美国科技媒体The Information,这项措施已抑制中国新创DeepSeek发展,由于中国芯片更加短缺,DeepSeek即将推出的R2模型恐无法迅速被中国企业采用。
The Information引述知情人士说法指出,年初受到大量关注的中国AI新创公司深度求索(DeepSeek)将推出新一代模型R2,但尚未确定发布日期,因为DeepSeek首席执行官梁文锋对新模型表现还不满意,公司持续调整与优化新模型、直到梁文锋批准。
不过,就算R2发布后的表现优于其他开源模型,中国云端服务供应商恐怕也无法应付客户需求,主因在于客户目前多半是通过云端上部署的辉达(NVIDIA)降规版AI芯片H20来运行上一代模型R1,但这些云端服务供应商正面临辉达芯片日益短缺问题。
报导指出,在美国一步步收紧对AI芯片的出口限制下,DeepSeek以相对受限的运算资源实现模型效率、R1模型年初推出后掀起外界对中国技术突破重围的讨论,但是美国4月针对辉达H20芯片祭出出口管制的效果正在发酵,凸显中国仍高度依赖美国技术。
R1发布后,中国云端服务供应商、开发者、国营企业、政府机构竞相使用,这款模型以辉达的硬件和软件进行训练,在辉达芯片上运行表现最好,使R1和H20成了绝配。
为满足需求,阿里巴巴、字节跳动、腾讯等中国企业今年前3个月订了约120万颗、总值高达160亿美元(约4800亿新台币)的H20芯片;不过,美国出口管制粉碎了中国企业想要囤积更多H20的希望。辉达首席执行官黄仁勋曾表示须认列高达55亿美元损失。
据中国云端服务供应商员工的说法,DeepSeek和中国企业保持着联系、提供技术规格以协助企业规划如何使用即将发布的R2模型,包含须「准备足够数量的H20芯片」。
中国企业目前仅能仰赖现有的H20库存,这将限缩R2的使用。尽管华为和中国其他芯片商提供了辉达芯片的替代方案,但由于辉达芯片和DeepSeek模型的兼容性,中国云端服务供应商若改用中国制芯片,不仅模型效率会降低,管理上也将更为不易。