关闭广告

350亿vs25000亿!国产模型正打破美国AI编程垄断

无相商业趋势826人阅读



产业竞争的烈火终究是烧到了大模型上,前段时间,知名编程模型Claude的开发商、估值超过3500亿美元(约合25000亿人民币)的Anthropic公司选择对华“断供”。而且不仅是对中国企业,也明确指出包含中国公司持股的海外企业。

国内企业陆续被暂停了Claude API使用,纷纷寻找替代品。包括字节跳动的TRAE和腾讯的CodeBuddy等编程平台的国内版,也被迫下架Claude模型,一时间风声鹤唳。

在大模型百花齐放的今天,Claude断供中国真的如此关键吗?答案是肯定的。

Claude之所以难以被替代,源于其深厚的技术积淀。在复杂算法实现和系统架构设计等高级编程任务中,Claude有更高的完成度,跨越了编程领域“可信”和“可靠”的心理阈值。

然而,机遇往往与危机并存。



1月底,一家中国大模型公司发布的新开源模型,因为突出的编程性能和视觉理解能力,引发了海内外技术社区和开发者的广泛关注。

连续一周登上Twitter科技新闻热搜,仅仅三四天时间,官方发布帖子的阅读量就达到了 680万,甚至不亚于美国OpenAI和Anthropic的旗舰模型发布帖子。顶尖AI技术领袖,160万粉丝的前特斯拉AI总监Andrej Karpathy、卡内基梅隆大学教授Tim Dettmers等专家也点赞恭喜。



从AI行业权威的评测机构LMarena(大模型匿名竞技场)代码能力基准测试中,这个名为Kimi K2.5的中国模型,排在全球开源模型的第一位,仅次于Claude和谷歌Gemini最新的旗舰模型。在前10名的榜单中,也是唯一的中国模型。



美国大模型技术最好的三家公司:OpenAI、Claude和Gemini,因为旗下模型的性能和实际表现总在排行榜的前列,通常被行业称为美国“御三家”。

这是第一次,中国公司通过开源模型打破了美国“御三家”的编程和视觉理解技术垄断。

美国另一家权威评测机构Artificial Analysis和中国模型基准测试机构SuperCLUE的分析都显示,Kimi K2.5模型的智能水平是全球开源第一,仅次于闭源的美国“御三家”。

在特别注重编程性能的AI领域,但凡有一款大模型做到关键指标领先,就会被迅速推开。

Kimi K2.5一经推出后,海外知名编程工具Kilo Code就迅速接入,并宣布首周免费来吸引用户。国内,腾讯旗下编程工具CodeBuddy、字节跳动旗下编程工具TRAE也第一时间上架,因为突出的编程能力,和同时支持视觉的完备性,立即成为首选国产模型。



而发布Kimi K2.5模型的这家中国创业公司,却有个略显“中二”的名字,叫月之暗面。2025年底,他们刚刚完成了C轮35亿元的融资,公司总估值在350亿左右。仅为Anthropic 2.5万亿的1/70。



和很多工业软件一样,在编程大模型领域,中国的业界曾经也处于被卡脖子的状态。

据行业评测数据显示,Claude在复杂算法实现、系统架构设计等高级编程任务中的完成度显著高于行业平均水平。在市场生态方面,Claude也因为先发优势,构建了完整的开发者服务体系,形成了显著的用户粘性,特别是大型企业用户的年均续约率更高。

也正是基于这些优势,Claude的相关模型价格高了国内5-7倍。

那么贵,为什么不用国产?

不得不承认,在这个中国模型亮相之前,国产编程模型存在明显的技术差距。

首先是模型的智能水平,海外模型基本都是万亿参数起步,才能做到对广泛任务和高难度任务的较好应对。中国主要是几千亿参数的模型,难以应对较为复杂的任务,只能做一些非常简单的编程工作。

然后是,中国主流模型在架构设计上普遍采用纯文本预训练,缺乏视觉模块的整体集成。这意味着模型无法理解图像包含的语义信息,在需要多模态理解的场景中表现受限。

比如在前端开发领域。某大型电商平台技术团队曾进行对比测试:当要求模型根据UI设计稿生成前端代码时,必须有很强视觉能力,才能准确识别设计稿中的布局关系、色彩体系和交互元素。

视觉理解能力的技术门槛主要体现在三个层面:首先是视觉信号编码,需要将像素信息转化为有意义的特征表示;其次是跨模态对齐,要求模型理解视觉内容与文本描述之间的关联;最后是统一表示学习,需要建立共享的语义空间。

这些技术难题如同几座大山,阻碍了国产编程模型的进阶之路。

而在实际应用中,这种技术差距直接影响了开发效率。开发效率的差距进一步影响了产品的迭代速度,这在快速变化的市场环境中是致命的。

大模型不同于新能源汽车,要想超车,没有技术以外的捷径可走。

面对技术壁垒,中国公司选择对大模型的底层架构进行革新。

比如Kimi K2.5采用了原生多模态架构,通过ViT+Transformer的混合编码器实现图像和文本的联合表示,在模型底层实现了信号融合。

这种设计相比传统的后期融合方法,在语义保持度和计算效率上具有显著优势,具体而言,模型在训练过程中就建立了视觉与文本的深度关联,而非简单地将两个独立的模型输出进行拼接。

此外,据了解,在Kimi K2.5模型的开发中,这家公司还重点优化了训练基础设施,通过重构强化学习框架,让训练效率提升数倍。

而在视觉理解能力的痛点上,Kimi K2.5更是实现了对Claude的反超:在界面设计稿转代码任务中,Kimi K2.5可准确识别组件的空间关系、样式属性和交互逻辑,代码生成准确率超过Claude。

更为友好的是Kimi K2.5的定价:API调用的输入价格为4元/百万Token,仅为Claude中号模型Sonnet 4.5的1/5,大号模型 Opus 4.5 的1/8。

对于那些每年在大模型上砸数千万元的互联网企业而言,终于等到了一个全功能的、代码和视觉能力都很强的Claude中国平替模型。



当然,一个大模型好不好用,性能到底受不受认可,最终都是市场来说话。

OpenRouter数据显示,Kimi K2.5上线第二天即进入日活跃度前三。



全球最大、估值超千亿的AI搜索创业公司Perplexity,第一时间上架了Kimi K2.5模型,作为给付费用户的高级模型使用。在Perplexity平台上,这也是唯一的中国模型。



从全球开发者的实际反馈来看,这个名为Kimi K2.5的模型,编程能力的表现非常突出, “可以挑战Claude的中号模型Sonnet 4.5,略逊于大号模型Opus 4.5”,同时价格只有他们的1/5到1/8,性价比优势突出。

知名编程工具Cline的开发专家Juan Pa发帖称,他在一项实际编程任务中测试了Codex 5.2、Opus 4.5 和 Kimi K2.5三个模型,他的测试结果是“Kimi K2.5以38%的成本达到了约Opus 90%的质量。”



人工智能专家Mariusz Kurman则建议,“在项目计划阶段使用Opus4.5模型,在创建阶段使用Kimi K2.5模型,可以达到最佳效果。”



在国内技术社区上,开发者们实测之后反馈称,“Kimi K2.5多模态能力以及coding能力还可以的,作为Gemini Pro。Claude和GPT5.2 codex模型的替代也是不错的。国产模型越来越好了。”



一直以来,很多人都以为在AI竞赛上,美国企业主导基础模型层,而中国企业只是擅长应用开发。

2025年初,DeepSeek的出现打破了这种判断。2026年初,这家叫月之暗面的公司推出的新模型,则在编程这个关键领域再次突破了美国模型的垄断。

事实上,这家公司并不是2026年初才横空出世的。早在2025年中,他们就因为首个万亿参数的开源模型K2受到了国际社会的关注,被英国自然杂志称为中国的另一个DeepSeek时刻。

而在硅谷广受欢迎的All-In Podcast中,Kimi K2.5也被直接定义为“开源AI的重要里程碑”。



硅谷知名的风险投资家、企业家Chamath Palihapitiya将Kimi K2.5的发布和带来的反响概括为“Kimi K2.5时刻”。

作为一位曾参加白宫科技圆桌会议并采访过美国总统的权威人士,Chamath认为,开闭源已不只是技术路线之争,而是企业、组织乃至国家层面的“基础设施选择”。

由此可见,我们需要更多的DeepSeek时刻,需要看到更多中国力量的突破,不是一个DeepSeek,而是一大批DeepSeek。特别是在地缘政治不确定性的背景下,本土模型更是中国企业的刚需,因为在核心系统中采用自主可控的AI技术,既是商业选择,也是战略必须。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

天空:西汉姆联将继续信任努诺,俱乐部今天开会讨论引援问题

懂球帝 浏览 1046

百亿私募一站式出海!招商证券打造跨境服务生态

券商中国 浏览 1278

2025年,他们集齐了十二枚臂章

我们的太空 浏览 1173

曹骏舒畅世纪同框,蓝盈莹自食恶果,高低立判!

情感大头说说 浏览 824

记者:阿根廷19岁中卫托维亚斯-拉米雷斯没考虑去迈阿密国际

懂球帝 浏览 852

今年最狠悬疑剧,好人为何集体沉沦?

仙女事件簿 浏览 1856

活塞99-98险胜老鹰,杜伦21分11板,杰伦-约翰逊空砍29+13

懂球帝 浏览 1431

宝马M3旅行版正式上市 售价94.39万元

车质网 浏览 1631

羽绒服+阔腿裤:今年冬天最火搭配,松弛又时髦!

LinkFashion 浏览 1037

U23亚洲杯疯狂一夜:韩国4-2逆转 日本3-0接近进8强 中国队争首胜

侃球熊弟 浏览 1017

最强Air!苹果全新iPad Air发布:M4芯片加持 4799元起

快科技 浏览 424

万科:董事长辛杰辞职

网易财经 浏览 1821

三年半亏19亿,超90%订单依赖聚合平台,享道出行IPO底气在哪儿?

尺度商业 浏览 1664

阿卡小遇波折三盘晋级,战袍意外陷争议:像根大葱还是致敬费德勒

网球之家 浏览 1009

"四大天王"被网友笑称"四大岳父" 最年轻的黎明已59岁

极目新闻 浏览 7386

媒体:特朗普称对华加税100% 在中美会晤前威慑中国

新民周刊 浏览 8737

马斯克评英伟达纯视觉自动驾驶系统Alpamayo

不看车bukanche 浏览 1113

追寻阳光的Isabel Marant女郎,再次独自启程

时尚COSMO 浏览 2076

京沪高铁:一道复杂的算术题

锦缎研究院 浏览 1176

AI是繁荣还是泡沫?哈佛学者剖析OpenAI千亿交易背后的风险

硅星人 浏览 1992

美国步步攫取委内瑞拉石油利益:主权在委 财权在美

澎湃新闻 浏览 2894
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1