首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

13小时编码、5天自主运行!Kimi K2.6开源“硬刚”闭源巨头,长程战力能否撕开AGI工业化新赛道?|agi|kimi|电子表格|jerry|agent|埃隆_马斯克

月之暗面(Moonshot AI)Kimi再次出招。

4月20日深夜,Kimi发布并开源Kimi K2.6模型。据其介绍,该模型具备行业领先(state-of-the-art)的代码能力、长程任务执行能力与Agent(智能体)集群能力。

K2.6延续了上一代K2.5的技术路线,在编码与智能体能力上进一步升级。其Agent集群调度能力实现量级突破,最高可支持300个子Agent并行完成4000个协作步骤,大幅提升了在复杂长流程任务中的处理效率。

当前,大模型产业的竞争焦点正从“通用对话能力”转向长周期、多工具协同的真实工作流落地,模型的长时间稳定工作能力正成为核心赛点。

此前3月,月之暗面创始人杨植麟在2026年中关村论坛年会全体会议上指出,大模型的本质是将能源转化为智能,规模化是AI发展的核心基础,但规模化并非暴力堆砌算力与能源,而是以提升效率为核心。对此,Kimi围绕三大方向构建规模化策略:Token(词元)效率、长上下文、Agent集群,力求在有限资源下实现智能最大化。

支持13小时不间断编码,5天自主运行,深度检索能力超越GPT-5.4

从多项权威基准测试结果来看,K2.6在通用智能体、编程、视觉智能三大方向上均有提升。

在博士级难度的“人类最后的考试(Humanity's Last Exam)”全工具测试中,K2.6以54.0%的得分登顶。在评估Agent深度检索能力的DeepSearchQA测评中,以92.5%的得分领先GPT-5.4、Gemini 3.1 Pro以及Claude Opus 4.6。此外,在BrowseComp、OSWorld-Verified等智能体测评中,Kimi K2.6均展现出行业前列的成绩。


图片来源:月之暗面官方微信号

但与此同时,K2.6仍在部分维度与头部闭源模型存在一定差距。SWE-bench多语言测试中,其得分略低于Claude Opus 4.6与Gemini 3.1 Pro。Toolathlon工具调度任务以及MathVision等视觉智能测评中,其表现与GPT-5.4也存在略微差距。

从本次K2.6能力提升的方向来看,其核心价值更多体现在:开源生态中正演进出能够胜任长周期、复杂任务的能力。而这一技术方向,也已成为当下国产大模型行业的共同选择。

近月来,OpenClaw(俗称“小龙虾”)等自主Agent应用快速崛起。区别于传统对话式交互,这类场景要求AI跨应用不间断自主运行,主动完成任务规划、代码执行、跨平台协同操作,对模型上下文承载、长期记忆连续性、多步骤推理稳定性均提出了更高要求。

针对自主Agent赛道,Kimi K2.6也增强了Agent的自主化执行能力,在OpenClaw、Hermes Agent等自动化任务场景表现突出。官方披露,其RL(Reinforcement Learning,强化学习)基础设施团队已基于K2.6 Agent实现连续5天不间断自主稳定运行,充分验证了长时工作可靠性。

杨植麟曾在发布K2.5时介绍其Agent集群能力:“在K2.5上,我们从单个Agent进化到了Agent集群,从单个专家进化成了一个专业团队。”他具体解释道:K2.5会创建并协调一大群专项Agent并行工作,这些专项Agent本质上都是K2.5的分身,各自承担不同的角色和子任务,没有任何预设规则,所有的角色分配和任务拆解都是由K2.5现场即时决定。

迭代至K2.6,Agent集群架构完成全面扩容升级:支持调度不同技能特长的Agent进行互补协作、组合各项能力。架构上扩展至最多300个子Agent并行完成4000个协作步骤(K2.5为最多100个分身,并行处理1500个步骤),实现了更大规模的并行化。

代码能力作为本次迭代核心亮点,本次更新中,长程编码能力的提升是主要突破:K2.6支持不间断编码13小时,完成超过4000行代码的编写或修改,覆盖Rust、Go、Python等编程语言,以及前端、运维、性能优化等场景。通过代码与视觉能力的深度融合,K2.6能够交付专业级Web应用。


图片来源:每经媒资库

Kimi估值3个月已翻4倍 杨植麟能否开辟AGI工业化新赛道?

在2026年中关村论坛年会后,杨植麟表达了他对Agent的发展洞察。他认为,与传统对话式AI“即时问答”不同,真正受用户信赖的Agent必须具备长时间持续工作的能力,能够承接更复杂的任务。这背后需要突破训练难度、数据积累、上下文承载等多重技术瓶颈。

杨植麟指出,这种能力的突破将带来生产力的指数级提升,Agent或将成为生产力的核心载体,其产生的Token(词元)在一定程度上等价于GDP(国内生产总值),长期甚至可能让现有GDP实现数倍增长。

《每日经济新闻》记者(以下简称“每经记者”)注意到,这一技术洞察直接体现在Kimi近期的迭代节奏中。继K2.5首次引入Agent集群概念后,Kimi开始在更基础的架构层面展开探索。

今年3月发布的技术报告中,团队对大模型核心结构的残差连接进行了重新设计,让每一层可选择性关注此前各层的输出。这一改进获得了美国企业家马斯克“令人印象深刻”的评价,以及OpenAI前研究副总裁Jerry Tworek“深度学习2.0要来了”的点评。

此外,杨植麟在中关村论坛年会上预测了大模型训练的下一阶段:“越来越多的研究工作将由AI主导。未来每个研究员将配备海量的Token,由AI自动合成新任务、构建新环境、定义最优奖励函数,甚至自主探索全新网络架构。在这一趋势下,整个AI领域的研发速度将进一步加快。”

在技术快速演进的同时,Kimi在资本市场上得到了同步反馈。

市场知情人士此前向每经记者透露,3月14日Kimi估值已攀升至180亿美元,3个月内翻了4倍,且新一轮10亿美元融资正在推进中。不到3个月完成3轮融资,创下国内大模型连续融资纪录,也让Kimi成为国内估值最快突破百亿美元的独角兽企业。

估值上升的原因有两方面。一方面,产品迭代与付费收入出现较快增长:2026年开年以来,K2.5模型、Kimi Claw先后上线并升级,适配多办公平台,带动1月底以来20天收入超过2025年全年;Stripe数据显示,其个人订阅订单1月环比增长8280%,2月再增长123.8%,进入全球榜单前十。另一方面,AGI赛道整体升温,智谱、MiniMax港股上市后市值的上涨也为行业头部玩家提供了估值支撑。

当前,AGI行业已从参数竞赛转向技术效率与落地能力的竞争,Agent时代的竞争规则正在被重新书写,转向如何做得更久、更稳、更完整。Kimi以技术演进为主线,在这一过程中逐步确立自身定位。而大模型竞争格局是否因此生变,仍有待观察各厂商后续的迭代节奏与生态建设能力。

📚 相关阅读

• 飙升68.9%背后,这个西部省份赢麻了|外贸|重庆|进出口
• 算力需求持续高增,AI应用或迎爆发拐点,人工智能主题指数强势涨超6%|天弘|中证|基金|成分股|ai应用|标的核心要素
• 长三角首个国家核准民商遥感卫星地面接收站开工|天线
• 超人类纪录,荣耀如何包揽人形半马前三?对话“闪电”队长|机器人|齐天大圣
• 我国AI大模型周调用量连续五周超越美国,科创AIETF博时(588790)强势涨超2%|基金|科创aietf
• 开云联手谷歌,Gucci智能眼镜明年登场|古驰|奢侈品|爱马仕|知名企业|gucci