小智头像图片
AI动态资讯 2025年07月21日
0 收藏 0 点赞 123 浏览 2938 个字
摘要 :

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​: 近日,国内大模型独角兽月之暗面发布并开源的最新一代 MoE 架构基础模型 Kimi K2,不断在海外掀起热议。有……

哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​:

近日,国内大模型独角兽月之暗面发布并开源的最新一代 MoE 架构基础模型 Kimi K2,不断在海外掀起热议。有最新数据显示,推出不到两天,该模型在大模型 API 聚合平台 OpenRouter 的 token 使用量就超越了马斯克创立的 xAI。前不久,xAI 刚发布号称“全球最强 AI”的 Grok 4。

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

据官方介绍,作为月之暗面首款开源发布的旗舰模型,Kimi K2 的总参数量达到 1 万亿(1T),激活参数为 32B,现已在 Kimi Web 端和 App 端中上线。有网友感叹道,“万亿参数级模型已开始能在非英伟达硬件上流畅运行……如果中国实验室能通过巧妙的路由策略,在更少的芯片上实现更强的智能,那么英伟达对 AI 硬件体系的垄断地位就会开始动摇。这是典型的 ‘压力下的创新’:拿不到高端芯片?没关系,我们重新设计一切,让自研硬件能发挥出更优性能。”

在代码、Agent、工具调用这三方面的相关基准测试中,该模型均取得开源模型中的 SOTA 成绩。除了基准性能测试,Kimi K2 在多个实际场景中也展现出更强的能力泛化和实用性,包括在前端开发任务中生成兼具设计感与视觉表现力的代码、自动将需求拆解为一系列格式规范和可直接执行的 ToolCall 结构和准确控制各种输出风格来改写文本等。

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

这几天,陆续有开发者分享测试与体验 Kimi K2 的使用感受以及与其他国内外知名大模型的能力对比情况。值得一提的是,Kimi K2 在开发者群体中的各种实测不仅没掉“链子”,而且表现似乎比官方给的预期更令人惊喜。在提到 Kimi K2 的帖子中,充斥着“不输 Claude 4 但便宜 80%!、唯一超越 R1 的存在…”等此类评价。

与 Claude Code 能力相当,但便宜了80%

首先,不少用户踊跃测试了 Kimi K2 的真实编码能力,采取的方式为:直接将该模型连接到了 Claude Code。可以这样操作的原因是,Kimi K2 的 API 服务具备强通用性,能够兼容 OpenAI 和 Anthropic 两种 API 格式,也可以与各类框架良好兼容。

一位开发者在对比了模型性能情况与 token 价格后,得出的结果是:K2 的编码能力卓越,基本与 Claude 4 相当,但只需花费 Claude 4 的 20% 成本,唯一缺点是 API 有点慢。

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

多年 AI 行业从业者刘小排在使用「K2 版 Claude Code」后的感受则是:“Kimi K2 驱动下的 Claude Code,编程能力和原版 Claude Code 差别不大,能平替 85%。 如果用 DeepSeek 驱动,我认为只能平替 60%。”

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

有网友这样评价,“Claude Code 可以用 Kimi K2 的模型,这件事就很有意思。它证明了 Claude 这套 Agent 架构,基本可以适用于任何模型,理论上也支持 Gemini、Grok、o3。选择永远都在用户手里,而不在大模型公司的手里。”

此外,对于 Python 数据分析任务,Kimi K2 也能一次性搞定,还可以生成一个网站。“成本仅需几分钱”,测试用户表示。

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

还有用户分享了用 Kimi K2 几乎写完一整个前端组件库的案例,且过程完全由该模型自主实现,没有引用任何外部组件库。“只用非常简单的提示词,但是出来的效果超级好!”

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

其次,针对月之暗面强调的 Agent 工具调用能力,同样有不少用户进行了对比测试。

前 Anthropic AI 工程师、MagicPath 创始人兼 CEO Pietro Schirano 对 Kimi K2 的评价很高:“自 Claude 3.5 Sonnet 之后,它是第一款让我在生产环境中使用时感到放心的模型,也是第一个我觉得可以用作代理循环的非 Anthropic 模型。”他表示,Kimi K2 在工具调用和智能体循环方面表现极为出色,能够并行且可靠地调用多个工具,还具备“知道何时停止”的能力。

与此同时,有测试表明,Kimi-K2-Instruct 在创意写作、挑战性角色扮演两方面的评测指标上双双拿下榜单第一,并超越了 o3。有网友为月之暗面点赞称,“这是开源模型的又一胜利,太棒了。”“K2 的中文创意写作能力应该是唯一的超越 R1 的存在。”还有用户这样反馈道。

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

架构和 DeepSeek 高度“撞车”?
那么,如此“高性价比”的性能提升背后,Kimi 做了哪些技术创新呢?

据月之暗面介绍,Kimi K2 的预训练阶段使用 MuonClip 优化器实现万亿参数模型的稳定高效训练,在人类高质量数据成为瓶颈的背景下,有效提高 Token 利用效率,找到新的 Scaling 空间。其他关键技术包括大规模 Agentic Tool Use 数据合成和引入自我评价机制的通用强化学习等。

“严格来说,在预训练数据集近似有限且模型配置固定的情况下,token 利用率更高的优化器能产生更多智能。我们此前开发的 Moonlight 项目已证明,用于大语言模型训练时, Muon 优化器的性能显著优于广泛使用的 AdamW 优化器。”

值得注意的是,Kimi K2 与 DeepSeek V3 的架构高度相似,区别则在于:“注意力头数量更少、专家数量更多。”

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​

对此,月之暗面也在技术博客中作了详细解释。其称,Kimi K2 的设计目的是进一步扩展 Moonlight,其架构与 DeepSeek-V3 相似。基于缩放律分析,他们减少了注意头的数量以提高长上下文效率,并增加了 MoE 的稀疏性以提高 token 效率。

在扩展过程中,他们还遇到一个持续的挑战:由爆炸性注意力 logit 引起的训练不稳定性,这个问题在我们的实验中更频繁地出现在 Muon 上,而在 AdamW 上则较少出现;现有的解决方案,如 logit 软上限和查询 – 键归一化,被发现不足以解决问题。为此,他们才决定引入了 MuonClip 优化器,通过其提出的 qk-clip 技术改进 Muon。具体来说,qk-clip 通过在 Muon 更新后直接重新调整查询和键投影的权重矩阵来稳定训练,从而在源头上控制注意力 logit 的规模。

这已经是月之暗面与 DeepSeek 第三次在技术研究方向上“撞车”了。今年 2 月,两家公司都围绕挑战 Transformer 架构最核心的注意力机制方面,各自提出了在核心思想上非常一致的架构。到 4 月,又分别推出了用于数学定理证明的大模型,且在技术报告中都提到了强化学习。

至于 Kimi K2 增强的智能体能力,源于两个重要方面:大规模智能体数据合成与通用强化学习。据介绍,为了让模型掌握复杂的工具使用能力,他们借鉴 ACEBench 开发了一套全面的流程,可大规模模拟现实世界中的工具使用场景,系统性地扩展了包含数千种工具的数百个领域(既包括真实的 MCP(模型上下文协议)工具,也包括合成工具),随后生成了具备多样化工具集的数百个智能体。

据悉,DeepSeek 0 广告投放却爆火后,月之暗面就叫停了在各平台的大面积投流,之后将重心转到基础模型上。此前有消息称,其对 AI 医疗产品进行了布局,用于提升旗下产品 Kimi 在专业领域的搜索质量,并且探索 Agent 等产品方向,发布了 Deep Research 等。

在 Kimi K2 发布的当晚,其联合创始人张宇韬在朋友圈转发文章时直言,”Make Kimi Great Again”。显然,月之暗面内部对 Kimi K2 寄予了厚望,并将其视作在 DeepSeek 冲击 AI 圈后、再度站稳脚跟的关键成果。

嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!

微信打赏二维码 微信扫一扫

支付宝打赏二维码 支付宝扫一扫

版权: 转载请注明出处:https://www.ai-blog.cn/19039.html

相关推荐

​​Kimi K2两天封神!成本碾压Claude 4,架构神似DeepSeek​: 近日,国内大模型独角兽月之暗面发布…

小智头像图片
123

​​AI编程冲击下,程序员如何自保?IDEA张磊:底层能力是护城河​​: 多模态智能体的新时代 InfoQ:…

小智头像图片
120

飞渡科技发布“峥嵘大模型”: 飞渡科技推出“峥嵘大模型”。在 City3D 等国际评测中,其建模精度与语…

小智头像图片
94

飞书发布业界首个 AI 应用成熟度模型: 在 2025 飞书未来无限大会上,飞书发布了业界首个 AI 应用…

小智头像图片
36

字节首款 AI 医疗助手 App“小荷 AI 医生”上线: 7 月 9 日消息,字节首个 AI 医疗助手独立 App“小…

小智头像图片
38

7 月 7 日,阿里云宣布,通义正式开源网络智能体 WebSailor。目前 WebSailor 的构建方案及部分数据…

小智头像图片
89

​​OpenAI杀入浏览器!ChatGPT上线”一起学习”​​: 7 月 10 日消息,据报道,OpenAI 正…

小智头像图片
121

​​谷歌Gemini接入Veo 3!照片秒变带声视频​​: 7 月 10 日消息,谷歌今天在 Gemini 应用中上线了基…

小智头像图片
65
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力原创内容

快速提升站内名气成为大牛

扫描二维码

手机访问本站

二维码
vip弹窗图片