AI快讯

Kimi首个Agent内测，性能惊艳超越OpenAI、Gemini

小智 AI动态资讯 2025年06月22日

0 收藏 0 点赞 216 浏览 1084 个字

摘要 :

Kimi首个Agent内测，性能惊艳超越OpenAI、Gemini：近日，人工智能领域迎来重大突破，月之暗面Kimi发布的首个Agent产品Kimi-Researcher（深度研究）开启小范围灰度测试……

哈喽！伙伴们，我是小智，你们的AI向导。欢迎来到每日的AI学习时间。今天，我们将一起深入AI的奇妙世界，探索“Kimi首个Agent内测，性能惊艳超越OpenAI、Gemini”，并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知，只需唤醒你的潜能！”跟着小智的步伐，我们终将学有所成，学以致用，并发现自身的更多可能性。话不多说，现在就让我们开始这场激发潜能的AI学习之旅吧。

Kimi首个Agent内测，性能惊艳超越OpenAI、Gemini：

近日，人工智能领域迎来重大突破，月之暗面Kimi发布的首个Agent产品Kimi-Researcher（深度研究）开启小范围灰度测试，引发行业广泛关注。

新一代Agent模型：技术实力强劲
Kimi-Researcher是基于端到端自主强化学习（end-to-end agentic RL）技术训练的新一代Agent模型。这一先进技术赋予了Kimi-Researcher强大的自主学习和推理能力，使其能够在复杂的任务中展现出卓越的性能。

HLE测试：脱颖而出成焦点
在专为AI设计的高难度HLE（人类最后一次考试）测试中，Kimi-Researcher的表现堪称惊艳。其Pass@1准确率达到26.9%，Pass@4准确率达到40.17%。这一成绩超过了Claude 4 Opus的10.7%、Gemini 2.5 Pro的21.6%以及OpenAI Deep Research的26.6%，并与Gemini – Pro的Deep Research Agent打平，成为目前已知的最高水平之一。

功能特性：自主规划超高效
Kimi-Researcher对于每一个问题，都会自主规划任务执行流程，最终交付完整结果。在理解问题时会主动反问，构建更清晰的问题空间。每个任务平均进行23步推理，自主梳理并解决需求。而且，每个任务平均规划74个关键词，找到206个网址，由模型判断并筛选出信息质量最高的前3.2%内容，剔除冗余、低质信息。还能自主调用浏览器、代码等工具，处理原始数据、自动生成分析结论，端到端完成交付。

交付成果：报告详尽可视化
用户使用Kimi-Researcher最终将收到两个交付成果。一是报告平均长度在万字以上，平均引用约26个高质量、可溯源的信源，所有引用都内嵌在正文中，点击即可跳转，并高亮原文，便于验证与追溯。二是可交互、可分享的动态可视化报告，通过结构化排版、思维导图，让趋势、异常等重要信息一眼可见，无需阅读全文，也能迅速把握整体结构与核心结论，还支持在线生成链接并分享，方便展示。

开源计划：推动行业新探索
月之暗面表示，Kimi-Researcher基础预训练模型及强化学习后的模型将逐步开源。这一举措无疑将为Agent强化学习方向的探索提供强大的助力，吸引更多的开发者和研究人员加入到相关的研究和创新中来，推动整个行业的发展。

此次Kimi-Researcher的推出，展示了月之暗面在人工智能领域的深厚技术积累和创新能力。随着其后续的不断优化和开源计划的推进，有望为人工智能的发展带来更多的可能性，让我们拭目以待。

嘿，伙伴们，今天我们的AI探索之旅已经圆满结束。关于“Kimi首个Agent内测，性能惊艳超越OpenAI、Gemini”的内容已经分享给大家了。感谢你们的陪伴，希望这次旅程让你对AI能够更了解、更喜欢。谨记，精准提问是解锁AI潜能的钥匙哦！如果有小伙伴想要了解学习更多的AI知识，请关注我们的官网“AI智研社”，保证让你收获满满呦！

赏

微信打赏二维码微信扫一扫