小智头像图片
AI动态资讯 2025年06月22日
0 收藏 0 点赞 139 浏览 1084 个字
摘要 :

Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini: 近日,人工智能领域迎来重大突破,月之暗面Kimi发布的首个Agent产品Kimi-Researcher(深度研究)开启小范围灰度测试……

哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。

Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini

Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini:

近日,人工智能领域迎来重大突破,月之暗面Kimi发布的首个Agent产品Kimi-Researcher(深度研究)开启小范围灰度测试,引发行业广泛关注。

新一代Agent模型:技术实力强劲
Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型。这一先进技术赋予了Kimi-Researcher强大的自主学习和推理能力,使其能够在复杂的任务中展现出卓越的性能。

HLE测试:脱颖而出成焦点
在专为AI设计的高难度HLE(人类最后一次考试)测试中,Kimi-Researcher的表现堪称惊艳。其Pass@1准确率达到26.9%,Pass@4准确率达到40.17%。这一成绩超过了Claude 4 Opus的10.7%、Gemini 2.5 Pro的21.6%以及OpenAI Deep Research的26.6%,并与Gemini – Pro的Deep Research Agent打平,成为目前已知的最高水平之一。

功能特性:自主规划超高效
Kimi-Researcher对于每一个问题,都会自主规划任务执行流程,最终交付完整结果。在理解问题时会主动反问,构建更清晰的问题空间。每个任务平均进行23步推理,自主梳理并解决需求。而且,每个任务平均规划74个关键词,找到206个网址,由模型判断并筛选出信息质量最高的前3.2%内容,剔除冗余、低质信息。还能自主调用浏览器、代码等工具,处理原始数据、自动生成分析结论,端到端完成交付。

交付成果:报告详尽可视化
用户使用Kimi-Researcher最终将收到两个交付成果。一是报告平均长度在万字以上,平均引用约26个高质量、可溯源的信源,所有引用都内嵌在正文中,点击即可跳转,并高亮原文,便于验证与追溯。二是可交互、可分享的动态可视化报告,通过结构化排版、思维导图,让趋势、异常等重要信息一眼可见,无需阅读全文,也能迅速把握整体结构与核心结论,还支持在线生成链接并分享,方便展示。

开源计划:推动行业新探索
月之暗面表示,Kimi-Researcher基础预训练模型及强化学习后的模型将逐步开源。这一举措无疑将为Agent强化学习方向的探索提供强大的助力,吸引更多的开发者和研究人员加入到相关的研究和创新中来,推动整个行业的发展。

此次Kimi-Researcher的推出,展示了月之暗面在人工智能领域的深厚技术积累和创新能力。随着其后续的不断优化和开源计划的推进,有望为人工智能的发展带来更多的可能性,让我们拭目以待。

嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!

微信打赏二维码 微信扫一扫

支付宝打赏二维码 支付宝扫一扫

版权: 转载请注明出处:https://www.ai-blog.cn/18650.html

相关推荐

Sutton上海开讲:经验数据时代来了: 7 月 26 日,WAIC 2025 主论坛,现代强化学习之父 Rich Sutto…

小智头像图片
99

薄列峰入混元:腾讯再收AI王牌: 7 月 26 日,AI 科技评论独家获悉:原通义实验室应用视觉一号位薄…

小智头像图片
192

Hinton上海首讲:数字永生VS养老虎: 7 月 26 日,2025 世界人工智能大会(WAIC)开幕,77 岁的“深…

小智头像图片
100

阶跃星辰Step 3开源:321B MoE霸榜: 7 月 25 日 WAIC 2025 开幕前夜,上海 AI 独角兽阶跃星辰放了…

小智头像图片
103

商汤单拆具身智能公司抢滩: 7 月 23 日,商汤科技低调官宣:把“机器人大脑”业务整块拉出来,成立…

小智头像图片
81

Perplexity闪电融资1亿刀硬刚Chrome: 7 月 21 日,AI 搜索新贵 Perplexity 宣布完成 1 亿美元“闪…

小智头像图片
39

周鸿祎:DeepSeek官网掉量不心疼: “流量降七成?梁文锋压根儿没把 To C 当回事。”7 月 23 日,360…

小智头像图片
161

亚马逊上海AI院关门真相: 7 月 23 日,AWS 上海 AI 研究院首席科学家王敏捷一条朋友圈炸圈:“刚收…

小智头像图片
97
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力原创内容

快速提升站内名气成为大牛

扫描二维码

手机访问本站

二维码
vip弹窗图片