小智头像图片
AI动态资讯 2025年06月22日
0 收藏 0 点赞 125 浏览 1084 个字
摘要 :

Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini: 近日,人工智能领域迎来重大突破,月之暗面Kimi发布的首个Agent产品Kimi-Researcher(深度研究)开启小范围灰度测试……

哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。

Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini

Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini:

近日,人工智能领域迎来重大突破,月之暗面Kimi发布的首个Agent产品Kimi-Researcher(深度研究)开启小范围灰度测试,引发行业广泛关注。

新一代Agent模型:技术实力强劲
Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型。这一先进技术赋予了Kimi-Researcher强大的自主学习和推理能力,使其能够在复杂的任务中展现出卓越的性能。

HLE测试:脱颖而出成焦点
在专为AI设计的高难度HLE(人类最后一次考试)测试中,Kimi-Researcher的表现堪称惊艳。其Pass@1准确率达到26.9%,Pass@4准确率达到40.17%。这一成绩超过了Claude 4 Opus的10.7%、Gemini 2.5 Pro的21.6%以及OpenAI Deep Research的26.6%,并与Gemini – Pro的Deep Research Agent打平,成为目前已知的最高水平之一。

功能特性:自主规划超高效
Kimi-Researcher对于每一个问题,都会自主规划任务执行流程,最终交付完整结果。在理解问题时会主动反问,构建更清晰的问题空间。每个任务平均进行23步推理,自主梳理并解决需求。而且,每个任务平均规划74个关键词,找到206个网址,由模型判断并筛选出信息质量最高的前3.2%内容,剔除冗余、低质信息。还能自主调用浏览器、代码等工具,处理原始数据、自动生成分析结论,端到端完成交付。

交付成果:报告详尽可视化
用户使用Kimi-Researcher最终将收到两个交付成果。一是报告平均长度在万字以上,平均引用约26个高质量、可溯源的信源,所有引用都内嵌在正文中,点击即可跳转,并高亮原文,便于验证与追溯。二是可交互、可分享的动态可视化报告,通过结构化排版、思维导图,让趋势、异常等重要信息一眼可见,无需阅读全文,也能迅速把握整体结构与核心结论,还支持在线生成链接并分享,方便展示。

开源计划:推动行业新探索
月之暗面表示,Kimi-Researcher基础预训练模型及强化学习后的模型将逐步开源。这一举措无疑将为Agent强化学习方向的探索提供强大的助力,吸引更多的开发者和研究人员加入到相关的研究和创新中来,推动整个行业的发展。

此次Kimi-Researcher的推出,展示了月之暗面在人工智能领域的深厚技术积累和创新能力。随着其后续的不断优化和开源计划的推进,有望为人工智能的发展带来更多的可能性,让我们拭目以待。

嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“Kimi首个Agent内测,性能惊艳超越OpenAI、Gemini”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!

微信打赏二维码 微信扫一扫

支付宝打赏二维码 支付宝扫一扫

版权: 转载请注明出处:https://www.ai-blog.cn/18650.html

相关推荐

​​钉钉首款行业大模型落地!妇科专业版准确率超90%​​: 近日,钉钉企业专属 AI 平台上成功训练出了…

小智头像图片
75

​​Cursor+MCP暴雷!一句话攻破数据库,竟是架构缺陷​: 安全研究团队 General Analysis 日前警告称…

小智头像图片
53

Grok 4登顶!马斯克放话”编程碾压”,20万N卡年赚47亿​: 时隔 5 个月,Grok 终于再次“…

小智头像图片
41

AGICamp 002期AI应用榜出炉!AiPPT/SwiftAgent领跑​: AGICamp 第 002 周 AI 应用榜来了,相比于第…

小智头像图片
111

​​”稚晖君”砸21亿抢跑!智元机器人冲刺人形第一股​: 北京时间 7 月 8 日晚,智元机器…

小智头像图片
80

​​22岁印度少年业余项目被Groq相中!用户飙6万​: 在人工智能技术蓬勃发展的时代,搜索变得比以前…

小智头像图片
43

饿了么创始元老归来!携7亿估值AI公司再战江湖​: 近日,一家总部位于新加坡的 AI 应用开发商 Orio…

小智头像图片
97

国脉科技发布居家养老场景 AI 智能体: 在人口老龄化问题日益凸显的当下,养老成为了全社会关注的…

小智头像图片
144
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力原创内容

快速提升站内名气成为大牛

扫描二维码

手机访问本站

二维码
vip弹窗图片