小智头像图片
AI动态资讯 2025年06月28日
0 收藏 0 点赞 86 浏览 1408 个字
摘要 :

腾讯混元首开源!推理模型独霸Agent工具+长文理解: 6 月 27 日,腾讯混元宣布开源首个混合推理 MoE 模型 Hunyuan-A13B,总参数 80B,激活参数仅 13B,效果比肩同等架构……

哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“腾讯混元首开源!推理模型独霸Agent工具+长文理解”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。

腾讯混元首开源!推理模型独霸Agent工具+长文理解

腾讯混元首开源!推理模型独霸Agent工具+长文理解:

6 月 27 日,腾讯混元宣布开源首个混合推理 MoE 模型 Hunyuan-A13B,总参数 80B,激活参数仅 13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。模型已经在 Github 和 Huggingface 等开源社区上线,同时模型 API 也在腾讯云官网正式上线,支持快速接入部署。

开源地址:

Github :https://github.com/Tencent-Hunyuan

HuggingFace:https://huggingface.co/tencent

据介绍,这是业界首个 13B 级别的 MoE 开源混合推理模型,基于先进的模型架构,Hunyuan-A13B 表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在 Agent 工具调用和长文能力上有突出表现。

腾讯混元首开源!推理模型独霸Agent工具+长文理解

_* 加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分 _

对于时下热门的大模型 Agent 能力,腾讯混元建设了一套多 Agent 数据合成框架,接入了 MCP、沙箱、大语言模型模拟等多样的环境,并且通过强化学习让 Agent 在多种环境里进行自主探索与学习,进一步提升了 Hunyuan-A13B 的效果。

在长文方面,Hunyuan-A13B 支持 256K 原生上下文窗口,在多个长文数据集中取得了优异的成绩。

腾讯混元首开源!推理模型独霸Agent工具+长文理解
腾讯混元首开源!推理模型独霸Agent工具+长文理解

在实际使用场景中,Hunyuan-A13B 模型可以根据需要选择思考模式,快思考模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务;慢思考涉及更深、更全面的推理步骤,如反思和回溯。这种融合推理模式优化了计算资源分配,使用户能够通过加 think/no_think 切换思考模式,在效率和特定任务准确性之间取得平衡。

腾讯混元首开源!推理模型独霸Agent工具+长文理解

Hunyuan-A13B 模型对个人开发者较为友好,在严格条件下,只需要 1 张中低端 GPU 卡即可部署。目前,Hunyuan-A13B 已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐是前沿开源模型的 2 倍以上。

Hunyuan-A13B 集合了腾讯混元在模型预训练、后训练等多个环节的创新技术,这些技术共同增强了其推理性能、灵活性和推理效率。

预训练环节,Hunyuan-A13B 训练了 20T tokens 的语料,覆盖了多个领域。高质量的语料显著提升了模型通用能力。此外,在模型架构上,腾讯混元团队通过系统性分析,建模与验证,构建了适用于 MoE 架构的 Scaling Law 联合公式。这一发现完善了 MoE 架构的 Scaling Law 理论体系,并为 MoE 架构设计提供了可量化的工程化指导,也极大的提升了模型预训练的效果。

后训练环节,Hunyuan-A13B 采用了多阶段的训练方式,提升了模型的推理能力,同时兼顾了模型创作、理解、Agent 等通用能力。

腾讯混元首开源!推理模型独霸Agent工具+长文理解
图:Hunyuan-A13B 后训练四个步骤

为更好的提升大语言模型能力,腾讯混元也开源了两个新的数据集,以填补行业内相关评估标准的空白。其中,ArtifactsBench 用于弥合大语言模型代码生成评估中的视觉与交互鸿沟,构建了一个包含 1825 个任务的新基准,涵盖了从网页开发、数据可视化到交互式游戏等九大领域,并按难度分级以全面评估模型的能力;C3-Bench 针对 Agent 场景模型面临的三个关键挑战:规划复杂的工具关系、处理关键的隐藏信息以及动态路径决策,设计了 1024 条测试数据,以发现模型能力的不足。

嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“腾讯混元首开源!推理模型独霸Agent工具+长文理解”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!

微信打赏二维码 微信扫一扫

支付宝打赏二维码 支付宝扫一扫

版权: 转载请注明出处:https://www.ai-blog.cn/18709.html

相关推荐

平扫CT+AI攻克胃癌早筛!浙肿达摩院GRAPE登顶Nature子刊: 据统计,我国有 30% 多的胃癌(GC)病人…

小智头像图片
111

腾讯X Lab 韩磊即将离职,将加入诺亦腾科技: AI 科技评论近日独家获悉,腾讯具身智能技术中心副总…

小智头像图片
63

清华系Agent框架爆火!1.9k星叫板’消灭Prompt: 随着大模型能力的突破,“可调用工具的智能体…

小智头像图片
44

腾讯混元首开源!推理模型独霸Agent工具+长文理解: 6 月 27 日,腾讯混元宣布开源首个混合推理 Mo…

小智头像图片
86

OpenAI四虎将叛逃Meta!亿元奖金终落地: 近日,据外媒报道,Meta 平台公司已招募四名前 OpenAI 研…

小智头像图片
134

日增15k星!Gemini CLI代码生成暴打Claude,Cursor慌了: 今天,谷歌正式发布了 Gemini CLI ,这是…

小智头像图片
86

大模型流水线暗涌!AI Infra工程师破局指南: Infra 虽然是看不见的“底座”,但它却承担着支撑整个…

小智头像图片
52

5年估值百亿!又一AI芯片独角兽冲刺国产GPU第一股: 6 月 23 日,中国证监会网站显示,国产 GPU 龙…

小智头像图片
69
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力原创内容

快速提升站内名气成为大牛

扫描二维码

手机访问本站

二维码
vip弹窗图片