ceoedu-pro主题已启用,当前站点还没有验证正版主题授权,暂不可使用 前往授权激活 获取正版授权
Meta发布Llama 4:重构架构首次采用MoE技术 - AI智研社
小智头像图片
AI动态资讯 2025年04月6日
0 收藏 0 点赞 161 浏览 863 个字
摘要 :

Meta发布Llama 4:重构架构首次采用MoE技术: Meta 今日发布了首批 Llama 4 系列模型:Llama 4 Scout 和 Llama 4 Maverick。 据报道,此前 DeepSeek 发布的开源模型(如……

哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“Meta发布Llama 4:重构架构首次采用MoE技术”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。

Meta发布Llama 4:重构架构首次采用MoE技术

Meta发布Llama 4:重构架构首次采用MoE技术:

Meta 今日发布了首批 Llama 4 系列模型:Llama 4 Scout 和 Llama 4 Maverick。

据报道,此前 DeepSeek 发布的开源模型(如 R1 和 V3)在性能上与 Meta 之前的旗舰 Llama 模型相当甚至更优,促使 Meta 加快了 Llama 4 的研发节奏。为应对竞争,Meta 内部曾设立“作战室”以深入研究 DS 如何实现更低成本的模型部署与运行。如今,Llama 4 与 V3 在性能上的对比依然是业内关注的焦点。

Meta GenAI 负责人在 X 上表示,本次发布标志着 Llama 系列的全面重构完成。他表示,此次推出的是 Llama 4 系列中首批开源模型,代表了该系列发展的又一重要里程碑。本次发布的主要亮点有:

Llama 4 系列在架构层面进行了全面升级,采用先进的专家混合(MoE,Mixture-of-Experts)架构,并在原生多模态任务上进行了联合训练。此次发布包括 Llama 4 Scout 和 Llama 4 Maverick,同时也首次预览了更强大的 Llama 4 Behemoth。

Llama 4 Scout 是目前性能最强的小型模型,拥有 170 亿活跃参数和 16 个专家模块。该模型具备出色的推理速度,原生支持多模态,具备强大的智能能力,支持业界领先的 1000 万以上 token 上下文窗口,并且可在单张 GPU 上运行。

Llama 4 Maverick 是当前同类中最强的多模态模型,在多个公开评测中超越 GPT-4o 和 Gemini 2.0 Flash,在推理和编程任务上与 DeepSeek v3 表现相当,同时活跃参数不到其一半。该模型在性能与成本比方面表现出色,其实验性对话版本在 LMArena 榜单中获得 1417 的 ELO 分数,并且也可在单机环境中运行。

Meta 还预览了 Llama 4 系列中性能最强的模型 —— Llama 4 Behemoth,该模型在多个 STEM 基准测试中超过 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。Llama 4 Behemoth 目前仍在训练中,Meta 表示将持续披露其更多细节。

嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“Meta发布Llama 4:重构架构首次采用MoE技术”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!

微信打赏二维码 微信扫一扫

支付宝打赏二维码 支付宝扫一扫

版权: 转载请注明出处:https://www.ai-blog.cn/12005.html

相关推荐

Sutton上海开讲:经验数据时代来了: 7 月 26 日,WAIC 2025 主论坛,现代强化学习之父 Rich Sutto…

小智头像图片
83

薄列峰入混元:腾讯再收AI王牌: 7 月 26 日,AI 科技评论独家获悉:原通义实验室应用视觉一号位薄…

小智头像图片
177

Hinton上海首讲:数字永生VS养老虎: 7 月 26 日,2025 世界人工智能大会(WAIC)开幕,77 岁的“深…

小智头像图片
85

阶跃星辰Step 3开源:321B MoE霸榜: 7 月 25 日 WAIC 2025 开幕前夜,上海 AI 独角兽阶跃星辰放了…

小智头像图片
88

商汤单拆具身智能公司抢滩: 7 月 23 日,商汤科技低调官宣:把“机器人大脑”业务整块拉出来,成立…

小智头像图片
65

Perplexity闪电融资1亿刀硬刚Chrome: 7 月 21 日,AI 搜索新贵 Perplexity 宣布完成 1 亿美元“闪…

小智头像图片
25

周鸿祎:DeepSeek官网掉量不心疼: “流量降七成?梁文锋压根儿没把 To C 当回事。”7 月 23 日,360…

小智头像图片
146

亚马逊上海AI院关门真相: 7 月 23 日,AWS 上海 AI 研究院首席科学家王敏捷一条朋友圈炸圈:“刚收…

小智头像图片
82
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力原创内容

快速提升站内名气成为大牛

扫描二维码

手机访问本站

二维码
vip弹窗图片