AI快讯

Stable Diffusion团队再发力！FLUX.1 Kontext颠覆图像生成

小智 AI动态资讯 2025年05月30日

0 收藏 0 点赞 63 浏览 2846 个字

摘要 :

Stable Diffusion团队再发力！FLUX.1 Kontext颠覆图像生成： 5月30日，由Stable Diffusion缔造者团队创立的德国初创公司Black Forest Labs（BFL，黑暗森林实验室）……

哈喽！伙伴们，我是小智，你们的AI向导。欢迎来到每日的AI学习时间。今天，我们将一起深入AI的奇妙世界，探索“Stable Diffusion团队再发力！FLUX.1 Kontext颠覆图像生成”，并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知，只需唤醒你的潜能！”跟着小智的步伐，我们终将学有所成，学以致用，并发现自身的更多可能性。话不多说，现在就让我们开始这场激发潜能的AI学习之旅吧。

Stable Diffusion团队再发力！FLUX.1 Kontext颠覆图像生成：

5月30日，由Stable Diffusion缔造者团队创立的德国初创公司Black Forest Labs（BFL，黑暗森林实验室）正式发布全新图像生成模型FLUX.1 Kontext。这款“能读会改”的生成流模型，不仅支持文本与图像双输入的上下文生成，更以3-5秒的1MP分辨率推理速度、跨轮次编辑一致性，重新定义了创意工作流的“交互边界”。从企业级工具到个人创作者，FLUX.1 Kontext正以“迭代式编辑”的颠覆性能力，向MidJourney、Adobe Firefly等行业巨头发起挑战。

Stable Diffusion团队再发力！FLUX.1 Kontext颠覆图像生成

一、FLUX.1 Kontext的四大“颠覆式”能力：从“生成”到“对话式编辑”

与传统文生图模型（如Stable Diffusion、MidJourney）仅支持“文本→图像”单向生成不同，FLUX.1 Kontext的核心突破在于“上下文感知”与“多轮编辑”能力。BFL联合创始人兼CEO Robin Rombach在发布会上强调：“我们将图像生成与编辑统一在流匹配架构中，用户不再需要‘推翻重来’，而是能像修改文档一样‘逐句调整’图像。”

具体来看，FLUX.1 Kontext的四大亮点直击行业痛点：

1. 双输入上下文生成：文本+图像，告别“从零开始”
用户可同时输入文本提示（如“添加小绿龙”）和参考图像（如人物原图），模型能精准理解“在人物肩膀放小绿龙”的需求，生成与原图风格、光影、比例一致的新图像。测试案例显示，输入一张“穿白衬衫的男性”照片并要求“添加红色领带”，Kontext生成的领带颜色、褶皱与原图光照完美匹配，而传统模型常出现“领带浮于表面”的穿帮问题。

2. 跨轮次编辑一致性：多步修改不“漂移”
传统模型在多轮编辑（如先改背景再调人物）中易出现“视觉漂移”（人物表情、服饰细节变化），而FLUX.1 Kontext通过流匹配架构，能“记住”每一步修改的上下文，确保角色、场景元素的一致性。用户实测：对一张“海边少女”图先后执行“添加太阳镜”“调整海浪高度”“更换沙滩椅颜色”三次编辑，最终图像的少女五官、发型与原图吻合度超95%。

3. 局部编辑“不连坐”：改一处，其他部分“稳如磐石”
模型支持精准局部编辑，修改某一区域（如人物手部）时，其他区域（如背景、面部）不受影响。BFL展示的案例中，用户要求“将照片中咖啡杯从白色换成蓝色”，Kontext仅调整杯子颜色，杯口的咖啡渍、桌面的反光细节均保留原样，而MidJourney同类操作常导致桌面纹理模糊。

4. 1MP分辨率下3-5秒推理：创意“不卡壳”
FLUX.1 Kontext在1024×1024分辨率（1MP）下的推理速度达3-5秒，较传统扩散模型（如Stable Diffusion XL需10-15秒）快2-3倍。这意味着用户可在创意过程中“即时预览”修改效果，大幅提升迭代效率——设计师测试反馈：“以前调一个细节要等半分钟，现在5秒就能看到结果，一天能多完成30%的设计稿。”

二、流匹配架构：颠覆扩散模型的“技术基因”

FLUX.1 Kontext的能力突破，源于其底层采用的“流匹配（Flow Matching）”架构，与Stable Diffusion依赖的“扩散（Diffusion）”模型有着本质差异。

传统扩散模型通过“加噪-去噪”过程生成图像：先给原图添加大量噪声，再通过多步迭代“去噪”还原。这种方法虽能生成高保真图像，但多轮编辑时因“去噪路径”被打断，易导致细节丢失；且推理时间随分辨率提升呈指数级增长。

流匹配模型则通过学习“连续数据流”的变换路径，直接在噪声与真实数据间建立映射。BFL在技术博客中解释：“流匹配相当于为图像编辑画了一张‘动态地图’，模型知道如何从任意起点（原图或中间修改版本）平滑过渡到目标状态（用户需求），无需反复‘加噪-去噪’。” 这一特性使FLUX.1 Kontext在多轮编辑、局部修改中保持一致性，同时大幅降低推理延迟。

三、BFL的“技术底气”：Stable Diffusion原班团队的“再出发”

FLUX.1 Kontext的颠覆性，离不开其背后团队的“基因优势”。BFL由Stable Diffusion核心开发者Robin Rombach联合12位前Stability AI同事创立，团队成员包括Stable Diffusion架构师Patrick Esser、原Stability AI工程副总裁Andreas Blattmann等。

2021年，Rombach团队在资源受限的条件下（仅用几块小型GPU）开发出“潜在生成模型”，通过压缩图像细节提升效率，为Stable Diffusion的“单GPU运行”奠定基础。2022年，Stability AI将该技术商业化，Stable Diffusion凭借“开源+轻量”迅速成为文生图领域的“现象级工具”。

但Stability AI后续因内部管理问题（如融资争议、核心成员流失）陷入动荡，Rombach于2024年3月离职，并于同年8月创立BFL。“我们希望摆脱大公司的官僚主义，专注技术本身。”Rombach在Slush创业会议上表示。目前，BFL已获General Catalyst、a16z等顶级风投3100万美元种子轮投资，团队规模30人（12人来自Stability AI），正以“小而精”的姿态重新定义图像生成赛道。

四、市场反响与行业影响：从个人创作到企业级应用的“效率革命”

FLUX.1 Kontext的发布已引发市场热烈反响。目前，Pro版与Max版已在KreaAI、Freepik、Lightricks等平台上线，Dev版（12B参数开放权重模型）即将开启内测。

个人创作者：X平台用户@TechArtist实测后评价：“10秒内根据旧图生成职业头像，细节几可乱真！左侧是实拍图，右侧是Kontext生成的，同事完全没看出区别。”另一用户测试局部编辑功能：“输入‘在肩膀放小绿龙’，模型精准定位位置，龙的鳞片、光影与原图完美融合，这是其他模型做不到的。”

企业用户：某广告公司设计总监透露：“以前修改产品图需反复调整，现在用Kontext的多轮编辑功能，从‘白背景产品图’到‘户外场景展示’仅需3次修改，效率提升50%。”BFL数据显示，企业客户试用后，创意流程耗时从平均2小时缩短至40分钟。

行业分析师指出：“FLUX.1 Kontext的出现，标志着图像生成从‘一次性创作’进入‘迭代式对话’时代。随着流匹配架构的普及，未来的AI图像工具可能像PS一样‘可编辑、可回溯’，彻底改变创意工作流。”

从Stable Diffusion到FLUX.1 Kontext，Robin Rombach团队用技术证明：图像生成的未来，不在“更华丽的单次输出”，而在“更灵活的交互体验”。当FLUX.1 Kontext以“上下文感知+快速编辑”重新定义行业标准，一场由“流匹配”驱动的图像生成革命，或许才刚刚开始。

嘿，伙伴们，今天我们的AI探索之旅已经圆满结束。关于“Stable Diffusion团队再发力！FLUX.1 Kontext颠覆图像生成”的内容已经分享给大家了。感谢你们的陪伴，希望这次旅程让你对AI能够更了解、更喜欢。谨记，精准提问是解锁AI潜能的钥匙哦！如果有小伙伴想要了解学习更多的AI知识，请关注我们的官网“AI智研社”，保证让你收获满满呦！

赏

微信打赏二维码微信扫一扫