小智头像图片
AI动态资讯 2025年05月30日
0 收藏 0 点赞 63 浏览 2846 个字
摘要 :

​​Stable Diffusion团队再发力!FLUX.1 Kontext颠覆图像生成​​: 5月30日,由Stable Diffusion缔造者团队创立的德国初创公司Black Forest Labs(BFL,黑暗森林实验室)……

哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“​​Stable Diffusion团队再发力!FLUX.1 Kontext颠覆图像生成​​”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。

​​Stable Diffusion团队再发力!FLUX.1 Kontext颠覆图像生成​​

​​Stable Diffusion团队再发力!FLUX.1 Kontext颠覆图像生成​​:

5月30日,由Stable Diffusion缔造者团队创立的德国初创公司Black Forest Labs(BFL,黑暗森林实验室)正式发布全新图像生成模型FLUX.1 Kontext。这款“能读会改”的生成流模型,不仅支持文本与图像双输入的上下文生成,更以3-5秒的1MP分辨率推理速度、跨轮次编辑一致性,重新定义了创意工作流的“交互边界”。 从企业级工具到个人创作者,FLUX.1 Kontext正以“迭代式编辑”的颠覆性能力,向MidJourney、Adobe Firefly等行业巨头发起挑战。

​​Stable Diffusion团队再发力!FLUX.1 Kontext颠覆图像生成​​

一、FLUX.1 Kontext的四大“颠覆式”能力:从“生成”到“对话式编辑”

与传统文生图模型(如Stable Diffusion、MidJourney)仅支持“文本→图像”单向生成不同,FLUX.1 Kontext的核心突破在于“上下文感知”与“多轮编辑”能力。BFL联合创始人兼CEO Robin Rombach在发布会上强调:“我们将图像生成与编辑统一在流匹配架构中,用户不再需要‘推翻重来’,而是能像修改文档一样‘逐句调整’图像。”

具体来看,FLUX.1 Kontext的四大亮点直击行业痛点:

1. 双输入上下文生成:文本+图像,告别“从零开始”
用户可同时输入文本提示(如“添加小绿龙”)和参考图像(如人物原图),模型能精准理解“在人物肩膀放小绿龙”的需求,生成与原图风格、光影、比例一致的新图像。测试案例显示,输入一张“穿白衬衫的男性”照片并要求“添加红色领带”,Kontext生成的领带颜色、褶皱与原图光照完美匹配,而传统模型常出现“领带浮于表面”的穿帮问题。

2. 跨轮次编辑一致性:多步修改不“漂移”
传统模型在多轮编辑(如先改背景再调人物)中易出现“视觉漂移”(人物表情、服饰细节变化),而FLUX.1 Kontext通过流匹配架构,能“记住”每一步修改的上下文,确保角色、场景元素的一致性。用户实测:对一张“海边少女”图先后执行“添加太阳镜”“调整海浪高度”“更换沙滩椅颜色”三次编辑,最终图像的少女五官、发型与原图吻合度超95%。

3. 局部编辑“不连坐”:改一处,其他部分“稳如磐石”
模型支持精准局部编辑,修改某一区域(如人物手部)时,其他区域(如背景、面部)不受影响。BFL展示的案例中,用户要求“将照片中咖啡杯从白色换成蓝色”,Kontext仅调整杯子颜色,杯口的咖啡渍、桌面的反光细节均保留原样,而MidJourney同类操作常导致桌面纹理模糊。

4. 1MP分辨率下3-5秒推理:创意“不卡壳”
FLUX.1 Kontext在1024×1024分辨率(1MP)下的推理速度达3-5秒,较传统扩散模型(如Stable Diffusion XL需10-15秒)快2-3倍。这意味着用户可在创意过程中“即时预览”修改效果,大幅提升迭代效率——设计师测试反馈:“以前调一个细节要等半分钟,现在5秒就能看到结果,一天能多完成30%的设计稿。”

二、流匹配架构:颠覆扩散模型的“技术基因”

FLUX.1 Kontext的能力突破,源于其底层采用的“流匹配(Flow Matching)”架构,与Stable Diffusion依赖的“扩散(Diffusion)”模型有着本质差异。

传统扩散模型通过“加噪-去噪”过程生成图像:先给原图添加大量噪声,再通过多步迭代“去噪”还原。这种方法虽能生成高保真图像,但多轮编辑时因“去噪路径”被打断,易导致细节丢失;且推理时间随分辨率提升呈指数级增长。

流匹配模型则通过学习“连续数据流”的变换路径,直接在噪声与真实数据间建立映射。BFL在技术博客中解释:“流匹配相当于为图像编辑画了一张‘动态地图’,模型知道如何从任意起点(原图或中间修改版本)平滑过渡到目标状态(用户需求),无需反复‘加噪-去噪’。” 这一特性使FLUX.1 Kontext在多轮编辑、局部修改中保持一致性,同时大幅降低推理延迟。

三、BFL的“技术底气”:Stable Diffusion原班团队的“再出发”

FLUX.1 Kontext的颠覆性,离不开其背后团队的“基因优势”。BFL由Stable Diffusion核心开发者Robin Rombach联合12位前Stability AI同事创立,团队成员包括Stable Diffusion架构师Patrick Esser、原Stability AI工程副总裁Andreas Blattmann等。

2021年,Rombach团队在资源受限的条件下(仅用几块小型GPU)开发出“潜在生成模型”,通过压缩图像细节提升效率,为Stable Diffusion的“单GPU运行”奠定基础。2022年,Stability AI将该技术商业化,Stable Diffusion凭借“开源+轻量”迅速成为文生图领域的“现象级工具”。

但Stability AI后续因内部管理问题(如融资争议、核心成员流失)陷入动荡,Rombach于2024年3月离职,并于同年8月创立BFL。“我们希望摆脱大公司的官僚主义,专注技术本身。”Rombach在Slush创业会议上表示。目前,BFL已获General Catalyst、a16z等顶级风投3100万美元种子轮投资,团队规模30人(12人来自Stability AI),正以“小而精”的姿态重新定义图像生成赛道。

四、市场反响与行业影响:从个人创作到企业级应用的“效率革命”

FLUX.1 Kontext的发布已引发市场热烈反响。目前,Pro版与Max版已在KreaAI、Freepik、Lightricks等平台上线,Dev版(12B参数开放权重模型)即将开启内测。

个人创作者:X平台用户@TechArtist实测后评价:“10秒内根据旧图生成职业头像,细节几可乱真!左侧是实拍图,右侧是Kontext生成的,同事完全没看出区别。”另一用户测试局部编辑功能:“输入‘在肩膀放小绿龙’,模型精准定位位置,龙的鳞片、光影与原图完美融合,这是其他模型做不到的。”

企业用户:某广告公司设计总监透露:“以前修改产品图需反复调整,现在用Kontext的多轮编辑功能,从‘白背景产品图’到‘户外场景展示’仅需3次修改,效率提升50%。”BFL数据显示,企业客户试用后,创意流程耗时从平均2小时缩短至40分钟。

行业分析师指出:“FLUX.1 Kontext的出现,标志着图像生成从‘一次性创作’进入‘迭代式对话’时代。随着流匹配架构的普及,未来的AI图像工具可能像PS一样‘可编辑、可回溯’,彻底改变创意工作流。”

从Stable Diffusion到FLUX.1 Kontext,Robin Rombach团队用技术证明:图像生成的未来,不在“更华丽的单次输出”,而在“更灵活的交互体验”。当FLUX.1 Kontext以“上下文感知+快速编辑”重新定义行业标准,一场由“流匹配”驱动的图像生成革命,或许才刚刚开始。

嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“​​Stable Diffusion团队再发力!FLUX.1 Kontext颠覆图像生成​​”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!

微信打赏二维码 微信扫一扫

支付宝打赏二维码 支付宝扫一扫

版权: 转载请注明出处:https://www.ai-blog.cn/16833.html

相关推荐

​​钉钉首款行业大模型落地!妇科专业版准确率超90%​​: 近日,钉钉企业专属 AI 平台上成功训练出了…

小智头像图片
76

​​Cursor+MCP暴雷!一句话攻破数据库,竟是架构缺陷​: 安全研究团队 General Analysis 日前警告称…

小智头像图片
54

Grok 4登顶!马斯克放话”编程碾压”,20万N卡年赚47亿​: 时隔 5 个月,Grok 终于再次“…

小智头像图片
43

AGICamp 002期AI应用榜出炉!AiPPT/SwiftAgent领跑​: AGICamp 第 002 周 AI 应用榜来了,相比于第…

小智头像图片
113

​​”稚晖君”砸21亿抢跑!智元机器人冲刺人形第一股​: 北京时间 7 月 8 日晚,智元机器…

小智头像图片
80

​​22岁印度少年业余项目被Groq相中!用户飙6万​: 在人工智能技术蓬勃发展的时代,搜索变得比以前…

小智头像图片
44

饿了么创始元老归来!携7亿估值AI公司再战江湖​: 近日,一家总部位于新加坡的 AI 应用开发商 Orio…

小智头像图片
98

国脉科技发布居家养老场景 AI 智能体: 在人口老龄化问题日益凸显的当下,养老成为了全社会关注的…

小智头像图片
145
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力原创内容

快速提升站内名气成为大牛

扫描二维码

手机访问本站

二维码
vip弹窗图片