AI动态资讯
获取最新AI动态,掌握前沿科技趋势,洞悉未来发展方向!
古董Mac跑AI模型成功,速度是现代CPU1/9: 众所周知,大语言模型(LLM)往往对硬件要求很高。近日…
首篇Test-Time Scaling系统综述:原理与实现四维拆解: 当训练成本飙升、数据枯竭,如何继续激发大…
Llama 4陷刷榜风波,20万显卡效果引热议: 昨天一早,Meta 放出了自家用了 20 万显卡集群训练出的 …
前百度AI高管转型:弃500万用户产品,力推最强Agent: 前两天,总部位于美国加州帕洛阿尔托的初创…
OpenAI发布大模型软件工程基准SWE-Lancer: OpenAI 发布 SWE-Lancer 基准测试,用于评估 AI 大语言…
智谱发布 Agent 产品 AutoGLM 沉思: 3 月 31 日,智谱在中关村论坛上正式发布 AutoGLM 沉思,这一…
亚马逊推出可控制网络浏览器的 AI 代理 Nova Act: 本周一,亚马逊发布了 Nova Act,这是一款通用 …
DeepSeek-清华合作:创新奖励模型推理提升扩展性: DeepSeek 与清华研究者提出自我原则点评调优(S…
Meta发布Llama 4:重构架构首次采用MoE技术: Meta 今日发布了首批 Llama 4 系列模型:Llama 4 Sco…
OpenAI完成400亿美元融资,GPT-5发布计划大变: 4 月 1 日消息,OpenAI 宣布完成了一轮规模巨大的…
梁文锋急招 CFO,市场猜测或开放融资: 近日,DeepSeek 放出了多个财务相关的岗位,涉及 CFO、COO…
阿里通义千问登顶全球开源模型榜首,传即将发布 Qwen3: 4 月 2 日,全球最大的 AI 开源社区 Huggi…
美国拟成立 TikTok 美国独立公司?字节跳动:未达成任何协议: 4 月 3 日消息,距离 TikTok 在美国…
Dapr Agents 发布:支持规模化 AI 工作流、多智能体协作: Dapr 最近推出了 Dapr Agents,一个利用…
微软50周年庆典员工怒斥CEO,纳德拉重申开发者愿景: 当地时间 4 月 4 日,微软迎来了自己成立 50 …
多模态KV量化突破:10倍吞吐无损,即插即用: 在 InternVL-2.5 上实现 10 倍吞吐量提升,模型性能…
英伟达早期秘辛:CUDA曾被嫌弃,12人团队建算力帝国: 最近,在 NVIDIA 的一次内部对话中,英伟达…