ITBear旗下自媒体矩阵:

Meta重组后首推Muse Spark:闭源定制模型,补产品短板还是追赶之举?

   时间:2026-04-09 13:45:35 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

meta 近日正式推出 Muse Spark,这是其超级智能实验室(MSL)成立后的首款产品,也是该公司九个月以来发布的首个新模型。消息发布后,meta 股价在交易中一度上涨超过 10%。公司首席执行官扎克伯格在社交平台 Threads 上称赞其为“世界级助手”,但也有高管坦言,Muse Spark 并未突破现有技术边界,仅在部分任务中具备竞争力。

这款模型的诞生背景特殊。meta 在经历内部动荡后,通过重组 AI 部门并重建技术栈,最终推出 Muse Spark。据团队负责人 Alexandr Wang 透露,研发团队“从零开始搭建了整个技术体系”。meta 强调,Muse Spark 在达到 Llama 4 Maverick 同等性能时,所需计算量减少了 90%以上,预训练阶段的计算效率也优于 DeepSeek-V3.1 和 Kimi-K2 的基座模型。

尽管 meta 在发布时通过视觉设计突出 Muse Spark 的优势,但第三方评测显示其表现存在明显短板。在编程、抽象推理和智能体任务等热门领域,该模型落后于 Gemini 和 GPT-5.4。例如,在抽象推理测试中,Muse Spark 仅得 42.5 分,而 Gemini 3.1 Pro 和 GPT-5.4 分别获得 76.5 分和 76.1 分。meta 也在官方博客中承认,模型在长时序智能体系统和编程工作流方面仍有不足。

评测机构 Artificial Analysis 的综合评分显示,Muse Spark 以 52 分位列第四,低于 Gemini 3.1 Pro、GPT-5.4 和 Claude Opus 4.6。在无工具测试中,其成绩为 39.9%,不仅低于 meta 自报的 42.8%,也低于 Gemini 的 44.7%。独立测试者 Ritesh Khanna 的实测表明,该模型在视觉理解和金融分析方面表现突出,但代码生成能力垫底,甚至在生成雪花玻璃球时,虽然 Three.js 代码技术完美,渲染结果却仅为黑色物体。

Muse Spark 的优势集中在多模态和健康领域。在图表理解测试中,它以 86.4 分领先所有对手;健康问答得分 42.8,是 Gemini 3.1 Pro 的两倍多。meta 表示,健康领域的训练数据由超过 1000 名医生参与策划。这些特性与 meta 的产品需求高度契合,例如识别 Instagram 上的食物照片、为 Ray-Ban 智能眼镜提供物体识别功能,以及增强 AI 助手的健康问答能力。

与 Llama 系列的开源策略不同,Muse Spark 采取闭源模式,仅向“精选合作伙伴”提供私有 API 预览。该模型已直接部署在 meta AI 聊天助手中,未来将扩展至 Facebook、Instagram、WhatsApp 和 Ray-Ban 眼镜,并配套推出基于用户兴趣数据的个性化购物推荐功能。沃顿商学院教授 Ethan Mollick 指出,此举表明 meta 希望通过自有模型从现有用户中提取更多商业价值,但缺乏开源权重可能限制其长期影响力。

过去三年,Llama 系列凭借开源策略建立了全球最大的生态,累计下载量达 12 亿次,日均下载约 100 万次。然而,截至 2025 年底,中国模型在 Hugging Face 上的下载占比已达 41%,超过美国的 35%。Llama 4 的市场表现下滑加速了这一趋势。Muse Spark 的闭源发布,被视为 meta 从开源基础设施供应商转向聚焦产品竞争力的战略调整。

尽管 meta 承诺未来将推出开源版本,但当前优先级明显倾向于产品落地。公司今年的资本支出预算高达 1150 亿至 1350 亿美元,几乎是 2025 年的两倍。Muse Spark 作为首项成果,验证了 MSL 团队在九个月内重建技术栈的能力,尤其在计算效率提升和多模态差异化方面取得进展。不过,在 Muse Spark 发布前一天,Anthropic 推出了限量开放的 Claude Mythos,智谱 AI 也发布了编程基准领先的 GLM-5.1,显示 AI 领域的竞争仍在持续升温。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version