Meta重組后首推Muse Spark：閉源定制模型，補(bǔ)產(chǎn)品短板還是追趕之舉？-峰會(huì)論壇-媒體界

Meta重組后首推Muse Spark：閉源定制模型，補(bǔ)產(chǎn)品短板還是追趕之舉？

發(fā)布時(shí)間：2026-04-09 13:45 來(lái)源：快訊作者：江紫萱

meta 近日正式推出 Muse Spark，這是其超級(jí)智能實(shí)驗(yàn)室（MSL）成立后的首款產(chǎn)品，也是該公司九個(gè)月以來(lái)發(fā)布的首個(gè)新模型。消息發(fā)布后，meta 股價(jià)在交易中一度上漲超過(guò) 10%。公司首席執(zhí)行官扎克伯格在社交平臺(tái) Threads 上稱贊其為“世界級(jí)助手”，但也有高管坦言，Muse Spark 并未突破現(xiàn)有技術(shù)邊界，僅在部分任務(wù)中具備競(jìng)爭(zhēng)力。

這款模型的誕生背景特殊。meta 在經(jīng)歷內(nèi)部動(dòng)蕩后，通過(guò)重組 AI 部門并重建技術(shù)棧，最終推出 Muse Spark。據(jù)團(tuán)隊(duì)負(fù)責(zé)人 Alexandr Wang 透露，研發(fā)團(tuán)隊(duì)“從零開(kāi)始搭建了整個(gè)技術(shù)體系”。meta 強(qiáng)調(diào)，Muse Spark 在達(dá)到 Llama 4 Maverick 同等性能時(shí)，所需計(jì)算量減少了 90%以上，預(yù)訓(xùn)練階段的計(jì)算效率也優(yōu)于 DeepSeek-V3.1 和 Kimi-K2 的基座模型。

盡管 meta 在發(fā)布時(shí)通過(guò)視覺(jué)設(shè)計(jì)突出 Muse Spark 的優(yōu)勢(shì)，但第三方評(píng)測(cè)顯示其表現(xiàn)存在明顯短板。在編程、抽象推理和智能體任務(wù)等熱門領(lǐng)域，該模型落后于 Gemini 和 GPT-5.4。例如，在抽象推理測(cè)試中，Muse Spark 僅得 42.5 分，而 Gemini 3.1 Pro 和 GPT-5.4 分別獲得 76.5 分和 76.1 分。meta 也在官方博客中承認(rèn)，模型在長(zhǎng)時(shí)序智能體系統(tǒng)和編程工作流方面仍有不足。

評(píng)測(cè)機(jī)構(gòu) Artificial Analysis 的綜合評(píng)分顯示，Muse Spark 以 52 分位列第四，低于 Gemini 3.1 Pro、GPT-5.4 和 Claude Opus 4.6。在無(wú)工具測(cè)試中，其成績(jī)?yōu)?39.9%，不僅低于 meta 自報(bào)的 42.8%，也低于 Gemini 的 44.7%。獨(dú)立測(cè)試者 Ritesh Khanna 的實(shí)測(cè)表明，該模型在視覺(jué)理解和金融分析方面表現(xiàn)突出，但代碼生成能力墊底，甚至在生成雪花玻璃球時(shí)，雖然 Three.js 代碼技術(shù)完美，渲染結(jié)果卻僅為黑色物體。

Muse Spark 的優(yōu)勢(shì)集中在多模態(tài)和健康領(lǐng)域。在圖表理解測(cè)試中，它以 86.4 分領(lǐng)先所有對(duì)手；健康問(wèn)答得分 42.8，是 Gemini 3.1 Pro 的兩倍多。meta 表示，健康領(lǐng)域的訓(xùn)練數(shù)據(jù)由超過(guò) 1000 名醫(yī)生參與策劃。這些特性與 meta 的產(chǎn)品需求高度契合，例如識(shí)別 Instagram 上的食物照片、為 Ray-Ban 智能眼鏡提供物體識(shí)別功能，以及增強(qiáng) AI 助手的健康問(wèn)答能力。

與 Llama 系列的開(kāi)源策略不同，Muse Spark 采取閉源模式，僅向“精選合作伙伴”提供私有 API 預(yù)覽。該模型已直接部署在 meta AI 聊天助手中，未來(lái)將擴(kuò)展至 Facebook、Instagram、WhatsApp 和 Ray-Ban 眼鏡，并配套推出基于用戶興趣數(shù)據(jù)的個(gè)性化購(gòu)物推薦功能。沃頓商學(xué)院教授 Ethan Mollick 指出，此舉表明 meta 希望通過(guò)自有模型從現(xiàn)有用戶中提取更多商業(yè)價(jià)值，但缺乏開(kāi)源權(quán)重可能限制其長(zhǎng)期影響力。

過(guò)去三年，Llama 系列憑借開(kāi)源策略建立了全球最大的生態(tài)，累計(jì)下載量達(dá) 12 億次，日均下載約 100 萬(wàn)次。然而，截至 2025 年底，中國(guó)模型在 Hugging Face 上的下載占比已達(dá) 41%，超過(guò)美國(guó)的 35%。Llama 4 的市場(chǎng)表現(xiàn)下滑加速了這一趨勢(shì)。Muse Spark 的閉源發(fā)布，被視為 meta 從開(kāi)源基礎(chǔ)設(shè)施供應(yīng)商轉(zhuǎn)向聚焦產(chǎn)品競(jìng)爭(zhēng)力的戰(zhàn)略調(diào)整。

盡管 meta 承諾未來(lái)將推出開(kāi)源版本，但當(dāng)前優(yōu)先級(jí)明顯傾向于產(chǎn)品落地。公司今年的資本支出預(yù)算高達(dá) 1150 億至 1350 億美元，幾乎是 2025 年的兩倍。Muse Spark 作為首項(xiàng)成果，驗(yàn)證了 MSL 團(tuán)隊(duì)在九個(gè)月內(nèi)重建技術(shù)棧的能力，尤其在計(jì)算效率提升和多模態(tài)差異化方面取得進(jìn)展。不過(guò)，在 Muse Spark 發(fā)布前一天，Anthropic 推出了限量開(kāi)放的 Claude Mythos，智譜 AI 也發(fā)布了編程基準(zhǔn)領(lǐng)先的 GLM-5.1，顯示 AI 領(lǐng)域的競(jìng)爭(zhēng)仍在持續(xù)升溫。

更多>同類內(nèi)容