国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動(dòng)中國(guó)媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

Meta重組后首推Muse Spark:閉源定制模型,補(bǔ)產(chǎn)品短板還是追趕之舉?

   發(fā)布時(shí)間:2026-04-09 13:45 作者:江紫萱

meta 近日正式推出 Muse Spark,這是其超級(jí)智能實(shí)驗(yàn)室(MSL)成立后的首款產(chǎn)品,也是該公司九個(gè)月以來(lái)發(fā)布的首個(gè)新模型。消息發(fā)布后,meta 股價(jià)在交易中一度上漲超過(guò) 10%。公司首席執(zhí)行官扎克伯格在社交平臺(tái) Threads 上稱贊其為“世界級(jí)助手”,但也有高管坦言,Muse Spark 并未突破現(xiàn)有技術(shù)邊界,僅在部分任務(wù)中具備競(jìng)爭(zhēng)力。

這款模型的誕生背景特殊。meta 在經(jīng)歷內(nèi)部動(dòng)蕩后,通過(guò)重組 AI 部門并重建技術(shù)棧,最終推出 Muse Spark。據(jù)團(tuán)隊(duì)負(fù)責(zé)人 Alexandr Wang 透露,研發(fā)團(tuán)隊(duì)“從零開(kāi)始搭建了整個(gè)技術(shù)體系”。meta 強(qiáng)調(diào),Muse Spark 在達(dá)到 Llama 4 Maverick 同等性能時(shí),所需計(jì)算量減少了 90%以上,預(yù)訓(xùn)練階段的計(jì)算效率也優(yōu)于 DeepSeek-V3.1 和 Kimi-K2 的基座模型。

盡管 meta 在發(fā)布時(shí)通過(guò)視覺(jué)設(shè)計(jì)突出 Muse Spark 的優(yōu)勢(shì),但第三方評(píng)測(cè)顯示其表現(xiàn)存在明顯短板。在編程、抽象推理和智能體任務(wù)等熱門領(lǐng)域,該模型落后于 Gemini 和 GPT-5.4。例如,在抽象推理測(cè)試中,Muse Spark 僅得 42.5 分,而 Gemini 3.1 Pro 和 GPT-5.4 分別獲得 76.5 分和 76.1 分。meta 也在官方博客中承認(rèn),模型在長(zhǎng)時(shí)序智能體系統(tǒng)和編程工作流方面仍有不足。

評(píng)測(cè)機(jī)構(gòu) Artificial Analysis 的綜合評(píng)分顯示,Muse Spark 以 52 分位列第四,低于 Gemini 3.1 Pro、GPT-5.4 和 Claude Opus 4.6。在無(wú)工具測(cè)試中,其成績(jī)?yōu)?39.9%,不僅低于 meta 自報(bào)的 42.8%,也低于 Gemini 的 44.7%。獨(dú)立測(cè)試者 Ritesh Khanna 的實(shí)測(cè)表明,該模型在視覺(jué)理解和金融分析方面表現(xiàn)突出,但代碼生成能力墊底,甚至在生成雪花玻璃球時(shí),雖然 Three.js 代碼技術(shù)完美,渲染結(jié)果卻僅為黑色物體。

Muse Spark 的優(yōu)勢(shì)集中在多模態(tài)和健康領(lǐng)域。在圖表理解測(cè)試中,它以 86.4 分領(lǐng)先所有對(duì)手;健康問(wèn)答得分 42.8,是 Gemini 3.1 Pro 的兩倍多。meta 表示,健康領(lǐng)域的訓(xùn)練數(shù)據(jù)由超過(guò) 1000 名醫(yī)生參與策劃。這些特性與 meta 的產(chǎn)品需求高度契合,例如識(shí)別 Instagram 上的食物照片、為 Ray-Ban 智能眼鏡提供物體識(shí)別功能,以及增強(qiáng) AI 助手的健康問(wèn)答能力。

與 Llama 系列的開(kāi)源策略不同,Muse Spark 采取閉源模式,僅向“精選合作伙伴”提供私有 API 預(yù)覽。該模型已直接部署在 meta AI 聊天助手中,未來(lái)將擴(kuò)展至 Facebook、Instagram、WhatsApp 和 Ray-Ban 眼鏡,并配套推出基于用戶興趣數(shù)據(jù)的個(gè)性化購(gòu)物推薦功能。沃頓商學(xué)院教授 Ethan Mollick 指出,此舉表明 meta 希望通過(guò)自有模型從現(xiàn)有用戶中提取更多商業(yè)價(jià)值,但缺乏開(kāi)源權(quán)重可能限制其長(zhǎng)期影響力。

過(guò)去三年,Llama 系列憑借開(kāi)源策略建立了全球最大的生態(tài),累計(jì)下載量達(dá) 12 億次,日均下載約 100 萬(wàn)次。然而,截至 2025 年底,中國(guó)模型在 Hugging Face 上的下載占比已達(dá) 41%,超過(guò)美國(guó)的 35%。Llama 4 的市場(chǎng)表現(xiàn)下滑加速了這一趨勢(shì)。Muse Spark 的閉源發(fā)布,被視為 meta 從開(kāi)源基礎(chǔ)設(shè)施供應(yīng)商轉(zhuǎn)向聚焦產(chǎn)品競(jìng)爭(zhēng)力的戰(zhàn)略調(diào)整。

盡管 meta 承諾未來(lái)將推出開(kāi)源版本,但當(dāng)前優(yōu)先級(jí)明顯傾向于產(chǎn)品落地。公司今年的資本支出預(yù)算高達(dá) 1150 億至 1350 億美元,幾乎是 2025 年的兩倍。Muse Spark 作為首項(xiàng)成果,驗(yàn)證了 MSL 團(tuán)隊(duì)在九個(gè)月內(nèi)重建技術(shù)棧的能力,尤其在計(jì)算效率提升和多模態(tài)差異化方面取得進(jìn)展。不過(guò),在 Muse Spark 發(fā)布前一天,Anthropic 推出了限量開(kāi)放的 Claude Mythos,智譜 AI 也發(fā)布了編程基準(zhǔn)領(lǐng)先的 GLM-5.1,顯示 AI 領(lǐng)域的競(jìng)爭(zhēng)仍在持續(xù)升溫。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新