Meta AI策略轉(zhuǎn)型迎成果：Muse Spark發(fā)布，部分測(cè)試表現(xiàn)比肩前沿模型

發(fā)布時(shí)間：2026-04-10 08:51 來源：快訊作者：蘇婉清

當(dāng)?shù)貢r(shí)間4月8日，meta公司正式推出多模態(tài)推理模型Muse Spark，這款被視為其AI戰(zhàn)略轉(zhuǎn)型關(guān)鍵成果的新模型，標(biāo)志著meta在人工智能領(lǐng)域的技術(shù)路線發(fā)生重大調(diào)整。與以往開源的Llama系列不同，Muse Spark采用閉源模式開發(fā)，引發(fā)業(yè)界對(duì)meta技術(shù)戰(zhàn)略轉(zhuǎn)向的廣泛討論。美股當(dāng)日收盤時(shí)，meta股價(jià)上漲6.5%，市場(chǎng)對(duì)這一戰(zhàn)略調(diào)整給予積極回應(yīng)。

根據(jù)meta官方披露的技術(shù)文檔，Muse Spark在多模態(tài)感知、復(fù)雜推理和代理任務(wù)處理等方面展現(xiàn)出較強(qiáng)競(jìng)爭(zhēng)力。在多模態(tài)基準(zhǔn)測(cè)試CharXiv Reasoning中，該模型以86.4分的成績(jī)超越GPT-5.4（82.8分）和Gemini 3.1 Pro High（80.2分）。不過在視覺理解等其他測(cè)試項(xiàng)目中，其表現(xiàn)略遜于Gemini 3.1 Pro High。在代理能力專項(xiàng)測(cè)試DeepSearchQA中，Muse Spark取得74.8分的成績(jī)，優(yōu)于Gemini 3.1 Pro High的69.7分和GPT-5.4的73.6分。

值得關(guān)注的是，meta透露尚未上線的沉思模式在專業(yè)領(lǐng)域測(cè)試中表現(xiàn)更為突出。在無工具Humanity’s Last Exam和FrontierScience Research兩項(xiàng)測(cè)試中，該模式得分均超過Gemini 3.1和GPT-5.4 Pro。這種"思考模式"與"沉思模式"的雙軌設(shè)計(jì)，顯示出meta在通用人工智能與專業(yè)領(lǐng)域突破之間的戰(zhàn)略平衡。

這場(chǎng)戰(zhàn)略轉(zhuǎn)型始于去年4月的Llama 4爭(zhēng)議。當(dāng)時(shí)該模型被質(zhì)疑訓(xùn)練數(shù)據(jù)存在偏差，實(shí)際性能未達(dá)預(yù)期，加之首席AI科學(xué)家楊立昆的技術(shù)路線爭(zhēng)議，促使meta管理層啟動(dòng)全面改革。去年6月，meta以近150億美元投資AI初創(chuàng)公司Scale AI，其創(chuàng)始人亞歷山大·王出任超級(jí)智能實(shí)驗(yàn)室負(fù)責(zé)人，隨后展開大規(guī)模人才招募計(jì)劃。

組織架構(gòu)調(diào)整伴隨技術(shù)路線的根本性轉(zhuǎn)變。據(jù)內(nèi)部人士透露，新管理層更傾向于采用經(jīng)過驗(yàn)證的技術(shù)方案，將研發(fā)重心轉(zhuǎn)向大語言模型開發(fā)，對(duì)部分前沿創(chuàng)意持謹(jǐn)慎態(tài)度。這種轉(zhuǎn)變直接體現(xiàn)在Muse Spark的閉源策略上，與Llama系列形成鮮明對(duì)比。楊立昆的離職被視為這種戰(zhàn)略轉(zhuǎn)向的標(biāo)志性事件，其后續(xù)公開表示，meta管理層在技術(shù)方向上存在顯著分歧。

在模型研發(fā)之外，meta同步推進(jìn)AI基礎(chǔ)設(shè)施建設(shè)。公司計(jì)劃到2026年將資本支出翻倍至1150-1350億美元，主要用于數(shù)據(jù)中心擴(kuò)建和算力提升。這種激進(jìn)投入使meta成為美國科技公司中AI基礎(chǔ)設(shè)施投入力度最大的企業(yè)之一，為其模型訓(xùn)練和迭代提供硬件保障。

當(dāng)前AI市場(chǎng)競(jìng)爭(zhēng)日趨白熱化。Anthropic公司近日宣布其未發(fā)布模型Mythos Preview在編碼能力上取得突破，可能重塑網(wǎng)絡(luò)安全格局。市場(chǎng)傳言O(shè)penAI計(jì)劃在4月推出GPT-6，而DeepSeek同日更新的對(duì)話界面新增"快速模式"和"專家模式"，被解讀為V4版本上線的前奏。這些動(dòng)態(tài)表明，meta的新模型將面臨激烈的市場(chǎng)檢驗(yàn)。

技術(shù)評(píng)測(cè)顯示，Muse Spark在部分基準(zhǔn)測(cè)試中超越Anthropic的Opus 4.6，但整體仍未形成全面優(yōu)勢(shì)。這種"局部領(lǐng)先、整體追趕"的態(tài)勢(shì)，反映出當(dāng)前AI模型競(jìng)爭(zhēng)的復(fù)雜格局。隨著頭部企業(yè)陸續(xù)推出新一代產(chǎn)品，2024年第二季度可能成為大模型技術(shù)突破的關(guān)鍵窗口期。

更多>同類內(nèi)容