當(dāng)?shù)貢r(shí)間4月8日,meta公司正式推出多模態(tài)推理模型Muse Spark,這款被視為其AI戰(zhàn)略轉(zhuǎn)型關(guān)鍵成果的新模型,標(biāo)志著meta在人工智能領(lǐng)域的技術(shù)路線發(fā)生重大調(diào)整。與以往開源的Llama系列不同,Muse Spark采用閉源模式開發(fā),引發(fā)業(yè)界對(duì)meta技術(shù)戰(zhàn)略轉(zhuǎn)向的廣泛討論。美股當(dāng)日收盤時(shí),meta股價(jià)上漲6.5%,市場(chǎng)對(duì)這一戰(zhàn)略調(diào)整給予積極回應(yīng)。
根據(jù)meta官方披露的技術(shù)文檔,Muse Spark在多模態(tài)感知、復(fù)雜推理和代理任務(wù)處理等方面展現(xiàn)出較強(qiáng)競(jìng)爭(zhēng)力。在多模態(tài)基準(zhǔn)測(cè)試CharXiv Reasoning中,該模型以86.4分的成績(jī)超越GPT-5.4(82.8分)和Gemini 3.1 Pro High(80.2分)。不過在視覺理解等其他測(cè)試項(xiàng)目中,其表現(xiàn)略遜于Gemini 3.1 Pro High。在代理能力專項(xiàng)測(cè)試DeepSearchQA中,Muse Spark取得74.8分的成績(jī),優(yōu)于Gemini 3.1 Pro High的69.7分和GPT-5.4的73.6分。
值得關(guān)注的是,meta透露尚未上線的沉思模式在專業(yè)領(lǐng)域測(cè)試中表現(xiàn)更為突出。在無工具Humanity’s Last Exam和FrontierScience Research兩項(xiàng)測(cè)試中,該模式得分均超過Gemini 3.1和GPT-5.4 Pro。這種"思考模式"與"沉思模式"的雙軌設(shè)計(jì),顯示出meta在通用人工智能與專業(yè)領(lǐng)域突破之間的戰(zhàn)略平衡。
這場(chǎng)戰(zhàn)略轉(zhuǎn)型始于去年4月的Llama 4爭(zhēng)議。當(dāng)時(shí)該模型被質(zhì)疑訓(xùn)練數(shù)據(jù)存在偏差,實(shí)際性能未達(dá)預(yù)期,加之首席AI科學(xué)家楊立昆的技術(shù)路線爭(zhēng)議,促使meta管理層啟動(dòng)全面改革。去年6月,meta以近150億美元投資AI初創(chuàng)公司Scale AI,其創(chuàng)始人亞歷山大·王出任超級(jí)智能實(shí)驗(yàn)室負(fù)責(zé)人,隨后展開大規(guī)模人才招募計(jì)劃。
組織架構(gòu)調(diào)整伴隨技術(shù)路線的根本性轉(zhuǎn)變。據(jù)內(nèi)部人士透露,新管理層更傾向于采用經(jīng)過驗(yàn)證的技術(shù)方案,將研發(fā)重心轉(zhuǎn)向大語言模型開發(fā),對(duì)部分前沿創(chuàng)意持謹(jǐn)慎態(tài)度。這種轉(zhuǎn)變直接體現(xiàn)在Muse Spark的閉源策略上,與Llama系列形成鮮明對(duì)比。楊立昆的離職被視為這種戰(zhàn)略轉(zhuǎn)向的標(biāo)志性事件,其后續(xù)公開表示,meta管理層在技術(shù)方向上存在顯著分歧。
在模型研發(fā)之外,meta同步推進(jìn)AI基礎(chǔ)設(shè)施建設(shè)。公司計(jì)劃到2026年將資本支出翻倍至1150-1350億美元,主要用于數(shù)據(jù)中心擴(kuò)建和算力提升。這種激進(jìn)投入使meta成為美國科技公司中AI基礎(chǔ)設(shè)施投入力度最大的企業(yè)之一,為其模型訓(xùn)練和迭代提供硬件保障。
當(dāng)前AI市場(chǎng)競(jìng)爭(zhēng)日趨白熱化。Anthropic公司近日宣布其未發(fā)布模型Mythos Preview在編碼能力上取得突破,可能重塑網(wǎng)絡(luò)安全格局。市場(chǎng)傳言O(shè)penAI計(jì)劃在4月推出GPT-6,而DeepSeek同日更新的對(duì)話界面新增"快速模式"和"專家模式",被解讀為V4版本上線的前奏。這些動(dòng)態(tài)表明,meta的新模型將面臨激烈的市場(chǎng)檢驗(yàn)。
技術(shù)評(píng)測(cè)顯示,Muse Spark在部分基準(zhǔn)測(cè)試中超越Anthropic的Opus 4.6,但整體仍未形成全面優(yōu)勢(shì)。這種"局部領(lǐng)先、整體追趕"的態(tài)勢(shì),反映出當(dāng)前AI模型競(jìng)爭(zhēng)的復(fù)雜格局。隨著頭部企業(yè)陸續(xù)推出新一代產(chǎn)品,2024年第二季度可能成為大模型技術(shù)突破的關(guān)鍵窗口期。















