馬斯克xAI新突破：Grok 4.1智商情商雙提升，團隊華人力量引關(guān)注

發(fā)布時間：2025-11-21 07:00 來源：快訊作者：唐云澤

馬斯克旗下人工智能公司xAI近日推出全新大模型Grok 4.1，以"雙商在線"的定位向GPT-5.1發(fā)起挑戰(zhàn)。這款模型分為Thinking（推理版）和標準版兩個版本，現(xiàn)已在Grok官網(wǎng)、X平臺及移動端應(yīng)用全面開放免費體驗。

在權(quán)威評測平臺LMArena的最新榜單中，Grok 4.1 Thinking以1483分登頂全球大模型排行榜，較第二名Gemini 2.5 Pro高出31分。其標準版同樣表現(xiàn)亮眼，直接占據(jù)榜單次席。更引人注目的是，該模型在情商專項測試EQ-Bench3中延續(xù)強勢表現(xiàn)，Thinking版本以1586分刷新紀錄，標準版與國產(chǎn)模型Kimi K2分列二三位。

實測顯示，新模型在交互體驗上實現(xiàn)質(zhì)的飛躍。相比前代產(chǎn)品，Grok 4.1展現(xiàn)出更強的共情能力，不僅會耐心傾聽用戶訴求，還能在回復(fù)結(jié)尾添加愛心符號增強情感表達。創(chuàng)作能力方面，其文本生成評分較前代提升600分，生成內(nèi)容兼具邏輯性與畫面感。通過優(yōu)化訓(xùn)練架構(gòu)，模型幻覺率從12.09%降至4.22%，信息準確性顯著提升。

技術(shù)團隊披露，此次突破源于對強化學(xué)習(xí)框架的深度革新。xAI在既有大規(guī)模強化學(xué)習(xí)基礎(chǔ)設(shè)施上，開發(fā)出利用智能體推理模型作為獎勵機制的新方法，實現(xiàn)自主評估與迭代響應(yīng)。后訓(xùn)練負責(zé)人Dustin Tran透露，團隊通過分析數(shù)百萬條真實對話數(shù)據(jù)，結(jié)合智能體評分系統(tǒng)，將強化學(xué)習(xí)規(guī)模擴大10倍，同時將RLHF（基于人類反饋的強化學(xué)習(xí)）技術(shù)推向新高度。

值得關(guān)注的是，xAI近期因團隊構(gòu)成引發(fā)討論。社交平臺流傳的合影顯示，其核心研發(fā)團隊以華裔科學(xué)家為主。有消息稱，公司近期調(diào)整了人員結(jié)構(gòu)，但官方尚未對此作出回應(yīng)。這種人才聚集現(xiàn)象，某種程度上反映出全球AI領(lǐng)域的技術(shù)競爭格局。

關(guān)于備受期待的Grok 5，馬斯克在最新訪談中透露，這款參數(shù)規(guī)模達6萬億的模型將推遲至明年發(fā)布。他解釋稱，作為通向通用人工智能（AGI）的重要里程碑，Grok 5需要更強大的計算資源支持，目前團隊正進行極端嚴格的測試驗證。這一表態(tài)與此前報道中提到的"資源限制與測試需求"形成呼應(yīng)。

行業(yè)觀察人士指出，Grok 4.1的發(fā)布既是技術(shù)迭代成果，也彰顯了馬斯克的AI戰(zhàn)略野心。不過隨著谷歌Gemini 3.0等競品即將入場，今年大模型領(lǐng)域的競爭格局仍存變數(shù)。這場由科技巨頭主導(dǎo)的AI競賽，正在不斷刷新人類對智能邊界的認知。

更多>同類內(nèi)容