国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進業(yè)內(nèi)人士交流分享!

馬斯克xAI新突破:Grok 4.1智商情商雙提升,團隊華人力量引關(guān)注

   發(fā)布時間:2025-11-21 07:00 作者:唐云澤

馬斯克旗下人工智能公司xAI近日推出全新大模型Grok 4.1,以"雙商在線"的定位向GPT-5.1發(fā)起挑戰(zhàn)。這款模型分為Thinking(推理版)和標準版兩個版本,現(xiàn)已在Grok官網(wǎng)、X平臺及移動端應(yīng)用全面開放免費體驗。

在權(quán)威評測平臺LMArena的最新榜單中,Grok 4.1 Thinking以1483分登頂全球大模型排行榜,較第二名Gemini 2.5 Pro高出31分。其標準版同樣表現(xiàn)亮眼,直接占據(jù)榜單次席。更引人注目的是,該模型在情商專項測試EQ-Bench3中延續(xù)強勢表現(xiàn),Thinking版本以1586分刷新紀錄,標準版與國產(chǎn)模型Kimi K2分列二三位。

實測顯示,新模型在交互體驗上實現(xiàn)質(zhì)的飛躍。相比前代產(chǎn)品,Grok 4.1展現(xiàn)出更強的共情能力,不僅會耐心傾聽用戶訴求,還能在回復(fù)結(jié)尾添加愛心符號增強情感表達。創(chuàng)作能力方面,其文本生成評分較前代提升600分,生成內(nèi)容兼具邏輯性與畫面感。通過優(yōu)化訓(xùn)練架構(gòu),模型幻覺率從12.09%降至4.22%,信息準確性顯著提升。

技術(shù)團隊披露,此次突破源于對強化學(xué)習(xí)框架的深度革新。xAI在既有大規(guī)模強化學(xué)習(xí)基礎(chǔ)設(shè)施上,開發(fā)出利用智能體推理模型作為獎勵機制的新方法,實現(xiàn)自主評估與迭代響應(yīng)。后訓(xùn)練負責(zé)人Dustin Tran透露,團隊通過分析數(shù)百萬條真實對話數(shù)據(jù),結(jié)合智能體評分系統(tǒng),將強化學(xué)習(xí)規(guī)模擴大10倍,同時將RLHF(基于人類反饋的強化學(xué)習(xí))技術(shù)推向新高度。

值得關(guān)注的是,xAI近期因團隊構(gòu)成引發(fā)討論。社交平臺流傳的合影顯示,其核心研發(fā)團隊以華裔科學(xué)家為主。有消息稱,公司近期調(diào)整了人員結(jié)構(gòu),但官方尚未對此作出回應(yīng)。這種人才聚集現(xiàn)象,某種程度上反映出全球AI領(lǐng)域的技術(shù)競爭格局。

關(guān)于備受期待的Grok 5,馬斯克在最新訪談中透露,這款參數(shù)規(guī)模達6萬億的模型將推遲至明年發(fā)布。他解釋稱,作為通向通用人工智能(AGI)的重要里程碑,Grok 5需要更強大的計算資源支持,目前團隊正進行極端嚴格的測試驗證。這一表態(tài)與此前報道中提到的"資源限制與測試需求"形成呼應(yīng)。

行業(yè)觀察人士指出,Grok 4.1的發(fā)布既是技術(shù)迭代成果,也彰顯了馬斯克的AI戰(zhàn)略野心。不過隨著谷歌Gemini 3.0等競品即將入場,今年大模型領(lǐng)域的競爭格局仍存變數(shù)。這場由科技巨頭主導(dǎo)的AI競賽,正在不斷刷新人類對智能邊界的認知。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新