阿里巴巴正式推出其最新旗艦推理模型——千問Qwen3-Max-Thinking,標(biāo)志著公司在人工智能領(lǐng)域邁出重要一步。這款模型擁有超過萬(wàn)億參數(shù),預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到36T Tokens,是目前阿里旗下規(guī)模最大、性能最強(qiáng)的推理模型,為開發(fā)者、企業(yè)和普通用戶提供了強(qiáng)大的智能支持。
開發(fā)者可通過QwenChat平臺(tái)免費(fèi)體驗(yàn)這一新模型,企業(yè)用戶則能借助阿里云百煉獲取API服務(wù)。千問PC端和網(wǎng)頁(yè)端也已開放試用,千問APP也即將接入該模型,屆時(shí)所有用戶均可免費(fèi)體驗(yàn)其強(qiáng)大功能。這一舉措進(jìn)一步降低了大模型的使用門檻,推動(dòng)了AI技術(shù)的普及。
在性能方面,Qwen3-Max-Thinking表現(xiàn)尤為突出。預(yù)覽版模型已在數(shù)學(xué)推理領(lǐng)域取得突破,斬獲AIME 25和HMMT 25國(guó)內(nèi)首個(gè)雙滿分。正式版模型在此基礎(chǔ)上進(jìn)行了更大規(guī)模的強(qiáng)化學(xué)習(xí)后訓(xùn)練,性能得到全面提升。其采用的測(cè)試時(shí)擴(kuò)展機(jī)制,通過“經(jīng)驗(yàn)提取”和多輪自我迭代,實(shí)現(xiàn)了更高效的推理計(jì)算,避免了傳統(tǒng)方法中冗余推理的問題,顯著提升了推理效率和結(jié)果質(zhì)量。
在“人類最后的測(cè)試”HLE中,Qwen3-Max-Thinking以58.3分的成績(jī)超越GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,創(chuàng)下當(dāng)前所有模型的最高分。這一成績(jī)充分證明了其在復(fù)雜推理任務(wù)中的卓越能力,為智能體Agent時(shí)代的應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。
面向未來(lái),Qwen3-Max-Thinking還大幅增強(qiáng)了自主調(diào)用工具的原生Agent能力,使其能夠更靈活地應(yīng)對(duì)多樣化場(chǎng)景需求。這一改進(jìn)不僅提升了模型的實(shí)用性,也為智能體技術(shù)的發(fā)展提供了新的方向。
在應(yīng)用拓展方面,千問大模型已邁出重要一步。2025年11月,國(guó)星宇航成功將千問Qwen3大模型部署至“星算”計(jì)劃01組太空計(jì)算中心,實(shí)現(xiàn)了全球首次通用大模型在軌運(yùn)行。該模型在太空中成功完成多次端到端推理任務(wù),從地面接收問題,在衛(wèi)星上完成推理,并將結(jié)果回傳地面,全程耗時(shí)不到2分鐘。這一突破為太空計(jì)算和智能應(yīng)用開辟了新的可能性。
在開源領(lǐng)域,千問系列模型同樣表現(xiàn)亮眼。全球最大AI開源社區(qū)Hugging Face數(shù)據(jù)顯示,阿里千問衍生模型數(shù)量已突破20萬(wàn)個(gè),成為全球首個(gè)達(dá)成此目標(biāo)的開源大模型。同時(shí),千問系列模型下載量超過10億次,日均下載量達(dá)110萬(wàn)次,全面超越美國(guó)Llama模型,穩(wěn)居開源大模型全球第一。這一成就不僅體現(xiàn)了千問模型的廣泛影響力,也彰顯了中國(guó)在人工智能開源領(lǐng)域的領(lǐng)先地位。















