中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)認(rèn)定的A類國(guó)際學(xué)術(shù)會(huì)議——第40屆AAAI大會(huì)近日公布論文錄取結(jié)果,小米科技提交的7篇研究成果全部入選。該會(huì)議作為人工智能領(lǐng)域最具影響力的學(xué)術(shù)盛會(huì)之一,本屆共收到23680篇有效投稿,最終錄取率僅17.6%,創(chuàng)下歷屆競(jìng)爭(zhēng)最激烈紀(jì)錄。
在入選論文中,小米團(tuán)隊(duì)有兩篇研究成果獲得口頭報(bào)告資格,研究范疇覆蓋多個(gè)前沿技術(shù)方向。其中音效編輯技術(shù)通過(guò)深度學(xué)習(xí)模型實(shí)現(xiàn)音頻內(nèi)容的智能生成與修改;具身智能3D Agent研究則聚焦于三維空間中的智能體自主決策能力;檢索與推斷解碼技術(shù)突破傳統(tǒng)信息處理框架,在復(fù)雜語(yǔ)義理解方面取得進(jìn)展。語(yǔ)音問(wèn)答系統(tǒng)、視覺(jué)語(yǔ)言導(dǎo)航(VLN)及自動(dòng)駕駛場(chǎng)景下的多模態(tài)交互研究,均展現(xiàn)出跨領(lǐng)域技術(shù)融合的創(chuàng)新性。
值得關(guān)注的是,這批成果集中體現(xiàn)了小米在大模型基礎(chǔ)架構(gòu)與具身智能應(yīng)用層面的雙重突破。通過(guò)構(gòu)建新型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),研究團(tuán)隊(duì)在提升模型推理效率的同時(shí),顯著增強(qiáng)了智能體在物理環(huán)境中的交互能力。相關(guān)技術(shù)已應(yīng)用于小米智能設(shè)備生態(tài),為消費(fèi)級(jí)AI產(chǎn)品提供底層技術(shù)支撐。
學(xué)術(shù)界普遍認(rèn)為,小米此次在頂級(jí)會(huì)議的集中亮相,標(biāo)志著中國(guó)科技企業(yè)在AI核心算法研究領(lǐng)域正從應(yīng)用層面向基礎(chǔ)理論層邁進(jìn)。其多模態(tài)交互技術(shù)與具身智能研究成果,為全球AI研究者提供了新的技術(shù)范式參考,尤其在智能硬件與軟件協(xié)同創(chuàng)新方面展現(xiàn)出獨(dú)特優(yōu)勢(shì)。















