媒體界 > 行業縱橫 > 正文內容

特斯聯智能體系統HALI賦能BUTTONS CLIP耳機，三項核心技術打造空間智能交互入口

發布時間：2025-05-12 17:14 來源：GPLP 作者：GPLP

作者：夏天

特斯聯打造全新智能體系統——HALI，開創性地引入端到端強化學習技術與高質量行業數據相結合，首次實現去人為編排與定義的工具調用、子任務分解，及多智能體協同，極大提升智能體的自主性、靈活性及泛化能力。

2024年底，特斯聯曾在Web Summit Lisbon分享了通用智能體所需具備的四重能力——“類人”思考，長期記憶，“團隊”協作，及高維感知能力。HALI的設計亦延循此思路。

特斯聯創始人兼CEO艾渝在里斯本Web Summit現場發布智能體Hali

類人思考——攻克智能體的“人為編排”困境

當前市場中多數的智能體產品主要采用傳統工作流（workflow）方法——將復雜任務拆分成多個子任務，每個子任務分別處理后再匯總成結果。這類方法需要在系統層面人為提前編排和定義，雖然在一定程度上能取得不錯的效果，但限制了模型的自主性和靈活性，難以有效擴展到更多、更復雜任務上，泛化能力和適用性不足。

在此背景下，特斯聯提出采用端到端強化學習（Reinforcement Learning）方法，使用高質量數據微調訓練出HALI智能體系統，通過獎勵函數（reward function）而非依賴人工，引導模型在與工具/設備/環境的交互中不斷優化策略。基于該方法，智能體能夠直接依據用戶的輸入進行推理、規劃、執行任務，無需外部人工編排系統、定義流程的執行邏輯，將整個任務交給一個模型來完成；智能體模型在內部自行決定外部工具的調用、子任務的分解、自我校驗等。

這種方法使智能體系統既獲得了良好的簡潔性，又增強了系統的魯棒性、泛化能力和準確性。目前大家看到的智能體產品更多聚焦于產品工程能力上的提升，事實上，模型本身仍有極大的提升空間。引入端到端強化學是特斯聯針對提升智能體底層模型能力做出的初步嘗試，也是推動機器向類人思考邁出的第一步。

長期記憶——緩解長期記憶帶來的成本及效率壓力

長期記憶是智能體的核心能力之一，智能體產品對實時性和低延遲也有更高要求。為此，特斯聯采用基于知識圖譜的數據壓縮存儲和檢索技術，使模型能夠既保持超長的記憶，又能快速從歷史數據中恢復記憶。

傳統的長期記憶主要依靠：1）保存用戶的歷史對話數據，2）在歷史數據中檢索出相關信息進行綜合處理來實現。這種方法隨時間推移面臨著諸多問題。一方面，伴隨用戶數據量的增加，存儲成本直線上升，后續檢索的上下文長度攀升，導致推理效率下降；另一方面，數據量的增加也關系到檢索結果的準確性和實時性，最終影響系統的運行成本及用戶體驗。

HALI引入的高效數據壓縮方法，則可從用戶的對話數據中提取關鍵有效信息，過濾掉其中不重要的部分，從而提高存儲數據的信息密度，減少數據的存儲量。在此基礎之上，HALI通過構建用戶的知識圖譜，在檢索階段提高系統對用戶意圖的理解和檢索結果的準確性。這種方法得以有效地降低數據存儲量，提高檢索結果的準確性和速度，降低系統的時延和計算成本，使具備超長記憶能力的陪伴式智能體成為可能。

多智能體協同——應對多智能體協同的時延挑戰

能夠準確、實時地調用不同工具與模型完成用戶需求，是影響智能體產品體驗的另一重要因素，也是多智能體系統實現高效協同的關鍵所在。針對這一目標，特斯聯采用并行多模型執行技術，使用微調的移動端小模型和服務器端大模型混合方案，同時保證用戶控制指令響應的低延遲及控制指令的準確性。

該方案使用積累的用戶數據微調訓練用戶控制指令理解小模型——小模型可以部署在移動設備端，在端側對用戶的簡單指令進行直接識別處理，規避網絡回傳至服務器導致的延遲，提高系統響應的實時性。同時，對于用戶的復雜指令，該方案通過部署在服務器端的高性能大模型來同步理解和執行，以確保對復雜指令的準確處理。

近年來，伴隨大語言模型能力的不斷突破，作為其能力的延展與補充，智能體正在通過多模態工具整合、復雜決策閉環、動態環境交互，彌補大模型在空間智能中的局限性，推動其從“知識提供者”向“自主行動者”角色的進化。在特斯聯看來，智能體產品體驗的進階有賴于底層模型能力及工程能力的“雙輪驅動”，這也是特斯聯推進智能體系列產品研發的核心策略。盡管當前版本HALI對物理世界的高維感知能力尚且有限，但隨著研發的持續推進，HALI將打通更多感知終端，及垂域場景，沉淀更高質量、更多維度的數據，使其有能力理解物理世界更豐富的意涵。