MoneyDJ新聞 2025-03-24 09:16:44 記者 新聞中心 報導
綜合港媒及陸媒報導,騰訊控股(0700.HK)旗下騰訊混元於上週六(22日)宣布,正式推出自研深度思考模式混元T1正式版。混元T1已在騰訊雲官網上線,輸入價格為每百萬tokens 1元(人民幣,下同),輸入價格與行業差距不大,但輸出價格每百萬tokens 4元,為DeepSeek(深度求索;DS)標準時段的四分一價格。
在體現推理模型基礎能力的常見指標方面,如大語言模型評估增強資料集MMLU-PRO中,混元T1取得87.2分,僅次於OpenAI o1;在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基準測試中,混元T1的成績亦達到業界領先推理模型水準。
騰訊指出,T1正式版沿用混元Turbo S的創新架構,採用Hybrid-Mamba-Transformer融合模式,為工業界首次將混合Mamba架構無損應用於超大型推理模型,此一架構有效降低傳統Transformer結構的計算複雜度,減少KV-Cache的記憶體占用,進而顯著降低訓練和推理成本。
騰訊指出,T1吐字快、能秒回,且擅長超長文處理,是騰訊自研的強推理模型,透過大規模強化學習,並結合數學、邏輯推理、科學和代碼等理科難題的專項優化,混元T1正式版進一步提升了推理能力。T1並於多項對齊任務、指令跟隨任務和工具利用任務中展現出了強大的適應性。