MoneyDJ新聞 2025-02-26 08:07:48 記者 新聞中心 報導
綜合港媒報導,據路透社引述消息人士透露,中國人工智慧(AI)新創公司DeepSeek(深度求索;DS)正加速推出R1模型的後續版本,其原計劃於今(2025)年5月初發布 R2,但現在希望能盡早推出,具體時間則未透露。
DeepSeek本週啟動「開源週」,週一開源代碼庫為FlashMLA, 針對Hopper GPU優化的高效MLA解碼內核,專為處理可變長度序列而設計;昨(25)日開源DeepEP,為首個專用於MoE模型訓練和推理設計的EP通信庫。
在此之前,據路透社報導指出,根據六名知情人士表示,由於對DeepSeek低成本人工智慧模型的需求激增,中國企業正在增加輝達H20人工智慧晶片的訂單。H20是輝達為中國市場定製的人工智慧晶片。
其中兩位知情人士表示,自DeepSeek於上(1)月進入全球公眾視野以來,騰訊(0700.HK)、阿里巴巴(9988.HK)和字節跳動對H20的訂單「大幅增加」。報導中並指出,醫療保健和教育等行業的小型企業也在購買配備DeepSeek模型和輝達H20晶片的AI伺服器,惟訂單規模細節尚未披露。
*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。