每日經(jīng)濟(jì)新聞 2025-03-26 11:10:26
每經(jīng)編輯|段煉
3月26日凌晨,騰訊元寶迎來重大升級(jí),同時(shí)接入兩大模型:深度思考模型“騰訊混元T1”正式版,和DeepSeek V3-0324最新版。
升級(jí)后,元寶的能力全面增強(qiáng),在編程、數(shù)學(xué)推理和長(zhǎng)文本處理等場(chǎng)景中的表現(xiàn)更加出色。
其中,混元T1正式版,基于新一代快思考模型Turbo S底座升級(jí),是一款能秒回、吐字快、擅長(zhǎng)超長(zhǎng)文處理的強(qiáng)推理模型,創(chuàng)新采用混合Mamba架構(gòu),性能保持業(yè)界領(lǐng)先,適合處理學(xué)術(shù)論文、策劃方案、長(zhǎng)篇內(nèi)容等各類深度思考任務(wù);
元寶部署的DeepSeek V3最新版,則擅長(zhǎng)快速生成,一句話指令就能寫代碼,更強(qiáng)的前端開發(fā)能力,實(shí)現(xiàn)網(wǎng)站和App開發(fā)。解數(shù)學(xué)題、文本創(chuàng)作的表現(xiàn)也較前代更快更準(zhǔn),能勝任各類高頻使用場(chǎng)景。
值得一提的是,騰訊元寶是最早一批接入 DeepSeek V3-0324版本的AI應(yīng)用,從模型開源到上線僅用1天。
目前,騰訊元寶的“混元+DeepSeek”雙模型均支持深度思考和秒出答案。近期,元寶持續(xù)高頻更新,35天迭代30個(gè)版本,不斷上線實(shí)用功能。所有能力均免費(fèi)開放、不限次數(shù),覆蓋更多工作、學(xué)習(xí)和生活場(chǎng)景。
騰訊表示,騰訊元寶將繼續(xù)堅(jiān)持雙模,始終為用戶提供更好的、更先進(jìn)的模型,并第一時(shí)間部署,為大家打造“好用的 AI”。
此前,3月21日深夜,騰訊宣布推出自研深度思考模型混元T1正式版,并同步在騰訊云官網(wǎng)上線。
據(jù)騰訊介紹,混元T1正式版通過大規(guī)模強(qiáng)化學(xué)習(xí),并結(jié)合數(shù)學(xué)、邏輯推理、科學(xué)和代碼等理科難題的專項(xiàng)優(yōu)化,推理能力得到進(jìn)一步提升。與此前已上線騰訊元寶的混元T1-preview模型相比,綜合效果也有了明顯提升。
在一些常見的基準(zhǔn)測(cè)試上,比如大語言模型評(píng)估增強(qiáng)數(shù)據(jù)集MMLU-PRO中,混元T1的評(píng)分僅次于OpenAI-o1,優(yōu)于DeepSeek-R1。
在評(píng)估邏輯推理能力的DROP F1測(cè)試中,混元T1的評(píng)分也優(yōu)于DeepSeek-R1和OpenAI-o1。不過在數(shù)學(xué)和代碼能力測(cè)試中,混元T1的評(píng)分都低于DeepSeek-R1。在中文語言理解能力方面,混元T1與DeepSeek-R1的評(píng)分齊平。
整體來看,混元T1正式版的成績(jī)已經(jīng)達(dá)到了業(yè)界領(lǐng)先推理模型的水平。但騰訊官方此次并未披露混元T1的參數(shù)量級(jí),所以并不清楚其是用多少訓(xùn)練數(shù)據(jù)實(shí)現(xiàn)這一性能。
編輯|段煉?蓋源源
校對(duì)|劉思琦
封面圖片:視覺中國(guó)
每日經(jīng)濟(jì)新聞綜合自每經(jīng)網(wǎng)、騰訊云、21世紀(jì)經(jīng)濟(jì)報(bào)道、公開資料等
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP