要聞

事關(guān)DeepSeek，騰訊宣布重大更新！

每日經(jīng)濟(jì)新聞 2025-03-26 11:10:26

每經(jīng)編輯｜段煉

3月26日凌晨，騰訊元寶迎來重大升級(jí)，同時(shí)接入兩大模型：深度思考模型“騰訊混元T1”正式版，和DeepSeek V3-0324最新版。

CFF20LXzkOyq44HO6rP99C8gmaSJIPCiaicMAjGpeJzJxVnibczqQQLoibjeicuA8Xbgkt7f1ZQibuLqicGE40IoIKWUQ.png

升級(jí)后，元寶的能力全面增強(qiáng)，在編程、數(shù)學(xué)推理和長(zhǎng)文本處理等場(chǎng)景中的表現(xiàn)更加出色。

其中，混元T1正式版，基于新一代快思考模型Turbo S底座升級(jí)，是一款能秒回、吐字快、擅長(zhǎng)超長(zhǎng)文處理的強(qiáng)推理模型，創(chuàng)新采用混合Mamba架構(gòu)，性能保持業(yè)界領(lǐng)先，適合處理學(xué)術(shù)論文、策劃方案、長(zhǎng)篇內(nèi)容等各類深度思考任務(wù)；

元寶部署的DeepSeek V3最新版，則擅長(zhǎng)快速生成，一句話指令就能寫代碼，更強(qiáng)的前端開發(fā)能力，實(shí)現(xiàn)網(wǎng)站和App開發(fā)。解數(shù)學(xué)題、文本創(chuàng)作的表現(xiàn)也較前代更快更準(zhǔn)，能勝任各類高頻使用場(chǎng)景。

值得一提的是，騰訊元寶是最早一批接入 DeepSeek V3-0324版本的AI應(yīng)用，從模型開源到上線僅用1天。

目前，騰訊元寶的“混元+DeepSeek”雙模型均支持深度思考和秒出答案。近期，元寶持續(xù)高頻更新，35天迭代30個(gè)版本，不斷上線實(shí)用功能。所有能力均免費(fèi)開放、不限次數(shù)，覆蓋更多工作、學(xué)習(xí)和生活場(chǎng)景。

騰訊表示，騰訊元寶將繼續(xù)堅(jiān)持雙模，始終為用戶提供更好的、更先進(jìn)的模型，并第一時(shí)間部署，為大家打造“好用的 AI”。

此前，3月21日深夜，騰訊宣布推出自研深度思考模型混元T1正式版，并同步在騰訊云官網(wǎng)上線。

據(jù)騰訊介紹，混元T1正式版通過大規(guī)模強(qiáng)化學(xué)習(xí)，并結(jié)合數(shù)學(xué)、邏輯推理、科學(xué)和代碼等理科難題的專項(xiàng)優(yōu)化，推理能力得到進(jìn)一步提升。與此前已上線騰訊元寶的混元T1-preview模型相比，綜合效果也有了明顯提升。

在一些常見的基準(zhǔn)測(cè)試上，比如大語言模型評(píng)估增強(qiáng)數(shù)據(jù)集MMLU-PRO中，混元T1的評(píng)分僅次于OpenAI-o1，優(yōu)于DeepSeek-R1。

kw2nrMk65seJHQuB6JfZlZ3LpA3UhYOXVl5qFlFlibHAJ8H4PibmcYOibhT0wXFiaTqqapXPJO07gSKZE1usZwp2aQ.png

在評(píng)估邏輯推理能力的DROP F1測(cè)試中，混元T1的評(píng)分也優(yōu)于DeepSeek-R1和OpenAI-o1。不過在數(shù)學(xué)和代碼能力測(cè)試中，混元T1的評(píng)分都低于DeepSeek-R1。在中文語言理解能力方面，混元T1與DeepSeek-R1的評(píng)分齊平。

整體來看，混元T1正式版的成績(jī)已經(jīng)達(dá)到了業(yè)界領(lǐng)先推理模型的水平。但騰訊官方此次并未披露混元T1的參數(shù)量級(jí)，所以并不清楚其是用多少訓(xùn)練數(shù)據(jù)實(shí)現(xiàn)這一性能。

編輯|段煉?蓋源源

校對(duì)|劉思琦

封面圖片：視覺中國(guó)

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png