每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

小米開(kāi)源首個(gè)推理大模型 曾說(shuō)不做OpenAI類(lèi)大模型,現(xiàn)開(kāi)出百萬(wàn)元年薪給團(tuán)隊(duì)“招兵買(mǎi)馬”

每日經(jīng)濟(jì)新聞 2025-05-02 00:04:53

4月30日,小米開(kāi)源其首個(gè)推理大模型Xiaomi MiMo,同時(shí)公開(kāi)了小米大模型Core團(tuán)隊(duì)。該模型參數(shù)規(guī)模7B,在數(shù)學(xué)推理和代碼競(jìng)賽測(cè)評(píng)中超越了OpenAI的閉源推理模型o1-mini和阿里Qwen開(kāi)源推理模型QwQ-32B-Preview。此外,小米已啟動(dòng)大模型人才招聘,崗位包括“大模型算法專家”等,招聘詳情顯示,小米大模型的應(yīng)用場(chǎng)景大多與自身業(yè)務(wù)或產(chǎn)品相關(guān)。

每經(jīng)記者|楊卉    每經(jīng)編輯|魏官紅    

曾說(shuō)不做OpenAI類(lèi)大模型的小米變了。

4月30日,小米開(kāi)源其首個(gè)推理大模型Xiaomi MiMo,同時(shí)公開(kāi)了一個(gè)此前未曾公開(kāi)露面的團(tuán)隊(duì):小米大模型Core團(tuán)隊(duì)。根據(jù)小米自己的說(shuō)法,該模型只是團(tuán)隊(duì)的初步嘗試。至于為何還是趕了“晚班車(chē)”,小米方面稱,2025年雖看似是大模型逐夢(mèng)的后半程,不過(guò)還是堅(jiān)信AGI(通用人工智能)征途仍漫長(zhǎng)。

參數(shù)方面,根據(jù)介紹,小米經(jīng)強(qiáng)化學(xué)習(xí)訓(xùn)練形成的MiMo-7B-RL模型,在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開(kāi)測(cè)評(píng)集上,用7B參數(shù)規(guī)模,得分超過(guò)了OpenAI的閉源推理模型o1-mini和阿里Qwen開(kāi)源推理模型QwQ-32B-Preview。

在這篇推介自家大模型的文章末尾,小米還默默公開(kāi)了一個(gè)簡(jiǎn)歷投遞郵箱,為剛成立不久的團(tuán)隊(duì)“招兵買(mǎi)馬”。

《每日經(jīng)濟(jì)新聞》記者注意到,在部分招聘軟件上,小米已經(jīng)上線了大量與大模型相關(guān)的招聘信息,如“大模型算法專家”“大模型推理工程師”“大模型數(shù)據(jù)策略工程師”等,其中公布的年薪最高可達(dá)128萬(wàn)元。此外,從招聘詳情里也能看到小米給大模型落地找到的一些場(chǎng)景,如智能門(mén)鎖、智能音箱、智能招聘、AI(人工智能)面試、AI會(huì)議助理、AI辦公助手、智能客服、智能審核等,大多與其自身現(xiàn)有業(yè)務(wù)或產(chǎn)品相關(guān)。

開(kāi)源首個(gè)推理大模型 模型參數(shù)只有7B

4月30日,一個(gè)頂著黑底白字頭像的微信公眾號(hào)僅憑首條推送,就單槍匹馬掀起了大模型產(chǎn)業(yè)的又一輪熱議。仔細(xì)來(lái)看,這個(gè)頭像傳遞的信息簡(jiǎn)單且直接,黑色背景內(nèi)的一行白字說(shuō)明了來(lái)處:Xiaomi MiMo;賬戶歸屬為北京小米移動(dòng)軟件有限公司,于4月24日將新注冊(cè)公眾號(hào)改名為“Xiaomi MiMo”。

改名后不到一周,小米放出個(gè)“大招”,直接官宣開(kāi)源首個(gè)推理大模型。

根據(jù)推文內(nèi)容,從參數(shù)來(lái)看,隨著DeepSeek-R1引發(fā)業(yè)界強(qiáng)化學(xué)習(xí)(RL)共創(chuàng)潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成為廣泛使用的強(qiáng)化學(xué)習(xí)起步模型。根據(jù)小米方面的說(shuō)法,Xiaomi MiMo是公司首個(gè)為推理而生的大模型,可聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練。在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開(kāi)測(cè)評(píng)集上,MiMo用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開(kāi)源推理模型QwQ-32B-Preview。

圖片來(lái)源:微信公眾號(hào)“Xiaomi MiMo”推文截圖

值得關(guān)注的是,小米這次開(kāi)源的模型參數(shù)規(guī)模只有7B,這就意味著可以在端側(cè)設(shè)備上進(jìn)行本地運(yùn)行,主打一個(gè)經(jīng)濟(jì)高效。

至于推文中提到的預(yù)訓(xùn)練和后訓(xùn)練,據(jù)悉,MiMo推理能力的提升是由預(yù)訓(xùn)練和后訓(xùn)練階段中數(shù)據(jù)和算法等多層面的創(chuàng)新聯(lián)合驅(qū)動(dòng)。其中,預(yù)訓(xùn)練的核心是讓模型見(jiàn)過(guò)更多推理模式,著重挖掘富推理語(yǔ)料,并合成約200B tokens推理數(shù)據(jù)。訓(xùn)練方面共進(jìn)行了三階段訓(xùn)練,逐步提升訓(xùn)練難度,總訓(xùn)練25T tokens。

而后訓(xùn)練的核心則是高效穩(wěn)定的強(qiáng)化學(xué)習(xí)算法和框架,其算法提出Test Difficulty Driven Reward來(lái)緩解困難算法問(wèn)題中的獎(jiǎng)勵(lì)稀疏問(wèn)題,并引入Easy Data Re-Sampling策略,以穩(wěn)定RL訓(xùn)練。框架方面,設(shè)計(jì)了Seamless Rollout系統(tǒng),使得RL訓(xùn)練加速2.29倍,驗(yàn)證可加速1.96倍。

開(kāi)出百萬(wàn)元年薪招聘大模型算法專家 應(yīng)用場(chǎng)景大多與自身業(yè)務(wù)相關(guān)

小米方面稱,MiMo是新成立不久的小米大模型Core團(tuán)隊(duì)的初步嘗試。其實(shí),嚴(yán)格來(lái)說(shuō),小米的大模型團(tuán)隊(duì)Core雖然是第一次帶著作品亮相,但小米有大模型團(tuán)隊(duì)這件事并不是“全網(wǎng)首秀”,小米集團(tuán)早在2023年4月就組建了AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)。

值得深究的是,大模型火熱至今,已經(jīng)從“卷”參數(shù)、“卷”模型進(jìn)入了“卷”落地應(yīng)用的“下半程”,小米此時(shí)趕這個(gè)“晚班車(chē)”意欲何為?

其實(shí),小米曾公開(kāi)表示不會(huì)做大模型。2023年5月24日,小米集團(tuán)披露了2023年第一季度業(yè)績(jī),小米集團(tuán)總裁盧偉冰還在同日的電話財(cái)報(bào)會(huì)上談到了彼時(shí)大廠開(kāi)啟的“大模型競(jìng)賽”。那時(shí),盧偉冰直言,小米集團(tuán)不會(huì)做OpenAI類(lèi)的大模型,但會(huì)積極擁抱AI,將其與自身業(yè)務(wù)深度結(jié)合,提高智能化水平。

時(shí)隔兩年,小米的態(tài)度為何變了?4月30日下午,《每日經(jīng)濟(jì)新聞》記者向小米集團(tuán)方面咨詢大模型團(tuán)隊(duì)的更多信息,截至發(fā)稿未獲有效回復(fù)。不過(guò),根據(jù)微信公眾號(hào)Xiaomi MiMo的推文,小米顯然也意識(shí)到了現(xiàn)在入場(chǎng)并不算早。至于入場(chǎng)原因,小米方面的說(shuō)法是:“2025年雖看似是大模型逐夢(mèng)的后半程,但我們堅(jiān)信AGI的征途仍漫長(zhǎng)。”

值得關(guān)注的是,不管原因?yàn)楹危∶准瘓F(tuán)在做大模型這件事上確實(shí)“上心”了。《每日經(jīng)濟(jì)新聞》記者注意到,在某招聘平臺(tái)上,北京小米移動(dòng)軟件有限公司,也就是Xiaomi MiMo公眾號(hào)的賬號(hào)歸屬方,已經(jīng)開(kāi)始了“招兵買(mǎi)馬”,放出大量與大模型相關(guān)的崗位招聘信息。

具體來(lái)看,在招崗位不少,有“大模型算法”“大模型推理工程師”“大模型數(shù)據(jù)策略工程師”“大模型高性能優(yōu)化工程師”“多模態(tài)大模型算法工程師”“端到端大模型算法工程師”“具身大模型算法工程師”等,部分招聘信息中還寫(xiě)明了“急招”。

圖片來(lái)源:招聘軟件截圖

另外,從招聘詳情中或可以窺見(jiàn)小米做大模型的方向,如直接表明“文生圖,圖生圖大模型算法”,再如“多模態(tài)大模型算法工程師”一職,崗位詳情中提到,需要求職者進(jìn)行大模型算法部署和小型化研究,還需負(fù)責(zé)大模型算法的落地應(yīng)用,包括智能門(mén)鎖、智能音箱等場(chǎng)景。“大模型算法”一職的招聘詳情中還提到,求職者需圍繞智能招聘、AI面試、AI會(huì)議助理、AI辦公助手、智能客服、智能審核等應(yīng)用場(chǎng)景,利用大語(yǔ)言模型和多模態(tài)大模型制定解決方案并進(jìn)行迭代優(yōu)化。

圖片來(lái)源:招聘軟件截圖

從上述信息不難看出,小米做或者用大模型有兩個(gè)傾向,一個(gè)是小型,便于落地端側(cè);還有就是應(yīng)用場(chǎng)景大多與自身業(yè)務(wù)及產(chǎn)品線相關(guān)。至于薪資方面,小米招聘大模型相關(guān)崗位給出的薪資各不相同,其中部分崗位公開(kāi)的最高年薪可達(dá)128萬(wàn)元。

封面圖片來(lái)源:每日經(jīng)濟(jì)新聞 資料圖

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

模型 大模型

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0

国产午夜精品理伦片,亚洲手机在线人成网站播放,欧美一级一级a做性视频,亚洲国产色精品三区二区一区
色一伦一情一区二区三区 | 亚州AV一在线影视 | 亚洲精品色婷婷在线影院麻豆 | 亚洲国产人午夜在线 | 中文字幕自拍偷 | 中文在线中出好看视频 |