熱門:
小米開(kāi)源首個(gè)推理大模型 曾說(shuō)不做OpenAI類大模型 現(xiàn)開(kāi)出百萬(wàn)元年薪給團(tuán)隊(duì)“招兵買馬”
曾說(shuō)不做OpenAI類大模型的小米變了。
4月30日,小米開(kāi)源其首個(gè)推理大模型Xiaomi MiMo,同時(shí)公開(kāi)了一個(gè)此前未曾公開(kāi)露面的團(tuán)隊(duì):小米大模型Core團(tuán)隊(duì)。根據(jù)小米自己的說(shuō)法,該模型只是團(tuán)隊(duì)的初步嘗試。至于為何還是趕了“晚班車”,小米方面稱,2025年雖看似是大模型逐夢(mèng)的后半程,不過(guò)還是堅(jiān)信AGI(通用人工智能)征途仍漫長(zhǎng)。
參數(shù)方面,根據(jù)介紹,小米經(jīng)強(qiáng)化學(xué)習(xí)訓(xùn)練形成的MiMo-7B-RL模型,在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開(kāi)測(cè)評(píng)集上,用7B參數(shù)規(guī)模,得分超過(guò)了OpenAI的閉源推理模型o1-mini和阿里Qwen開(kāi)源推理模型QwQ-32B-Preview。
在這篇推介自家大模型的文章末尾,小米還默默公開(kāi)了一個(gè)簡(jiǎn)歷投遞郵箱,為剛成立不久的團(tuán)隊(duì)“招兵買馬”。
《每日經(jīng)濟(jì)新聞》記者注意到,在部分招聘軟件上,小米已經(jīng)上線了大量與大模型相關(guān)的招聘信息,如“大模型算法專家”“大模型推理工程師”“大模型數(shù)據(jù)策略工程師”等,其中公布的年薪最高可達(dá)128萬(wàn)元。此外,從招聘詳情里也能看到小米給大模型落地找到的一些場(chǎng)景,如智能門鎖、智能音箱、智能招聘、AI(人工智能)面試、AI會(huì)議助理、AI辦公助手、智能客服、智能審核等,大多與其自身現(xiàn)有業(yè)務(wù)或產(chǎn)品相關(guān)。
開(kāi)源首個(gè)推理大模型 模型參數(shù)只有7B
4月30日,一個(gè)頂著黑底白字頭像的微信公眾號(hào)僅憑首條推送,就單槍匹馬掀起了大模型產(chǎn)業(yè)的又一輪熱議。仔細(xì)來(lái)看,這個(gè)頭像傳遞的信息簡(jiǎn)單且直接,黑色背景內(nèi)的一行白字說(shuō)明了來(lái)處:Xiaomi MiMo;賬戶歸屬為北京小米移動(dòng)軟件有限公司,于4月24日將新注冊(cè)公眾號(hào)改名為“Xiaomi MiMo”。
改名后不到一周,小米放出個(gè)“大招”,直接官宣開(kāi)源首個(gè)推理大模型。
根據(jù)推文內(nèi)容,從參數(shù)來(lái)看,隨著DeepSeek-R1引發(fā)業(yè)界強(qiáng)化學(xué)習(xí)(RL)共創(chuàng)潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成為廣泛使用的強(qiáng)化學(xué)習(xí)起步模型。根據(jù)小米方面的說(shuō)法,Xiaomi MiMo是公司首個(gè)為推理而生的大模型,可聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練。在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開(kāi)測(cè)評(píng)集上,MiMo用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開(kāi)源推理模型QwQ-32B-Preview。

圖片來(lái)源:微信公眾號(hào)“Xiaomi MiMo”推文截圖
值得關(guān)注的是,小米這次開(kāi)源的模型參數(shù)規(guī)模只有7B,這就意味著可以在端側(cè)設(shè)備上進(jìn)行本地運(yùn)行,主打一個(gè)經(jīng)濟(jì)高效。
至于推文中提到的預(yù)訓(xùn)練和后訓(xùn)練,據(jù)悉,MiMo推理能力的提升是由預(yù)訓(xùn)練和后訓(xùn)練階段中數(shù)據(jù)和算法等多層面的創(chuàng)新聯(lián)合驅(qū)動(dòng)。其中,預(yù)訓(xùn)練的核心是讓模型見(jiàn)過(guò)更多推理模式,著重挖掘富推理語(yǔ)料,并合成約200B tokens推理數(shù)據(jù)。訓(xùn)練方面共進(jìn)行了三階段訓(xùn)練,逐步提升訓(xùn)練難度,總訓(xùn)練25T tokens。
而后訓(xùn)練的核心則是高效穩(wěn)定的強(qiáng)化學(xué)習(xí)算法和框架,其算法提出Test Difficulty Driven Reward來(lái)緩解困難算法問(wèn)題中的獎(jiǎng)勵(lì)稀疏問(wèn)題,并引入Easy Data Re-Sampling策略,以穩(wěn)定RL訓(xùn)練。框架方面,設(shè)計(jì)了Seamless Rollout系統(tǒng),使得RL訓(xùn)練加速2.29倍,驗(yàn)證可加速1.96倍。
開(kāi)出百萬(wàn)元年薪招聘大模型算法專家 應(yīng)用場(chǎng)景大多與自身業(yè)務(wù)相關(guān)
小米方面稱,MiMo是新成立不久的小米大模型Core團(tuán)隊(duì)的初步嘗試。其實(shí),嚴(yán)格來(lái)說(shuō),小米的大模型團(tuán)隊(duì)Core雖然是第一次帶著作品亮相,但小米有大模型團(tuán)隊(duì)這件事并不是“全網(wǎng)首秀”,小米集團(tuán)早在2023年4月就組建了AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)。
值得深究的是,大模型火熱至今,已經(jīng)從“卷”參數(shù)、“卷”模型進(jìn)入了“卷”落地應(yīng)用的“下半程”,小米此時(shí)趕這個(gè)“晚班車”意欲何為?
其實(shí),小米曾公開(kāi)表示不會(huì)做大模型。2023年5月24日,小米集團(tuán)披露了2023年第一季度業(yè)績(jī),小米集團(tuán)總裁盧偉冰還在同日的電話財(cái)報(bào)會(huì)上談到了彼時(shí)大廠開(kāi)啟的“大模型競(jìng)賽”。那時(shí),盧偉冰直言,小米集團(tuán)不會(huì)做OpenAI類的大模型,但會(huì)積極擁抱AI,將其與自身業(yè)務(wù)深度結(jié)合,提高智能化水平。
時(shí)隔兩年,小米的態(tài)度為何變了?4月30日下午,《每日經(jīng)濟(jì)新聞》記者向小米集團(tuán)方面咨詢大模型團(tuán)隊(duì)的更多信息,截至發(fā)稿未獲有效回復(fù)。不過(guò),根據(jù)微信公眾號(hào)Xiaomi MiMo的推文,小米顯然也意識(shí)到了現(xiàn)在入場(chǎng)并不算早。至于入場(chǎng)原因,小米方面的說(shuō)法是:“2025年雖看似是大模型逐夢(mèng)的后半程,但我們堅(jiān)信AGI的征途仍漫長(zhǎng)?!?/p>
值得關(guān)注的是,不管原因?yàn)楹危∶准瘓F(tuán)在做大模型這件事上確實(shí)“上心”了。《每日經(jīng)濟(jì)新聞》記者注意到,在某招聘平臺(tái)上,北京小米移動(dòng)軟件有限公司,也就是Xiaomi MiMo公眾號(hào)的賬號(hào)歸屬方,已經(jīng)開(kāi)始了“招兵買馬”,放出大量與大模型相關(guān)的崗位招聘信息。
具體來(lái)看,在招崗位不少,有“大模型算法”“大模型推理工程師”“大模型數(shù)據(jù)策略工程師”“大模型高性能優(yōu)化工程師”“多模態(tài)大模型算法工程師”“端到端大模型算法工程師”“具身大模型算法工程師”等,部分招聘信息中還寫明了“急招”。

圖片來(lái)源:招聘軟件截圖
另外,從招聘詳情中或可以窺見(jiàn)小米做大模型的方向,如直接表明“文生圖,圖生圖大模型算法”,再如“多模態(tài)大模型算法工程師”一職,崗位詳情中提到,需要求職者進(jìn)行大模型算法部署和小型化研究,還需負(fù)責(zé)大模型算法的落地應(yīng)用,包括智能門鎖、智能音箱等場(chǎng)景?!按竽P退惴ā币宦毜恼衅冈斍橹羞€提到,求職者需圍繞智能招聘、AI面試、AI會(huì)議助理、AI辦公助手、智能客服、智能審核等應(yīng)用場(chǎng)景,利用大語(yǔ)言模型和多模態(tài)大模型制定解決方案并進(jìn)行迭代優(yōu)化。

圖片來(lái)源:招聘軟件截圖
從上述信息不難看出,小米做或者用大模型有兩個(gè)傾向,一個(gè)是小型,便于落地端側(cè);還有就是應(yīng)用場(chǎng)景大多與自身業(yè)務(wù)及產(chǎn)品線相關(guān)。至于薪資方面,小米招聘大模型相關(guān)崗位給出的薪資各不相同,其中部分崗位公開(kāi)的最高年薪可達(dá)128萬(wàn)元。
(文章來(lái)源:每日經(jīng)濟(jì)新聞)
(原標(biāo)題:小米開(kāi)源首個(gè)推理大模型 曾說(shuō)不做OpenAI類大模型,現(xiàn)開(kāi)出百萬(wàn)元年薪給團(tuán)隊(duì)“招兵買馬”)
(責(zé)任編輯:137)
網(wǎng)友點(diǎn)擊排行
- 基金
- 財(cái)經(jīng)
- 股票
- 基金吧
將天天基金網(wǎng)設(shè)為上網(wǎng)首頁(yè)嗎? 將天天基金網(wǎng)添加到收藏夾嗎?
關(guān)于我們|資質(zhì)證明|研究中心|聯(lián)系我們|安全指引|免責(zé)條款|隱私條款|風(fēng)險(xiǎn)提示函|意見(jiàn)建議|在線客服|誠(chéng)聘英才
天天基金客服熱線:95021 |客服郵箱:vip@1234567.com.cn|人工服務(wù)時(shí)間:工作日 7:30-21:30 雙休日 9:00-21:30
鄭重聲明:天天基金系證監(jiān)會(huì)批準(zhǔn)的基金銷售機(jī)構(gòu)[000000303]。天天基金網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前請(qǐng)核實(shí),風(fēng)險(xiǎn)自負(fù)。
中國(guó)證監(jiān)會(huì)上海監(jiān)管局網(wǎng)址:www.csrc.gov.cn/pub/shanghai
CopyRight 上海天天基金銷售有限公司 2011-現(xiàn)在 滬ICP證:滬B2-20130026 網(wǎng)站備案號(hào):滬ICP備11042629號(hào)-1
- C
- 長(zhǎng)安基金長(zhǎng)城基金長(zhǎng)城證券財(cái)達(dá)證券淳厚基金創(chuàng)金合信基金長(zhǎng)江證券(上海)資管長(zhǎng)盛基金財(cái)通基金財(cái)通資管誠(chéng)通證券長(zhǎng)信基金財(cái)信證券
- D
- 德邦基金德邦證券資管大成基金東財(cái)基金達(dá)誠(chéng)基金東方阿爾法基金東方紅資產(chǎn)管理東方基金東莞證券東?;?/a>東海證券東吳基金東吳證券東興基金東興證券第一創(chuàng)業(yè)東證融匯證券資產(chǎn)管理
- G
- 光大保德信基金國(guó)都證券廣發(fā)基金廣發(fā)資產(chǎn)管理國(guó)海富蘭克林基金國(guó)海證券國(guó)金基金國(guó)聯(lián)安基金國(guó)聯(lián)基金格林基金國(guó)聯(lián)民生國(guó)聯(lián)證券資產(chǎn)管理國(guó)融基金國(guó)壽安?;?/a>國(guó)泰君安資管國(guó)泰基金國(guó)投瑞銀基金國(guó)投證券國(guó)投證券資產(chǎn)管理國(guó)新國(guó)證基金國(guó)信證券國(guó)新證券股份國(guó)信證券資產(chǎn)管理工銀瑞信基金國(guó)元證券