首頁(yè) > 正文

互聯(lián)網(wǎng)大廠五一前密集開源新模型,布局各異誰(shuí)將留在牌桌?

2025年05月01日 21:37
來(lái)源: 南方都市報(bào)
編輯:東方財(cái)富網(wǎng)

  趕在五一假期前,國(guó)內(nèi)大模型廠商接連開源。4月29日凌晨,阿里巴巴開源新一代通義千問(wèn)模型Qwen3(簡(jiǎn)稱千問(wèn)3),參數(shù)量?jī)H為DeepSeek-R1的1/3,成本大幅下降,性能全面超越DeepSeek-R1、OpenAI-o1等全球頂尖模型,并迅速成為全球最強(qiáng)開源模型。隨后在4月30日,小米開源首個(gè)為推理而生的大模型Xiaomi MiMo,聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練,全面提升推理能力。4月30日晚,Deepseek也在開源社區(qū)Hugging Face上正式發(fā)布DeepSeek-Prover-V2,并同步上線模型卡及示例代碼。

  兩天內(nèi)3家巨頭大模型宣布開源

  Qwen3包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,阿里云開源了兩個(gè) MoE 模型的權(quán)重,六個(gè)密集模型也已開源,每款模型均斬獲同尺寸開源模型SOTA(最佳性能),其中千問(wèn)3的30B參數(shù)MoE模型實(shí)現(xiàn)了10倍以上的模型性能杠桿提升,僅激活3B就能媲美上代Qwen2.5-32B模型性能。

圖片

  據(jù)悉,阿里云此次開源的千問(wèn)3是國(guó)內(nèi)首個(gè)“混合推理模型”,即將“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,對(duì)簡(jiǎn)單需求可低算力“秒回”答案,對(duì)復(fù)雜問(wèn)題可多步驟“深度思考”,這樣能大大節(jié)省算力消耗。在阿里巴巴千問(wèn)3開源后,上下游供應(yīng)鏈連夜進(jìn)行適配和調(diào)用,NVIDIA、高通、聯(lián)發(fā)科、AMD等多家頭部芯片廠商已成功適配千問(wèn)3。

  其中,阿里云今年已持續(xù)開源了通義萬(wàn)相首尾幀生視頻14B模型、首個(gè)端到端全模態(tài)大模型通義千問(wèn)Qwen2.5-Omni-7B、阿里萬(wàn)相2.1模型、視覺(jué)理解模型Qwen2.5-VL等模型。對(duì)于阿里云的持續(xù)開源策略,知名數(shù)字經(jīng)濟(jì)學(xué)者、工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員盤和林向南都記者表示,阿里云的開源邏輯很簡(jiǎn)單,阿里云的模型是開源、免費(fèi)的,但阿里云的硬件比如算力、各類軟件工具、容器是不免費(fèi)的,開源模型要和自己的數(shù)據(jù)結(jié)合形成自己的AI,阿里云以模型開源來(lái)切入AI應(yīng)用并在別的方面實(shí)現(xiàn)盈利,開源對(duì)阿里整個(gè)云服務(wù)生態(tài)是有利的。

  另外在4月30日,小米官方則表示,其最新開源的Xiaomi MiMo在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開測(cè)評(píng)集上,MiMo僅用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini。值得一提的是,這是小米首次對(duì)外開源其模型,據(jù)悉,MiMo來(lái)自小米內(nèi)部剛成立不久的“小米大模型Core團(tuán)隊(duì)”。


圖片

  4月30日晚,DeepSeek也正式發(fā)布DeepSeek-Prover-V2的兩個(gè)參數(shù)模型,并同步開源、上線模型卡及示例代碼。其中此次共推出兩個(gè)版本DeepSeek-Prover-V2-7B基于上一代 V1.5 模型,支持最長(zhǎng)32K上下文輸入;DeepSeek-Prover-V2-671B則在DeepSeek-V3-Base基礎(chǔ)上訓(xùn)練達(dá)到了推理性能最強(qiáng)。新模型主要專注數(shù)學(xué)定理證明,大幅刷新了多項(xiàng)高難基準(zhǔn)測(cè)試。

  浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院副教授金小剛向南都記者表示,開源不是目的,其實(shí)是手段,不同的企業(yè)為了配合企業(yè)戰(zhàn)略可采取了不同的合作策略?!捌渲?,我對(duì)阿里還是有期待的,期待中國(guó)企業(yè)在開源中借助于群體智能,形成技術(shù)優(yōu)勢(shì),深化場(chǎng)景應(yīng)用。一方面,開源是技術(shù)普惠公眾,因?yàn)槠栈莶艜?huì)讓技術(shù)影響世界;另一方面,大模型公司也會(huì)借助于開源提升產(chǎn)品性能,推動(dòng)應(yīng)用的廣度,其本質(zhì)是共贏?!?/p>

  在開源生態(tài)上,零一萬(wàn)物CEO、創(chuàng)新工場(chǎng)董事長(zhǎng)李開復(fù)表示,阿里通義千問(wèn)Qwen、DeepSeek等中國(guó)自研頂尖開源模型給全世界帶來(lái)了巨大撼動(dòng),也展示了中國(guó)AI探索出了模型訓(xùn)練自主創(chuàng)新的“第二路徑”?!斑@些撼動(dòng)體現(xiàn)在幾個(gè)方面,一是開源模型性能足以匹敵閉源模型,雖然目前OpenAI、Anthropic的頂尖閉源模型在性能上仍然保持一定領(lǐng)先,但是與Qwen3、DeepSeek-R1等優(yōu)秀開源模型相比,領(lǐng)先幅度有限;二是中國(guó)大模型公司用‘多快好省’的模型訓(xùn)練路徑不僅極大節(jié)省了算力,而且強(qiáng)化學(xué)習(xí)的技術(shù)路徑更直接讓模型訓(xùn)練方式從傳統(tǒng)的人工訓(xùn)練AI迭代到了AI訓(xùn)練AI,直接挑戰(zhàn)了OpenAI領(lǐng)銜的‘巨量投入才獲增長(zhǎng)’的‘暴力美學(xué)’,展示了中國(guó)AI探索出了模型訓(xùn)練自主創(chuàng)新的‘第二路徑’?!?/p>

  李開復(fù)還提到,Qwen3一經(jīng)發(fā)布就成為了開源模型中的SOTA(行業(yè)最優(yōu)水平)存在,再次強(qiáng)調(diào)了開源模型的競(jìng)爭(zhēng)力的同時(shí),也為堅(jiān)持只走閉源路線的硅谷巨頭敲響警鐘,“花費(fèi)巨量的資源訓(xùn)出的閉源模型性能僅僅比開源模型略好一點(diǎn),這樣的商業(yè)模式是不可持續(xù)的。而開源模型進(jìn)一步讓大模型價(jià)格接近普惠點(diǎn),促進(jìn)了AI平權(quán),這也讓中國(guó)自研的優(yōu)秀開源模型有進(jìn)一步走出國(guó)門的空間,讓生成式AI驅(qū)動(dòng)的AI 2.0時(shí)代的技術(shù)發(fā)展避免淪為‘富國(guó)的游戲’,讓中國(guó)自主創(chuàng)新的模型技術(shù)賦能更多公司,穿透千行百業(yè),成為越來(lái)越多國(guó)家和地區(qū)實(shí)現(xiàn)AI主權(quán)的利器,真正推進(jìn)和最終實(shí)現(xiàn)AI普惠全人類。”

  大廠布局各異,誰(shuí)能留在牌桌?

  可以看到,在大模型時(shí)代,互聯(lián)網(wǎng)大廠正在遵循各自的優(yōu)勢(shì)進(jìn)行布局。其中,阿里通過(guò)加大資金和人才投入,以云計(jì)算網(wǎng)絡(luò)作為底層,以通義大模型為底座,在C端應(yīng)用上則布局了夸克和釘釘;百度也在以B端布局智能云、C端布局AI搜索,應(yīng)用方面布局秒噠、心響、文庫(kù)等;字節(jié)則主要以火山引擎布局云計(jì)算,并押注了全域的多個(gè)模型應(yīng)用;騰訊方面,今年3月騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示,用戶需求是騰訊大模型的出發(fā)點(diǎn),騰訊將以“核心技術(shù)自研+積極擁抱開源”的多模型策略打造“好用的AI”。在云方面,騰訊云智算已服務(wù)90%的國(guó)內(nèi)大模型廠商,成為美團(tuán)、快手、小紅書、百川等各行業(yè)數(shù)萬(wàn)客戶的穩(wěn)固算力底座。

  在這一輪AI競(jìng)爭(zhēng)中,大廠中誰(shuí)能留在“牌桌”上?今年3 月 20 日,李開復(fù)接受媒體采訪時(shí)表示,在中美兩國(guó)超大模型的預(yù)訓(xùn)練都在逐漸寡頭化,并且寡頭化的程度在不斷加大。他預(yù)測(cè)中國(guó)大模型領(lǐng)域未來(lái)將會(huì)收斂至 DeepSeek、阿里巴巴、字節(jié)跳動(dòng)三家,其中以 DeepSeek 勢(shì)頭最猛。美國(guó)則以xAI的發(fā)展勢(shì)頭最為迅速,但OpenAI、Anthropic、Google也都會(huì)做出令人敬佩的研發(fā)工作。

  近期李開復(fù)再次對(duì)這一預(yù)判進(jìn)行闡釋,他提到,目前萬(wàn)億參數(shù)以上的超大模型仍具備重大的戰(zhàn)略價(jià)值,但往后會(huì)更偏向“教師模型”角色,即用來(lái)訓(xùn)練輕量化、性能優(yōu)秀同時(shí)更易于穿透產(chǎn)業(yè)創(chuàng)造價(jià)值的產(chǎn)業(yè)大模型等。目前中美大模型公司已進(jìn)入到寡頭化階段,仍能繼續(xù)承擔(dān)做超大模型的公司,需要有極強(qiáng)的資金能力和工程能力。

  他還特別提到阿里、字節(jié)和DeepSeek各自的優(yōu)勢(shì)。在李開復(fù)看來(lái),DeepSeek背靠資源雄厚的幻方量化,資金充足,團(tuán)隊(duì)本身也具備很強(qiáng)的工程能力,能夠在不過(guò)度燒錢的前提下持續(xù)訓(xùn)練出優(yōu)質(zhì)模型。

  而字節(jié)和阿里則擁有另一個(gè)可持續(xù)模式,即公司背后存在著巨大的用戶量和商業(yè)化空間來(lái)支撐超大模型的訓(xùn)練?!霸谶@方面,阿里和字節(jié)跳動(dòng)顯然具備這樣的巨大優(yōu)勢(shì)。超大參數(shù)模型的訓(xùn)練花費(fèi)會(huì)很高,但是如果模型能夠?yàn)槊總€(gè)用戶都能帶來(lái)價(jià)值,促進(jìn)商業(yè)變現(xiàn)的進(jìn)程,那么分?jǐn)傁聛?lái)投入產(chǎn)出比對(duì)于阿里這樣身段的公司而言是健康良性的生態(tài)閉環(huán)。目前Qwen和DeepSeek的模型性能都很出色,在全球開源社群里,Qwen也積累了很高的聲望,包括DeepSeek的幾個(gè)開源模型也公開表達(dá)受到Qwen開源模型的啟發(fā)。字節(jié)跳動(dòng)今天在學(xué)術(shù)界、模型界以及開源界,還沒(méi)有像Qwen那么知名。但是字節(jié)有資源、有用戶和場(chǎng)景,目前來(lái)看也有長(zhǎng)期投入的決心,相信很快會(huì)有出色的研究工作披露?!崩铋_復(fù)稱。

  盤和林則認(rèn)為,“字節(jié)如今在牌桌上優(yōu)勢(shì)最大,因?yàn)橛脩舸蠖鄶?shù)是內(nèi)容創(chuàng)作者,生成式也是當(dāng)前AI最大的需求場(chǎng)景;騰訊則借助微信的用戶流量,未來(lái)以移動(dòng)應(yīng)用工具為主;阿里背靠阿里云以開源打造AI生態(tài),以阿里云服務(wù)來(lái)變現(xiàn);至于百度,主要是將AI和搜索效果結(jié)合起來(lái)。這里面,我認(rèn)為阿里最激進(jìn),字節(jié)用戶普及度較高,預(yù)計(jì)都能留在牌桌上?!?/p>

(文章來(lái)源:南方都市報(bào))

(原標(biāo)題:互聯(lián)網(wǎng)大廠五一前密集開源新模型,布局各異誰(shuí)將留在牌桌?)

(責(zé)任編輯:137)

 
 
 
 

網(wǎng)友點(diǎn)擊排行

 
  • 基金
  • 財(cái)經(jīng)
  • 股票
  • 基金吧
 
鄭重聲明:天天基金網(wǎng)發(fā)布此信息目的在于傳播更多信息,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。天天基金網(wǎng)不保證該信息(包括但不限于文字、數(shù)據(jù)及圖表)全部或者部分內(nèi)容的準(zhǔn)確性、真實(shí)性、完整性、有效性、及時(shí)性、原創(chuàng)性等。相關(guān)信息并未經(jīng)過(guò)本網(wǎng)站證實(shí),不對(duì)您構(gòu)成任何投資決策建議,據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。數(shù)據(jù)來(lái)源:東方財(cái)富Choice數(shù)據(jù)。

將天天基金網(wǎng)設(shè)為上網(wǎng)首頁(yè)嗎?      將天天基金網(wǎng)添加到收藏夾嗎?

關(guān)于我們|資質(zhì)證明|研究中心|聯(lián)系我們|安全指引|免責(zé)條款|隱私條款|風(fēng)險(xiǎn)提示函|意見(jiàn)建議|在線客服|誠(chéng)聘英才

天天基金客服熱線:95021 |客服郵箱:vip@1234567.com.cn|人工服務(wù)時(shí)間:工作日 7:30-21:30 雙休日 9:00-21:30
鄭重聲明:天天基金系證監(jiān)會(huì)批準(zhǔn)的基金銷售機(jī)構(gòu)[000000303]。天天基金網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前請(qǐng)核實(shí),風(fēng)險(xiǎn)自負(fù)。
中國(guó)證監(jiān)會(huì)上海監(jiān)管局網(wǎng)址:www.csrc.gov.cn/pub/shanghai
CopyRight  上海天天基金銷售有限公司  2011-現(xiàn)在  滬ICP證:滬B2-20130026  網(wǎng)站備案號(hào):滬ICP備11042629號(hào)-1

A
安聯(lián)基金安信基金
B
博道基金渤海匯金北京京管泰富基金百嘉基金貝萊德基金管理博時(shí)基金北信瑞豐寶盈基金博遠(yuǎn)基金
C
長(zhǎng)安基金長(zhǎng)城基金長(zhǎng)城證券財(cái)達(dá)證券淳厚基金創(chuàng)金合信基金長(zhǎng)江證券(上海)資管長(zhǎng)盛基金財(cái)通基金財(cái)通資管誠(chéng)通證券長(zhǎng)信基金財(cái)信證券
D
德邦基金德邦證券資管大成基金東財(cái)基金達(dá)誠(chéng)基金東方阿爾法基金東方紅資產(chǎn)管理東方基金東莞證券東海基金東海證券東吳基金東吳證券東興基金東興證券第一創(chuàng)業(yè)東證融匯證券資產(chǎn)管理
F
富安達(dá)基金蜂巢基金富達(dá)基金(中國(guó))富國(guó)基金富榮基金方正富邦基金方正證券
G
光大保德信基金國(guó)都證券廣發(fā)基金廣發(fā)資產(chǎn)管理國(guó)海富蘭克林基金國(guó)海證券國(guó)金基金國(guó)聯(lián)安基金國(guó)聯(lián)基金格林基金國(guó)聯(lián)民生國(guó)聯(lián)證券資產(chǎn)管理國(guó)融基金國(guó)壽安?;?/a>國(guó)泰君安資管國(guó)泰基金國(guó)投瑞銀基金國(guó)投證券國(guó)投證券資產(chǎn)管理國(guó)新國(guó)證基金國(guó)信證券國(guó)新證券股份國(guó)信證券資產(chǎn)管理工銀瑞信基金國(guó)元證券
H
華安基金匯安基金華安證券華安證券資產(chǎn)管理匯百川基金華寶基金華宸未來(lái)基金華創(chuàng)證券泓德基金華富基金匯豐晉信基金海富通基金宏利基金匯泉基金華潤(rùn)元大基金華商基金惠升基金恒生前海基金華泰柏瑞基金華泰保興基金紅土創(chuàng)新基金匯添富基金紅塔紅土恒泰證券華泰證券(上海)資產(chǎn)管理華夏基金華西基金華鑫證券合煦智遠(yuǎn)基金恒越基金弘毅遠(yuǎn)方基金
J
嘉合基金景順長(zhǎng)城基金嘉實(shí)基金九泰基金建信基金江信基金金信基金金鷹基金金元順安基金交銀施羅德基金
K
凱石基金
L
聯(lián)博基金路博邁基金(中國(guó))
M
摩根士丹利基金摩根資產(chǎn)管理民生加銀基金明亞基金
N
諾安基金諾德基金南方基金南華基金南京證券農(nóng)銀匯理基金
P
平安基金平安證券鵬華基金浦銀安盛基金鵬揚(yáng)基金
Q
泉果基金前海開源基金前海聯(lián)合
R
人保資產(chǎn)瑞達(dá)基金融通基金睿遠(yuǎn)基金
S
上海光大證券資產(chǎn)管理上海海通證券資產(chǎn)管理上海證券施羅德基金(中國(guó))申萬(wàn)宏源證券申萬(wàn)宏源證券資產(chǎn)管理申萬(wàn)菱信基金蘇新基金山西證券上銀基金尚正基金山證(上海)資產(chǎn)管理
T
天風(fēng)(上海)證券資產(chǎn)管理天風(fēng)證券天弘基金泰康基金太平基金太平洋同泰基金泰信基金天治基金
W
萬(wàn)家基金萬(wàn)聯(lián)資管
X
西部利得基金西部證券湘財(cái)基金湘財(cái)證券信達(dá)澳亞基金信達(dá)證券先鋒基金新華基金興合基金興華基金西南證券新沃基金興業(yè)基金鑫元基金興銀基金管理興證全球基金興證資管
Y
英大基金易方達(dá)基金銀河金匯證券銀華基金銀河基金粵開證券益民基金易米基金圓信永豐基金永贏基金
Z
中庚基金中?;?/a>中航基金中金財(cái)富中金公司中加基金中金基金中科沃土基金中歐基金朱雀基金招商基金浙商基金浙商證券資管招商證券資管中泰證券(上海)資管中信保誠(chéng)基金中信建投中信建投基金中信證券中信證券資產(chǎn)管理中銀基金中郵基金中銀證券中原證券