圖:內(nèi)地應(yīng)構(gòu)建統(tǒng)一軟件平臺(tái):由工信部牽頭,聯(lián)合企業(yè)制定國(guó)產(chǎn)GPU統(tǒng)一API標(biāo)準(zhǔn),減少碎片化適配的成本。
圖形處理器(GPU)作為算力基礎(chǔ)設(shè)施的核心組件,已從傳統(tǒng)圖形渲染領(lǐng)域擴(kuò)展至人工智能、云計(jì)算、智能駕駛等戰(zhàn)略賽道,成為全球科技競(jìng)爭(zhēng)的關(guān)鍵制高點(diǎn)。本文通過(guò)對(duì)比中美兩國(guó)GPU產(chǎn)業(yè)發(fā)展差異,剖析雙方核心競(jìng)爭(zhēng)力來(lái)源,并基于中國(guó)產(chǎn)業(yè)現(xiàn)狀提出突圍路徑建議。
中國(guó)與美國(guó)作為全球兩大經(jīng)濟(jì)體,目前形成了截然不同的產(chǎn)業(yè)發(fā)展路徑:美國(guó)依托技術(shù)積累與生態(tài)壟斷構(gòu)建了“創(chuàng)新─標(biāo)準(zhǔn)─收益”的良性循環(huán),中國(guó)則通過(guò)“政策牽引─應(yīng)用驅(qū)動(dòng)─自主突破”的模式加速國(guó)產(chǎn)替代。
技術(shù)發(fā)展路徑分析
1)核心技術(shù)突破方向
美國(guó)GPU技術(shù)演進(jìn)呈現(xiàn)“架構(gòu)創(chuàng)新+制程領(lǐng)先”雙輪驅(qū)動(dòng)。英偉達(dá)H100芯片采用臺(tái)積電4納米工藝,集成800億晶體管,其Transformer引擎使大模型訓(xùn)練效率提升30倍,單機(jī)柜算力密度達(dá)16PFlops。在先進(jìn)封裝領(lǐng)域,英偉達(dá)CoWoS技術(shù)實(shí)現(xiàn)8顆H100芯片的3D堆疊,內(nèi)存帶寬突破3.3TB/s。AMD則通過(guò)Chiplet設(shè)計(jì)降低成本,MI300X芯片采用13個(gè)小芯片集成,顯存容量達(dá)192GB,在AI推理場(chǎng)景性價(jià)比優(yōu)勢(shì)顯著。
中國(guó)技術(shù)突破聚焦“特色工藝+場(chǎng)景優(yōu)化”。中芯國(guó)際14納米FinFET工藝良率提升至95%,支撐景嘉微JM9系列實(shí)現(xiàn)1.5TFLOPs的浮點(diǎn)運(yùn)算能力,性能接近GTX 1050水平,2023年產(chǎn)量突破50萬(wàn)片。在先進(jìn)制程受限背景下,國(guó)產(chǎn)廠商探索非對(duì)稱創(chuàng)新:壁仞科技BR100采用Chiplet架構(gòu),在14納米工藝下實(shí)現(xiàn)256 TFLOPs的FP32算力,能效比同類進(jìn)口產(chǎn)品優(yōu)化15%;寒武紀(jì)MLU370X8通過(guò)軟件棧優(yōu)化,在推薦系統(tǒng)場(chǎng)景推理時(shí)延較A10降低22%,實(shí)現(xiàn)“制程落后但場(chǎng)景適配”的差異化競(jìng)爭(zhēng)。
2)專利布局與技術(shù)壁壘
美國(guó)企業(yè)構(gòu)建了“核心專利+標(biāo)準(zhǔn)制定”的技術(shù)護(hù)城河。2013至2023年,英偉達(dá)、AMD等十大外國(guó)企業(yè)在中國(guó)申請(qǐng)GPU相關(guān)專利超1.8萬(wàn)件,重點(diǎn)布局計(jì)算架構(gòu)(占比38%)、內(nèi)存管理(22%)等核心領(lǐng)域。通過(guò)掌握CUDA指令集、OpenCL標(biāo)準(zhǔn)等關(guān)鍵技術(shù),美國(guó)企業(yè)形成“硬件─軟件─算法”的閉環(huán)生態(tài),新進(jìn)入者需支付每噸2000美元以上的專利許可費(fèi)用,且面臨3至5年的生態(tài)適配周期。
中國(guó)企業(yè)專利布局呈現(xiàn)“數(shù)量突破、質(zhì)量追趕”態(tài)勢(shì)。2023年,中國(guó)十大GPU企業(yè)專利申請(qǐng)量達(dá)外國(guó)企業(yè)的7倍,累計(jì)申請(qǐng)量超5萬(wàn)件,主要集中于電數(shù)字?jǐn)?shù)據(jù)處理(4300件)、計(jì)算機(jī)零部件(2200件)等應(yīng)用領(lǐng)域。但專利結(jié)構(gòu)存在明顯短板:獨(dú)立權(quán)利要求數(shù)超過(guò)20項(xiàng)的專利占比僅33.26%,低于外國(guó)企業(yè)的42.27%;在存算一體、光子計(jì)算等前沿領(lǐng)域,專利數(shù)量?jī)H為美國(guó)的1/5。不過(guò),中國(guó)企業(yè)授權(quán)率持續(xù)高于外國(guó)企業(yè)(2023年達(dá)78%對(duì)52%),反映出技術(shù)方案更適應(yīng)本土審查標(biāo)準(zhǔn)。
產(chǎn)業(yè)生態(tài)建設(shè)對(duì)比
1)產(chǎn)業(yè)鏈協(xié)同模式
美國(guó)形成“垂直整合+全球分工”的產(chǎn)業(yè)生態(tài)。英偉達(dá)通過(guò)收購(gòu)Mellanox(網(wǎng)絡(luò))、MAGMA(AI軟件)構(gòu)建全棧能力,同時(shí)與臺(tái)積電(先進(jìn)制程)、美光(高帶寬內(nèi)存)建立戰(zhàn)略聯(lián)盟,確保每代產(chǎn)品領(lǐng)先競(jìng)爭(zhēng)對(duì)手12至18個(gè)月。在全球化布局中,三星電子2026年將在西安投建封裝測(cè)試基地,使英偉達(dá)GPU模組本土化率提升至68%,既降低生產(chǎn)成本,又規(guī)避地緣政治風(fēng)險(xiǎn)。
中國(guó)產(chǎn)業(yè)鏈呈現(xiàn)“自主可控+區(qū)域集聚”特征。在制造環(huán)節(jié),中芯國(guó)際14納米工藝可滿足70%的國(guó)產(chǎn)GPU需求,長(zhǎng)鑫存儲(chǔ)19納米GDDR6顯存實(shí)現(xiàn)量產(chǎn),緩解“卡脖子”問(wèn)題;設(shè)計(jì)環(huán)節(jié),形成景嘉微(軍工)、壁仞科技(AI)、摩爾線程(消費(fèi))三大梯隊(duì),覆蓋不同應(yīng)用場(chǎng)景;配套方面,平頭哥半導(dǎo)體推出RISCV架構(gòu)GPU IP核,中望軟件聯(lián)合景嘉微開(kāi)發(fā)CAD解決方案,初步構(gòu)建自主生態(tài)。三大產(chǎn)業(yè)集群集聚上下游企業(yè)超800家,2023年新增專利1.3萬(wàn)件,較2020年增長(zhǎng)270%。
2)軟件生態(tài)建設(shè)
美國(guó)依托“生態(tài)壟斷”構(gòu)建高壁壘。英偉達(dá)CUDA平臺(tái)擁有超400萬(wàn)開(kāi)發(fā)者,支持2000+應(yīng)用程序,形成“開(kāi)發(fā)者─應(yīng)用─硬件”的正向循環(huán)。在AI框架適配方面,TensorFlow、PyTorch等主流框架對(duì)英偉達(dá)GPU優(yōu)化程度達(dá)95%,使同類算法在AMD GPU上運(yùn)行效率降低30%以上。為維持生態(tài)優(yōu)勢(shì),英偉達(dá)每年投入超20億美元用于開(kāi)發(fā)者生態(tài)建設(shè),包括高校合作、黑客馬拉松等活動(dòng)。
中國(guó)軟件生態(tài)面臨“適配難、碎片化”挑戰(zhàn)。國(guó)產(chǎn)GPU需同時(shí)適配OpenCL、OpenGL等國(guó)際標(biāo)準(zhǔn)和自研的MindSpore框架,適配成本較美國(guó)高40%。不過(guò),生態(tài)建設(shè)已取得階段性成果:國(guó)產(chǎn)計(jì)算框架適配率從2020年的30%提升至2023年的65%;壁仞科技推出BRAS軟件平臺(tái),實(shí)現(xiàn)與TensorFlow/PyTorch的兼容;政務(wù)領(lǐng)域建立統(tǒng)一的API接口標(biāo)準(zhǔn),減少重復(fù)開(kāi)發(fā)。根據(jù)IDC預(yù)測(cè),到2025年國(guó)產(chǎn)GPU在AI訓(xùn)練市場(chǎng)的滲透率將達(dá)20%,政務(wù)云市場(chǎng)占有率突破40%,生態(tài)正從“可用”向“好用”轉(zhuǎn)變。
產(chǎn)業(yè)挑戰(zhàn)與建議
目前中國(guó)GPU產(chǎn)業(yè)面臨的挑戰(zhàn)包括:
其一,技術(shù)代差與制程限制:7納米以下先進(jìn)制程仍依賴外部供應(yīng),2025年16納米以下制程國(guó)產(chǎn)化率僅能達(dá)到38%,制約高端產(chǎn)品研發(fā)。英偉達(dá)H100已采用4納米工藝,雙方在先進(jìn)制程上存在2-3代差距。
其二,生態(tài)壁壘難以突破:CUDA生態(tài)積累超過(guò)15年,國(guó)產(chǎn)軟件棧需同時(shí)兼容國(guó)際標(biāo)準(zhǔn)和自研框架,開(kāi)發(fā)者數(shù)量不足英偉達(dá)的1/10,應(yīng)用適配成本高企。
其三,供應(yīng)鏈安全風(fēng)險(xiǎn):高端GPU所需的高帶寬內(nèi)存(HBM)、先進(jìn)封裝設(shè)備等仍依賴進(jìn)口,地緣政治沖突可能導(dǎo)致供應(yīng)鏈中斷,影響量產(chǎn)穩(wěn)定性。
其四,盈利模式不成熟:國(guó)產(chǎn)GPU企業(yè)普遍處于投入期,2024年行業(yè)平均毛利率僅18%,低于英偉達(dá)的68%,長(zhǎng)期依賴政府補(bǔ)貼,市場(chǎng)化盈利能力待提升。
筆者對(duì)于國(guó)產(chǎn)GPU產(chǎn)業(yè)未來(lái)發(fā)展的建議涉及三個(gè)方面:
其一,技術(shù)創(chuàng)新策略。非對(duì)稱技術(shù)突破:避開(kāi)先進(jìn)制程競(jìng)爭(zhēng),重點(diǎn)發(fā)展Chiplet、存算一體等新型架構(gòu)。建議加大光子計(jì)算研發(fā)投入,2028年前實(shí)現(xiàn)商用光子AI芯片量產(chǎn),形成“架構(gòu)創(chuàng)新彌補(bǔ)制程差距”的技術(shù)路徑。專利布局優(yōu)化:減少低質(zhì)量專利申請(qǐng),聚焦內(nèi)存管理、能效優(yōu)化等核心領(lǐng)域,力爭(zhēng)2027年在AI加速算法領(lǐng)域?qū)@麛?shù)量超過(guò)美國(guó)企業(yè)。產(chǎn)業(yè)鏈協(xié)同創(chuàng)新:依托三大產(chǎn)業(yè)集群,構(gòu)建“設(shè)計(jì)─制造─封測(cè)”協(xié)同平臺(tái),中芯國(guó)際14納米工藝良率穩(wěn)定在95%以上,2026年前實(shí)現(xiàn)7納米工藝國(guó)產(chǎn)化,滿足高端GPU需求。
其二,生態(tài)建設(shè)路徑。構(gòu)建統(tǒng)一軟件平臺(tái):由工信部牽頭,聯(lián)合企業(yè)制定國(guó)產(chǎn)GPU統(tǒng)一API標(biāo)準(zhǔn),減少碎片化適配成本。場(chǎng)景化生態(tài)突破:在政務(wù)、金融等優(yōu)勢(shì)領(lǐng)域建立“硬件+軟件+服務(wù)”的一體化解決方案,如開(kāi)發(fā)面向政務(wù)云的專用GPU操作系統(tǒng),形成示范效應(yīng)后向其他領(lǐng)域推廣。開(kāi)源生態(tài)布局:加大RISCV架構(gòu)投入,支持平頭哥等企業(yè)開(kāi)發(fā)GPU IP核,2025年前建成全球最大的RISCV GPU開(kāi)發(fā)者社區(qū),吸引國(guó)際開(kāi)發(fā)者參與,打破技術(shù)標(biāo)準(zhǔn)壟斷。
其三,政策支持建議。差異化補(bǔ)貼政策:對(duì)采用國(guó)產(chǎn)GPU的企業(yè)給予稅收優(yōu)惠(如按采購(gòu)額的15%抵扣稅款),對(duì)GPU研發(fā)企業(yè)提供研發(fā)費(fèi)用加計(jì)扣除(比例提高至175%)。國(guó)際合作策略:在泰國(guó)、馬來(lái)西亞建立GPU生產(chǎn)基地,規(guī)避出口管制,同時(shí)推動(dòng)國(guó)產(chǎn)GPU進(jìn)入當(dāng)?shù)厥袌?chǎng)。人才培養(yǎng)計(jì)劃:在100所高校開(kāi)設(shè)GPU設(shè)計(jì)專業(yè),每年培養(yǎng)2萬(wàn)名專業(yè)人才;引進(jìn)國(guó)際頂尖團(tuán)隊(duì),給予最高5000萬(wàn)元?jiǎng)?chuàng)業(yè)補(bǔ)貼。
?。ㄗ髡邽橥赓Y投資基金董事總經(jīng)理)