2026年1月6日,CES 2026展會(huì)現(xiàn)場(chǎng)傳來傾覆性音信——英偉達(dá)CEO黃仁勛正在要旨演講中正式發(fā)布,以天文學(xué)家薇拉·弗洛倫斯·庫珀·魯賓定名的新一代Rubin盤算架構(gòu)平臺(tái)“已全數(shù)投產(chǎn)”。這款整合六款全新芯片的AI超等盤算機(jī),不單完畢了對(duì)前代Blackwell平臺(tái)的全方位機(jī)能碾壓,更以10倍推理本錢低浸、四分之一MoE操練GPU需求的打破性體現(xiàn),為環(huán)球AI工業(yè)帶來汗青性改造。目前,平臺(tái)六款焦點(diǎn)芯片已已畢合營制作回廠流程,通過環(huán)節(jié)測(cè)試后按預(yù)備推動(dòng),2026年將開啟界限化安插高潮。
Rubin平臺(tái)的焦點(diǎn)上風(fēng)源于其“六芯協(xié)同”的全棧安排,六款定制芯片各司其職又無縫相連,掩蓋盤算、匯集、數(shù)據(jù)處置等AI職分全流程,修建起無短板的算力生態(tài)。行為平臺(tái)“算力更改焦點(diǎn)”的VeraCPU,搭載88個(gè)定制Olympus焦點(diǎn)與176線程,援助NVIDIA Spatial Multi-Threading技能,機(jī)能較前代翻倍的同時(shí),更具備1.8TB/s NVLink-C2C互連速度、1.5TB編制內(nèi)存(為Grace CPU的3倍)及1.2TB/s LPDDR5X內(nèi)存帶寬,2270億晶體管的雄偉體量,使其成為大界限AI工場(chǎng)中能效頂尖的署理推理專用途理器。
算力焦點(diǎn)Rubin GPU則外示出極致機(jī)能:NVFP4精度下推理算力達(dá)50 PFLOPS(為Blackwell的5倍),操練算力35 PFLOPS(3.5倍擢升),22TB/s的HBM4帶寬(2.8倍擢升)與3.6TB/s單GPU NVLink帶寬(2倍擢升),配合3360億晶體管的硬件支柱,再加上第三代Transformer引擎與硬件加快自適當(dāng)壓縮效用,輕松應(yīng)對(duì)超大界限AI職分。匯集與數(shù)據(jù)處置層面,ConnectX-9 SuperNIC援助800Gb/s以太網(wǎng)速度與200G PAM4串并轉(zhuǎn)換技能,集成可編程RDMA與數(shù)據(jù)途徑加快器,230億晶體管授予其線速加密、安樂分開等頂尖防護(hù)才能;BlueField-4 DPU搭載64核Grace CPU,匯集機(jī)能較前代擢升2倍,盤算才能擢升6倍,內(nèi)存帶寬擢升3倍,1260億晶體管使其成為智能網(wǎng)卡與存儲(chǔ)處置器的標(biāo)桿產(chǎn)物。另外,NVLink 6調(diào)換機(jī)與Spectrum-6以太網(wǎng)調(diào)換機(jī)造成雙重匯集支柱,前者完畢單GPU 3.6TB/s全互聯(lián)帶寬,后者仰仗共封裝光子技能,打制出102.4Tb/s可擴(kuò)展調(diào)換架構(gòu),援助128個(gè)800Gb/s端口或512個(gè)200Gb/s端口,3520億晶體管的設(shè)備確保海量數(shù)據(jù)高速流轉(zhuǎn)。
Rubin平臺(tái)的定名并非無意,而是為了致敬美邦前驅(qū)天文學(xué)家薇拉·弗洛倫斯·庫珀·魯賓——她的科學(xué)呈現(xiàn)徹底轉(zhuǎn)換了人類對(duì)宇宙的認(rèn)知,這與英偉達(dá)盼望通過算力改進(jìn)重塑AI工業(yè)的愿景高度契合?;谶@一焦點(diǎn)架構(gòu),英偉達(dá)推出兩款旗艦產(chǎn)物,分手適配機(jī)柜級(jí)大界限安插與任職器級(jí)圓活行使場(chǎng)景,掩蓋差別用戶的算力需求。
個(gè)中,Vera Rubin NVL72行為機(jī)柜級(jí)治理計(jì)劃,整合72顆Rubin GPU與36顆Vera CPU,通過NVLink 6互連技能、ConnectX-9 SuperNIC及BlueField-4 DPU造成完好算力集群,260TB/s的具體帶寬足以支柱超大界限夾雜專家模子(MoE)操練與高階推理職分。而HGX Rubin NVL8編制則是專為x86架構(gòu)天生式AI平臺(tái)安排的任職器主板,通過NVLink技能貫穿8顆Rubin GPU,不妨高效加快AI操練、推理及高機(jī)能盤算(HPC)等眾元化做事負(fù)載,為中小企業(yè)及科研機(jī)構(gòu)供應(yīng)高性價(jià)比的算力采取。
Rubin平臺(tái)的傾覆性不單再現(xiàn)正在硬件參數(shù)的躍升,更源于五項(xiàng)環(huán)節(jié)技能改進(jìn)的深度交融,完畢了機(jī)能擢升與本錢低浸的雙重打破。新一代NVLink互連技能修建起高速數(shù)據(jù)傳輸通道,確保眾芯片協(xié)同做事時(shí)的低延遲與高帶寬;第三代Transformer引擎針對(duì)AI職分優(yōu)化,大幅擢升模子操練與推理效能;秘密盤算技能為敏銳AI數(shù)據(jù)供應(yīng)全流程安樂防護(hù),饜足金融、醫(yī)療等行業(yè)的合規(guī)需求;RAS引擎(牢靠性、可用性與可庇護(hù)性引擎)保證平臺(tái)正在7x24小時(shí)高負(fù)載運(yùn)轉(zhuǎn)下的平靜體現(xiàn);再加上專為署理推理安排的Vera CPU,五大改進(jìn)造成協(xié)力,促使AI算力行使邁入新階段。
機(jī)能層面,Rubin平臺(tái)的操練機(jī)能到達(dá)Blackwell的3.5倍,AI軟件運(yùn)轉(zhuǎn)機(jī)能擢升5倍,這意味著原來需求數(shù)周已畢的大模子操練職分,現(xiàn)在可壓縮至數(shù)天,極大縮短AI研發(fā)周期。本錢層面的打破更為顛簸:推理token天生本錢最高可低浸10倍,操練MoE模子所需GPU數(shù)目削減至本來的四分之一。對(duì)待AI企業(yè)而言,這不單意味著硬件采購與運(yùn)維本錢的大幅低落,更能促使AI行使從“高本錢試點(diǎn)”走向“界限化普及”——無論是智能客服、自愿駕駛,如故藥物研發(fā)、工業(yè)質(zhì)檢,都將因算力本錢的低浸而加快落地。
Rubin平臺(tái)的量產(chǎn)音信曾經(jīng)揭橥,便取得環(huán)球云任職商的主動(dòng)反映,一場(chǎng)算力升級(jí)高潮即將包括環(huán)球。英偉達(dá)顯示,亞馬遜AWS、谷歌云、微軟Azure和甲骨文云四大云巨頭已確認(rèn)將于2026年率先安插基于Vera Rubin的實(shí)例,讓環(huán)球用戶通過云任職即可便捷獲取頂尖AI算力。與此同時(shí),CoreWeave、Lambda、Nebius和Nscale等一心于AI算力任職的專業(yè)云合營伙伴也將延續(xù)跟進(jìn),進(jìn)一步擴(kuò)展平臺(tái)的掩蓋畛域。
這一合營生態(tài)的急速成型,不單再現(xiàn)了市集對(duì)Rubin平臺(tái)機(jī)能與本錢上風(fēng)的高度承認(rèn),更將促使AI算力從“少數(shù)巨頭專屬”走向“全民普惠”。對(duì)待AI創(chuàng)業(yè)公司與中小企業(yè)而言,此前因算力本錢過高而受限的改進(jìn)項(xiàng)目,另日可通過云任職輕松挪用Rubin平臺(tái)的超強(qiáng)算力,無需進(jìn)入巨額資金自筑硬件;對(duì)待科研機(jī)構(gòu)而言,高效算力將加快根蒂科學(xué)鉆探與技能打破,促使AI正在醫(yī)療、教授、環(huán)保等公益范疇的深度行使。
跟著Rubin平臺(tái)的界限化安插,AI工業(yè)將迎來新一輪改進(jìn)發(fā)作期。更低的本錢、更強(qiáng)的機(jī)能、更便捷的獲取體例,將激活更眾行業(yè)的AI行使?jié)摿?,促使?shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)深度交融。Rubin平臺(tái)的出世,恰是英偉達(dá)完畢這一愿景的環(huán)節(jié)一步,也為人類社會(huì)邁向智能新期間奠定了堅(jiān)實(shí)的算力根蒂。