隨著AI模型規(guī)模的持續(xù)膨脹,HBM(高帶寬內(nèi)存)未來可能難以滿足計算卡對超大容量顯存的需求。為此,業(yè)界正將“GPU直接驅(qū)動存儲”視作突破瓶頸的下一技術(shù)前沿。例如,早有消息稱英偉達已分別與SK海力士、鎧俠合作,共同開發(fā)AI專用SSD,旨在用定制化的固態(tài)硬盤部分替代HBM,成為GPU顯存的有效擴展。

為應(yīng)對相同挑戰(zhàn),SK海力士今年攜手閃迪,推出了面向AI推理場景的下一代存儲器解決方案——HBF(高帶寬閃存)。據(jù)調(diào)研機構(gòu)TrendForce最新報道,英偉達正積極推進GPU直接訪問存儲(GPU-Initiated Direct Storage Access, 簡稱GIDS)的架構(gòu)開發(fā),計劃從Vera Rubin平臺開始引入該功能。分析普遍認為,此舉或?qū)⒓铀貶BF等新存儲方案的發(fā)展。
GIDS與現(xiàn)有的GDS(GPU Direct Storage)技術(shù)存在顯著區(qū)別。在GDS架構(gòu)中,數(shù)據(jù)傳輸至GPU前需由CPU向存儲設(shè)備發(fā)出請求;而GIDS則允許GPU直接發(fā)起訪問,完全跳過CPU與DRAM作為中介,從而實現(xiàn)更高效的數(shù)據(jù)流。
GIDS與GDS的最終目標,都是克服傳統(tǒng)計算架構(gòu)中的數(shù)據(jù)搬移瓶頸。據(jù)信微軟和AMD也在探索類似的技術(shù)路徑。核心問題在于,傳統(tǒng)由CPU調(diào)度線程的數(shù)據(jù)傳輸模式效率有限,而GPU卻能生成數(shù)以萬計的并行線程。當前,GPU與HBM之間的數(shù)據(jù)傳輸能耗已占據(jù)系統(tǒng)總功耗近半,這為將HBF等超高速NAND閃存部署至更貼近GPU的位置,以應(yīng)對未來的AI性能瓶頸提供了有力支持。
GIDS架構(gòu)的出現(xiàn),有望讓NAND閃存在AI存儲系統(tǒng)中扮演更為關(guān)鍵的角色,同時緩解HBM在容量方面面臨的壓力。這種轉(zhuǎn)變也對NAND閃存的性能提出了更高要求,以匹配GPU的處理速度。相較于DRAM,NAND閃存的優(yōu)勢在于其位密度可達前者的30倍左右,能夠在相近的芯片面積下實現(xiàn)更大的存儲容量。
然而,NAND閃存存在寫入壽命有限的短板,而DRAM則擁有幾乎無限的寫入能力。因此,HBF等新方案被認為更適用于存儲相對固定的AI模型參數(shù),這部分數(shù)據(jù)在推理過程中基本保持不變,屬于典型的“只讀”工作負載,從而規(guī)避了耐久度挑戰(zhàn)。





























浙公網(wǎng)安備 33010502007447號