當前位置：首頁 > 新聞 > 熱點資訊 > ?英偉達推GPU直訪存儲技術(shù) 緩解AI顯存瓶頸?

?英偉達推GPU直訪存儲技術(shù) 緩解AI顯存瓶頸?

2026-05-21 00:37:24 標簽：?英偉達

　　隨著AI模型規(guī)模的持續(xù)膨脹，HBM(高帶寬內(nèi)存)未來可能難以滿足計算卡對超大容量顯存的需求。為此，業(yè)界正將“GPU直接驅(qū)動存儲”視作突破瓶頸的下一技術(shù)前沿。例如，早有消息稱英偉達已分別與SK海力士、鎧俠合作，共同開發(fā)AI專用SSD，旨在用定制化的固態(tài)硬盤部分替代HBM，成為GPU顯存的有效擴展。

　　為應(yīng)對相同挑戰(zhàn)，SK海力士今年攜手閃迪，推出了面向AI推理場景的下一代存儲器解決方案——HBF(高帶寬閃存)。據(jù)調(diào)研機構(gòu)TrendForce最新報道，英偉達正積極推進GPU直接訪問存儲(GPU-Initiated Direct Storage Access, 簡稱GIDS)的架構(gòu)開發(fā)，計劃從Vera Rubin平臺開始引入該功能。分析普遍認為，此舉或?qū)⒓铀貶BF等新存儲方案的發(fā)展。

　　GIDS與現(xiàn)有的GDS(GPU Direct Storage)技術(shù)存在顯著區(qū)別。在GDS架構(gòu)中，數(shù)據(jù)傳輸至GPU前需由CPU向存儲設(shè)備發(fā)出請求;而GIDS則允許GPU直接發(fā)起訪問，完全跳過CPU與DRAM作為中介，從而實現(xiàn)更高效的數(shù)據(jù)流。

　　GIDS與GDS的最終目標，都是克服傳統(tǒng)計算架構(gòu)中的數(shù)據(jù)搬移瓶頸。據(jù)信微軟和AMD也在探索類似的技術(shù)路徑。核心問題在于，傳統(tǒng)由CPU調(diào)度線程的數(shù)據(jù)傳輸模式效率有限，而GPU卻能生成數(shù)以萬計的并行線程。當前，GPU與HBM之間的數(shù)據(jù)傳輸能耗已占據(jù)系統(tǒng)總功耗近半，這為將HBF等超高速NAND閃存部署至更貼近GPU的位置，以應(yīng)對未來的AI性能瓶頸提供了有力支持。

　　GIDS架構(gòu)的出現(xiàn)，有望讓NAND閃存在AI存儲系統(tǒng)中扮演更為關(guān)鍵的角色，同時緩解HBM在容量方面面臨的壓力。這種轉(zhuǎn)變也對NAND閃存的性能提出了更高要求，以匹配GPU的處理速度。相較于DRAM，NAND閃存的優(yōu)勢在于其位密度可達前者的30倍左右，能夠在相近的芯片面積下實現(xiàn)更大的存儲容量。

　　然而，NAND閃存存在寫入壽命有限的短板，而DRAM則擁有幾乎無限的寫入能力。因此，HBF等新方案被認為更適用于存儲相對固定的AI模型參數(shù)，這部分數(shù)據(jù)在推理過程中基本保持不變，屬于典型的“只讀”工作負載，從而規(guī)避了耐久度挑戰(zhàn)。

推薦內(nèi)容

?英偉達推送DLSS 4.5獨占新功能
　　英偉達現(xiàn)已通過NVIDIA App測試版開放了DLSS 4.5動態(tài)多幀生成與6倍多幀生成功能的早期體驗。本次更新的兩項功能均為RTX 50系列GPU所獨享，用戶在將驅(qū)動程序更新至595.79WHQL或更新版本后方可啟用。
2026-03-31
英偉達推出全新Game Ready 577.00 WHQL驅(qū)動更新
　　英偉達最新發(fā)布的GeForce Game Ready 577.00 WHQL驅(qū)動程序為即將上線的國產(chǎn)3A大作《明末：淵虛之羽》提供了全面支持，引入了DLSS 4多幀生成等先進技術(shù)。該驅(qū)動還針對《無畏契約》的虛幻5引擎升級進行了優(yōu)化，并新增了多款游戲的NVIDIA App DLSS優(yōu)化設(shè)置選項。
2025-07-25
英偉達推出v.561.09版Game Ready驅(qū)動
英偉達公司近日正式發(fā)布了全新的GeForce WHQL Game Ready驅(qū)動程序(版本號v.561.09)，此次更新不僅為玩家?guī)砹思夹g(shù)上的飛躍，還特別針對即將上市的幾款大作進行了深度優(yōu)化，包括萬眾矚目的《最終幻想16》、《戰(zhàn)神：諸神黃昏》、足球迷翹首以盼的《EA Sports FC 25》以及備受期待的末日生存續(xù)作《冰汽時代2》。隨著PC版《最終幻想16》定于9月17日全球同步發(fā)售，以及《戰(zhàn)神：諸神黃昏》緊隨其后于9月19日震撼登陸，英偉達提前布局，確認這兩款游戲?qū)⑷婕嫒莶娀疍LSS 3、DLAA及Reflex等先進技術(shù)，旨在為玩家?guī)砬八从械囊曈X盛宴與絲滑流暢的操作體驗。
2024-09-12
英偉達推出了RTX5080/90系列顯卡的籌備計劃
　　最新供應(yīng)鏈消息透露，英偉達即將在本月啟動針對RTX 5090和RTX 5080兩款顯卡的宣傳工作，相關(guān)資料也將陸續(xù)發(fā)送給AIC合作伙伴。
2024-09-06
?中方拒購英偉達H200芯片全力支持本土產(chǎn)業(yè)發(fā)展?
　　美國前總統(tǒng)特朗普結(jié)束對中國的訪問后，在“空軍一號”上向隨行記者透露，中國方面已決定不批準采購英偉達H200芯片的計劃，其目的在于將資源和投資聚焦于發(fā)展國內(nèi)芯片產(chǎn)業(yè)。
2026-05-19