圖形存儲控制器GDDR6X詳解
發布時間:2022/2/22 10:44:18 訪問次數:1381
美光gddr6x是業界第一款大規模生產的內存。這項機制的改變在于處理器和內存之間采用4檔電壓,每個周期內編碼和傳輸兩個byte,并打開了通向更高頻率的大門。自2006年開始對pam4進行實驗以來,美光認為pam4不僅是gddr的進步,也是dram的進步。雖然ddr5不使用pam4,但美光已經獲得了pam4甚至支持pam8的hbm內存專利。
dram制造商承認,與gddr6相比,gddr6x的構建和實現更加困難(可能也更加昂貴)。據了解,gddr6x采用了bga-180封裝工藝,尺寸為14*12mm,焊球間距0.75mm,兼容上一代gddr6。目前gddr6x單顆容量為1gb,在工藝升級后,明年將達到單顆2gb容量。然而,即使在初期階段,gddr6x也比成熟的hbm2e便宜,因為我們在這里處理的是離散的內存芯片。同時,由于gddr6x返回到8字節的突發長度(在gddr6的情況下是16字節),在相同的每針數據速率下,它并不比它的前身gddr6快。
美光詳細討論了圖形存儲器:gddr6x、hbm專利:pam4和pam8。
在近期的虛擬發布會上,美光分享了一些關于最新的gddr6x sgram細節,它讓英偉達的geforce rtx 30系列顯卡的性能更上一層樓。已經對這種新型存儲器的技術進行了十多年的試驗,并表示gddr6x sgram還沒有被jedec標準化。目前,只有英偉達使用gddr6x內存,但美光希望這種情況會隨著時間的推移而改變。
pam4信令機制:自2006年開始研究dram
在顯卡內存創新方面,位于德國慕尼黑的美光顯卡dram設計中心有著悠久的歷史,該設計中心隸屬于奇夢達公司(qimonda),這家公司是英飛凌的dram衍生產品,早已過時。來自這些實驗室的工程師批量生產了第一批gddr5、gddr5x和現在的gddr6x芯片。美光是gddr5x唯一的生產商,現在是gddr6x唯一的生產商。
四電平脈沖調幅(pam4) 信令是gddr6x的關鍵特性。這種技術使用4個信號電平每周期傳輸2個數據位,因此與前一代sgram類型相比,任何工作頻率的有效帶寬翻倍。此外,pam4為更高的數據傳輸速率打開了大門(盡管是有代價的)。因此,pam4提高了每個時鐘的效率和速度。
不過,這里有一個小小的警告。gddr6的突發長度為16字節(bl16),這意味著它的兩個16位通道每一個都可以為每次操作提供32字節。gddr6x的突發長度為8個字節(bl8),但是由于pam4信令的存在,它的每個16位通道每次操作也將提供32個字節。為此,gddr6x在同一時鐘上并不比gddr6快。
多年來,pam4信令一直被用于數據中心網絡標準,比如infiniband,而四層編碼本身也不是什么新東西。與傳統的pam2/nrz調制相比,pam4保留給大型數據中心和超級計算機的主要原因是實施費用。
但是,高成本并沒有阻止在實驗室中對這項技術的探索,這也是美光美國分部的科學家們自2006年以來一直在做的事情。在此過程中,他們獲得了45項專利。
美光公司的圖形部門主管ralf ebert:“自2006年以來,我們已經讓科學家們研究如何在內存中使用pam4,他們是真正為創新做基礎的人。他們基本上采用了pam4技術,并試圖找出如何在dram中使用它。”
經過多年的pam4探索,美光認為是時候將這項技術應用到圖形存儲器上了。gddr從2007年(gddr5)到2018年(gddr6)的演變在架構上非常簡單,因此引入一種新的信號機制,這就需要美光將其來自美國科學家和來自德國工程師得共同努力。
ebert:“科學家們必須與gddr的開發者,也就是簽署芯片的人并肩工作。”“他們還與系統和產品工程師緊密合作,從系統和大規模制造的角度理解挑戰。”
我們今天所知道的關于gddr6x的工作開始于2017年底。通常,將一種新型dram推向市場需要更長的時間,但由于這主要是一個內部項目(至少在內存設備層面上),美光已經實現的技術進展非常迅速。不過,這是有原因的。
與英偉達密切合作開發
開發新型內存不僅要考慮特定的應用,還要考慮特定的客戶。英偉達是第一家使用gddr5x和gddr6的公司(本世紀初也使用了gddr2和gddr3)。事實上,據美光稱,英偉達要求美光提供一種比gddr6更高性能的離散存儲器解決方案。
“當然,你必須與客戶合作,最理想的情況是,依靠已經建立多年的密切的業務和技術合作。”(我們必須確保)產品從一開始就能在應用程序中發揮作用。”
由于pam4信令改變了內存子系統的工作方式,nvidia不得不為gddr6x開發一種全新的內存控制器和phy。基于到目前為止還沒有ip設計公司公布他們的gddr6x產品細節,看起來nvidia已經在內部設計了一切。
目前,nvidia在其geforce rtx 3080/3090圖形卡上使用了gddr6x,該圖形卡基于ga102 gpu,主要面向玩家。nvidia還將提供quadro rtx專業顯卡,具有相同的芯片和gddr6x內存。與此同時,美光表示gddr6x也被用于ai和hpc應用,這兩個應用都不屬于nvidia的geforce rtx和quadro rtx focus,因為這些卡在ai的fp16和fp32張量性能以及hpc的fp64張量性能方面都有上限。也許美光只是一種假想的用途,或者它是在暗示即將推出的由ga102驅動的nvidia泰坦系列卡,它將為ai和高性能計算提供合適的性能(沒有上限)。
英偉達是美光發布gddr6x的唯一合作伙伴,但美光強調,這款新型內存并不是專為gpu開發者設計的。這家dram制造商還計劃向其他公司提供gddr6x。
ebert:“我們現在開始提供并向業界開放,gddr6x并不是針對客戶的,我們希望其他客戶也有興趣繼續前進,然后我們也會與他們接觸。”
帶pam4的gddr6x:更難構建,但比hbm2便宜
美光公司表示,pam4要求公司重新設計其gddr6x存儲設備的寫入數據捕獲電路(接收器),以精確采樣和解析四種不同的信號水平。這樣做,每個gddr6x dram合并三個輸入子接收器每i/o和數據總線倒置(dq/dbi)引腳。主機可以在寫訓練序列期間微調參考vrefd電壓水平。gddr6x的輸出驅動也必須重新設計,但美光表示,重新設計依賴于傳統方法。
美光承認,gddr6x芯片的生產成本比上一代gddr6設備更高。此外,它們需要非常干凈和穩定的信號,這就是為geforce rtx 3080/3090卡供電的nvidia ga102 gpu的內存控制器現在安裝在自己的電源軌道上的原因。
據美光的數據,由于性能的大幅提高,gddr6x在設備級別上比gddr6 (7.25 pj/bit vs 7.5 pj/bit)高15%。
總體而言,gddr6x芯片和實現比gddr6本身要昂貴,但仍比hbm2級內存便宜很多。gddr6x不需要堆疊,它是作為分立芯片運輸的,可以在工廠焊接。離散dram的整個基礎設施已經存在了幾十年,而且所有的過程都是常見的和廉價的。相比之下,hbm2 kgsds必須在半導體工廠組裝,然后在另一個工廠的潔凈室里放置在gpu旁邊的隔置器上。
ebert表示:“性能更高的dram通常也需要更高的成本,gddr6x的最大優勢是,我們可以將性能的標準提高很多,同時仍保持在一定的成本范圍內。gddr6x仍然是一個離散的內存解決方案。gddr6x內存可以像任何其他內存一樣由外接板制造商在他們的標準環境中組裝在pcb上。當你研究內存的不同速度等級時,通常有成本加法器的范圍;我們將gddr6x定位在正常范圍內。對于客戶來說,這款產品的成本并不高,主要是因為它仍然是一款離散存儲解決方案。”
美光沒有透露其8gb gddr6x設備的模具尺寸,也沒有將其與8gb gddr6設備進行比較。他們強調,這是第一種使用pam4信令的內存,后者是一種突破,為各種創新打開了大門。
美光顯卡dram主管介紹:“pam4是一個挑戰,我們相信有了這一突破,它可以向前推進,我們相信,這將改變dram行業。我們是第一批這樣做的人,為此已經工作了很長一段時間。”
規模密度和數據率
目前,美光提供8 gb gddr6x芯片,額定19 gbps和21 gbps。新內存設備使用該公司經過驗證的第四代10 nm級工藝技術(也稱為1×nm)生產。美光有一個擴大gddr6x的容量和速度方面的路線圖。
明年,美光打算在產品線中增加16gb密度的芯片,并隨著時間的推移提供更快的芯片。目前,美光是gddr6x唯一的生產商,nvidia是唯一的客戶,所以gddr6x的發展取決于nvidia的需求和美光的量產能力。關鍵要指出的是gddr6x被設置為性能超過21 gbps的擴展。
gddr6x:不是jedec標準,但不是專有的
為了盡快敲定gddr6x并使其與英偉達的安培gpu兼容,兩家公司幾乎在隱身模式下工作。這兩家公司從未將該規范提交給jedec進行標準化,因此gddr6x是目前只能從美光獲得的一種專有內存。
gddr5x主要由美光開發,幾乎沒有來自其他行業的競爭。在美光開始批量生產gddr5x之前,jedec正式發布了該標準,并將其提供給該組織的成員。但是,除了nvidia沒有人使用gddr5x,除了美光也沒有人生產這種內存。
gddr6x也許可用在圖形之外
傳統上,gddr類型的內存幾乎只用于顯卡和游戲機。有了gddr6,美光和它的行業同行開始為其他需要高帶寬的應用推廣顯卡dram。它們的目標是汽車、網絡和fpga應用程序。美光希望gddr6x能夠解決非gpu市場問題。
如今gpu被廣泛用于各種ai應用,因此,當美光談到gddr6x用于非圖形垂直領域時,自然而然地提到了訓練和推理應用。與此同時,由于英偉達的泰坦系列顯卡的目標客戶是游戲玩家、人工智能愛好者和各種消費者,如果英偉達發布一款泰坦安培模型,美光的gddr6x也將在技術上針對這些市場。
為了解決新興市場,美光不僅需要提供內存本身,還需要提供內存控制器ip、phy ip和驗證ip。這些類型的東西是由ip設計公司如avery, cadence, rambus和synopsys負責。由于gddr6x的設計才剛剛開始,ip公司必須迎頭趕上,假設他們看到了行業對gddr6x的潛在需求。這并不能完全保證,特別是考慮到gddr6x并不是jedec支持的行業標準。
美光:cpu可以使用gddr6x?
ebert:“從歷史上看,沒有什么能阻止行業使用cpu的gddr dram。”“這次也一樣。但這個決定必須由cpu公司來做。”
圖形內存的未來:pam4將繼續存在,甚至對于hbm來說也是如此
對美光來說,gddr6x不僅是一種高度復雜的產品,而且是其為dram帶來pam4信令的工作的頂峰。雖然這種類型的編碼不會用于ddr5 sdram,但美光相信,從長遠來看,它是存儲器的未來。
美光圖形存儲主管表示:“所以,我們就是在gddr6x上推出pam4的,而且我們肯定能看到這種技術的進一步發展,pam4有可能被用于其他內存標準。這類技術很有可能會被擁有cpu或其他處理器的公司所采用。”
pam4在工業上的應用將比現在廣泛得多。預計將于2021年發布的pcie 6.0使用pam4信令來提高效率和數據速率。考慮到pcie的廣泛采用,cpu和asic公司最終肯定會支持pcie 6.0和pam4。一旦行業學會如何與pcie 6.0四電平脈沖幅度調制工作,它肯定會應用它在其他地方。
美光表示,他們首次將pam4植入lpddr測試芯片,以試驗這項技術。此外,我們在準備這個故事時發現的一項專利說,美光在三年前獲得了hbm級存儲器與pam4和pam8信號疊加的專利。
hbm類型的內存還必須采用離散dram設備(qdr, bl8/bl16等)所使用的負載,因此很難預測何時它可以采
用新的信令。但如果目前可用的hbm2e 3.6 gbps芯片采用四電平脈沖幅度調制,則每臺設備的帶寬將翻倍至922 gb/s。這意味著一個6模塊的6144位dram子系統將提供巨大的5.5 tb/s帶寬。不過,在這一點上,這純粹是猜測。
『本文轉自:eeworld。版權歸原作者所有,如有侵權請聯系刪除。』
美光gddr6x是業界第一款大規模生產的內存。這項機制的改變在于處理器和內存之間采用4檔電壓,每個周期內編碼和傳輸兩個byte,并打開了通向更高頻率的大門。自2006年開始對pam4進行實驗以來,美光認為pam4不僅是gddr的進步,也是dram的進步。雖然ddr5不使用pam4,但美光已經獲得了pam4甚至支持pam8的hbm內存專利。
dram制造商承認,與gddr6相比,gddr6x的構建和實現更加困難(可能也更加昂貴)。據了解,gddr6x采用了bga-180封裝工藝,尺寸為14*12mm,焊球間距0.75mm,兼容上一代gddr6。目前gddr6x單顆容量為1gb,在工藝升級后,明年將達到單顆2gb容量。然而,即使在初期階段,gddr6x也比成熟的hbm2e便宜,因為我們在這里處理的是離散的內存芯片。同時,由于gddr6x返回到8字節的突發長度(在gddr6的情況下是16字節),在相同的每針數據速率下,它并不比它的前身gddr6快。
美光詳細討論了圖形存儲器:gddr6x、hbm專利:pam4和pam8。
在近期的虛擬發布會上,美光分享了一些關于最新的gddr6x sgram細節,它讓英偉達的geforce rtx 30系列顯卡的性能更上一層樓。已經對這種新型存儲器的技術進行了十多年的試驗,并表示gddr6x sgram還沒有被jedec標準化。目前,只有英偉達使用gddr6x內存,但美光希望這種情況會隨著時間的推移而改變。
pam4信令機制:自2006年開始研究dram
在顯卡內存創新方面,位于德國慕尼黑的美光顯卡dram設計中心有著悠久的歷史,該設計中心隸屬于奇夢達公司(qimonda),這家公司是英飛凌的dram衍生產品,早已過時。來自這些實驗室的工程師批量生產了第一批gddr5、gddr5x和現在的gddr6x芯片。美光是gddr5x唯一的生產商,現在是gddr6x唯一的生產商。
四電平脈沖調幅(pam4) 信令是gddr6x的關鍵特性。這種技術使用4個信號電平每周期傳輸2個數據位,因此與前一代sgram類型相比,任何工作頻率的有效帶寬翻倍。此外,pam4為更高的數據傳輸速率打開了大門(盡管是有代價的)。因此,pam4提高了每個時鐘的效率和速度。
不過,這里有一個小小的警告。gddr6的突發長度為16字節(bl16),這意味著它的兩個16位通道每一個都可以為每次操作提供32字節。gddr6x的突發長度為8個字節(bl8),但是由于pam4信令的存在,它的每個16位通道每次操作也將提供32個字節。為此,gddr6x在同一時鐘上并不比gddr6快。
多年來,pam4信令一直被用于數據中心網絡標準,比如infiniband,而四層編碼本身也不是什么新東西。與傳統的pam2/nrz調制相比,pam4保留給大型數據中心和超級計算機的主要原因是實施費用。
但是,高成本并沒有阻止在實驗室中對這項技術的探索,這也是美光美國分部的科學家們自2006年以來一直在做的事情。在此過程中,他們獲得了45項專利。
美光公司的圖形部門主管ralf ebert:“自2006年以來,我們已經讓科學家們研究如何在內存中使用pam4,他們是真正為創新做基礎的人。他們基本上采用了pam4技術,并試圖找出如何在dram中使用它。”
經過多年的pam4探索,美光認為是時候將這項技術應用到圖形存儲器上了。gddr從2007年(gddr5)到2018年(gddr6)的演變在架構上非常簡單,因此引入一種新的信號機制,這就需要美光將其來自美國科學家和來自德國工程師得共同努力。
ebert:“科學家們必須與gddr的開發者,也就是簽署芯片的人并肩工作。”“他們還與系統和產品工程師緊密合作,從系統和大規模制造的角度理解挑戰。”
我們今天所知道的關于gddr6x的工作開始于2017年底。通常,將一種新型dram推向市場需要更長的時間,但由于這主要是一個內部項目(至少在內存設備層面上),美光已經實現的技術進展非常迅速。不過,這是有原因的。
與英偉達密切合作開發
開發新型內存不僅要考慮特定的應用,還要考慮特定的客戶。英偉達是第一家使用gddr5x和gddr6的公司(本世紀初也使用了gddr2和gddr3)。事實上,據美光稱,英偉達要求美光提供一種比gddr6更高性能的離散存儲器解決方案。
“當然,你必須與客戶合作,最理想的情況是,依靠已經建立多年的密切的業務和技術合作。”(我們必須確保)產品從一開始就能在應用程序中發揮作用。”
由于pam4信令改變了內存子系統的工作方式,nvidia不得不為gddr6x開發一種全新的內存控制器和phy。基于到目前為止還沒有ip設計公司公布他們的gddr6x產品細節,看起來nvidia已經在內部設計了一切。
目前,nvidia在其geforce rtx 3080/3090圖形卡上使用了gddr6x,該圖形卡基于ga102 gpu,主要面向玩家。nvidia還將提供quadro rtx專業顯卡,具有相同的芯片和gddr6x內存。與此同時,美光表示gddr6x也被用于ai和hpc應用,這兩個應用都不屬于nvidia的geforce rtx和quadro rtx focus,因為這些卡在ai的fp16和fp32張量性能以及hpc的fp64張量性能方面都有上限。也許美光只是一種假想的用途,或者它是在暗示即將推出的由ga102驅動的nvidia泰坦系列卡,它將為ai和高性能計算提供合適的性能(沒有上限)。
英偉達是美光發布gddr6x的唯一合作伙伴,但美光強調,這款新型內存并不是專為gpu開發者設計的。這家dram制造商還計劃向其他公司提供gddr6x。
ebert:“我們現在開始提供并向業界開放,gddr6x并不是針對客戶的,我們希望其他客戶也有興趣繼續前進,然后我們也會與他們接觸。”
帶pam4的gddr6x:更難構建,但比hbm2便宜
美光公司表示,pam4要求公司重新設計其gddr6x存儲設備的寫入數據捕獲電路(接收器),以精確采樣和解析四種不同的信號水平。這樣做,每個gddr6x dram合并三個輸入子接收器每i/o和數據總線倒置(dq/dbi)引腳。主機可以在寫訓練序列期間微調參考vrefd電壓水平。gddr6x的輸出驅動也必須重新設計,但美光表示,重新設計依賴于傳統方法。
美光承認,gddr6x芯片的生產成本比上一代gddr6設備更高。此外,它們需要非常干凈和穩定的信號,這就是為geforce rtx 3080/3090卡供電的nvidia ga102 gpu的內存控制器現在安裝在自己的電源軌道上的原因。
據美光的數據,由于性能的大幅提高,gddr6x在設備級別上比gddr6 (7.25 pj/bit vs 7.5 pj/bit)高15%。
總體而言,gddr6x芯片和實現比gddr6本身要昂貴,但仍比hbm2級內存便宜很多。gddr6x不需要堆疊,它是作為分立芯片運輸的,可以在工廠焊接。離散dram的整個基礎設施已經存在了幾十年,而且所有的過程都是常見的和廉價的。相比之下,hbm2 kgsds必須在半導體工廠組裝,然后在另一個工廠的潔凈室里放置在gpu旁邊的隔置器上。
ebert表示:“性能更高的dram通常也需要更高的成本,gddr6x的最大優勢是,我們可以將性能的標準提高很多,同時仍保持在一定的成本范圍內。gddr6x仍然是一個離散的內存解決方案。gddr6x內存可以像任何其他內存一樣由外接板制造商在他們的標準環境中組裝在pcb上。當你研究內存的不同速度等級時,通常有成本加法器的范圍;我們將gddr6x定位在正常范圍內。對于客戶來說,這款產品的成本并不高,主要是因為它仍然是一款離散存儲解決方案。”
美光沒有透露其8gb gddr6x設備的模具尺寸,也沒有將其與8gb gddr6設備進行比較。他們強調,這是第一種使用pam4信令的內存,后者是一種突破,為各種創新打開了大門。
美光顯卡dram主管介紹:“pam4是一個挑戰,我們相信有了這一突破,它可以向前推進,我們相信,這將改變dram行業。我們是第一批這樣做的人,為此已經工作了很長一段時間。”
規模密度和數據率
目前,美光提供8 gb gddr6x芯片,額定19 gbps和21 gbps。新內存設備使用該公司經過驗證的第四代10 nm級工藝技術(也稱為1×nm)生產。美光有一個擴大gddr6x的容量和速度方面的路線圖。
明年,美光打算在產品線中增加16gb密度的芯片,并隨著時間的推移提供更快的芯片。目前,美光是gddr6x唯一的生產商,nvidia是唯一的客戶,所以gddr6x的發展取決于nvidia的需求和美光的量產能力。關鍵要指出的是gddr6x被設置為性能超過21 gbps的擴展。
gddr6x:不是jedec標準,但不是專有的
為了盡快敲定gddr6x并使其與英偉達的安培gpu兼容,兩家公司幾乎在隱身模式下工作。這兩家公司從未將該規范提交給jedec進行標準化,因此gddr6x是目前只能從美光獲得的一種專有內存。
gddr5x主要由美光開發,幾乎沒有來自其他行業的競爭。在美光開始批量生產gddr5x之前,jedec正式發布了該標準,并將其提供給該組織的成員。但是,除了nvidia沒有人使用gddr5x,除了美光也沒有人生產這種內存。
gddr6x也許可用在圖形之外
傳統上,gddr類型的內存幾乎只用于顯卡和游戲機。有了gddr6,美光和它的行業同行開始為其他需要高帶寬的應用推廣顯卡dram。它們的目標是汽車、網絡和fpga應用程序。美光希望gddr6x能夠解決非gpu市場問題。
如今gpu被廣泛用于各種ai應用,因此,當美光談到gddr6x用于非圖形垂直領域時,自然而然地提到了訓練和推理應用。與此同時,由于英偉達的泰坦系列顯卡的目標客戶是游戲玩家、人工智能愛好者和各種消費者,如果英偉達發布一款泰坦安培模型,美光的gddr6x也將在技術上針對這些市場。
為了解決新興市場,美光不僅需要提供內存本身,還需要提供內存控制器ip、phy ip和驗證ip。這些類型的東西是由ip設計公司如avery, cadence, rambus和synopsys負責。由于gddr6x的設計才剛剛開始,ip公司必須迎頭趕上,假設他們看到了行業對gddr6x的潛在需求。這并不能完全保證,特別是考慮到gddr6x并不是jedec支持的行業標準。
美光:cpu可以使用gddr6x?
ebert:“從歷史上看,沒有什么能阻止行業使用cpu的gddr dram。”“這次也一樣。但這個決定必須由cpu公司來做。”
圖形內存的未來:pam4將繼續存在,甚至對于hbm來說也是如此
對美光來說,gddr6x不僅是一種高度復雜的產品,而且是其為dram帶來pam4信令的工作的頂峰。雖然這種類型的編碼不會用于ddr5 sdram,但美光相信,從長遠來看,它是存儲器的未來。
美光圖形存儲主管表示:“所以,我們就是在gddr6x上推出pam4的,而且我們肯定能看到這種技術的進一步發展,pam4有可能被用于其他內存標準。這類技術很有可能會被擁有cpu或其他處理器的公司所采用。”
pam4在工業上的應用將比現在廣泛得多。預計將于2021年發布的pcie 6.0使用pam4信令來提高效率和數據速率。考慮到pcie的廣泛采用,cpu和asic公司最終肯定會支持pcie 6.0和pam4。一旦行業學會如何與pcie 6.0四電平脈沖幅度調制工作,它肯定會應用它在其他地方。
美光表示,他們首次將pam4植入lpddr測試芯片,以試驗這項技術。此外,我們在準備這個故事時發現的一項專利說,美光在三年前獲得了hbm級存儲器與pam4和pam8信號疊加的專利。
hbm類型的內存還必須采用離散dram設備(qdr, bl8/bl16等)所使用的負載,因此很難預測何時它可以采
用新的信令。但如果目前可用的hbm2e 3.6 gbps芯片采用四電平脈沖幅度調制,則每臺設備的帶寬將翻倍至922 gb/s。這意味著一個6模塊的6144位dram子系統將提供巨大的5.5 tb/s帶寬。不過,在這一點上,這純粹是猜測。
『本文轉自:eeworld。版權歸原作者所有,如有侵權請聯系刪除。』