時序模型布線晶圓的差異化
發布時間:2020/8/23 10:53:19 訪問次數:1854
格芯對mac單元的脈動陣列(這是cnn加速的常見配置)的功耗進行了仿真。仿真讀取權重和激活,讓數據移動通過脈動陣列(傳輸),然后執行計算(mac)。相對于基本設計,新的mac單元和鎖存sram使總能耗減少了三分之一以上,而傳輸能耗保持不變。以0.55v電壓工作會產生一個全面的大壓降,使該設計的總節電量達到68%。
格芯通過廣泛的物理元件庫(包括數字、模擬和無源器件)來支持12lp+工藝。格芯提供eda工具(如cadence和synopsys插件)、spice模型、設計規則檢查器、時序模型以及布局布線功能。為了提高良率,格芯提供了完整的可制造性設計(dfm)流程。格芯已針對12lp+重新優化了12lp物理ip,包括存儲器和i/o接口。除了arm的低壓標準單元庫外,rambus和synopsys等第三方ip供應商也支持12lp+。
新技術建立在格芯成功的12lp工藝基礎上,為行業領先的ai產品提供助力。硅谷初創公司groq開發了一種新的架構方法來加速集數百個功能單元于單個核心中的神經網絡。龐大的設計包括220mb的sram和200,000以上的mac單元(mpr 1/6/20,“groq撼動神經網絡”)。groq采用12lp使如此大型設計的功耗保持在300w的預算之內。該芯片以1.0ghz的初始速度,對int8數據實現了每秒820萬億次運算(tops)的峰值吞吐量,超過了所有其他已發布的加速器。
mkl16z128vlh4數據表
制造商: nxp
產品種類: arm微控制器 - mcu
rohs: 詳細信息
安裝風格: smd/smt
封裝 / 箱體: lqfp-64
系列: kinetis l1
核心: arm cortex m0+
數據總線寬度: 32 bit
最大時鐘頻率: 48 mhz
程序存儲器大小: 128 kb
數據 ram 大小: 16 kb
adc分辨率: 16 bit
輸入/輸出端數量: 70 i/o
最小工作溫度: - 40 c
最大工作溫度: + 105 c
接口類型: i2c, i2s, spi, uart
封裝: tray
程序存儲器類型: flash
商標: nxp / freescale
數據 ram 類型: ram
adc通道數量: 1
計時器/計數器數量: 3 timer
處理器系列: kl1
產品類型: arm microcontrollers - mcu
工廠包裝數量: 160
子類別: microcontrollers - mcu
商標名: kinetis
零件號別名: 935311433557
單位重量: 346.550 mg
12lp+的其余優勢來自于該技術專為ai設計的sram和mac單元。這種方法反映了晶圓廠的差異化:臺積電必須服務于廣泛的客戶,而格芯可以專注于特定的新興工作負載。ai市場尤其成果豐碩,因為有太多的公司(特別是初創公司)在開發cnn加速器。大型客戶通常會自行設計緩存和mac單元,但格芯的設計對于希望將開發成本降至最低而專注于獨特架構的初創公司很有用。
在沒有7nm及更小線寬技術的路線圖的情況下,格芯能否保持競爭力。臺積電的5nm技術正在量產中,客戶已經啟動未來節點的設計。這些先進的工藝使設計師能夠將更多存儲器和mac單元放入芯片中。市場份額最大的大型公司將繼續沿這條路走下去。面向ai市場的小型公司則會發現12lp+更實惠,而且可以使用小芯片來經濟高效地提高晶體管數量。groq和tenstorrent通過格芯的12lp技術實現了領先的ai性能,12lp+中的ai增強功能將使新技術更加卓越。
格芯對mac單元的脈動陣列(這是cnn加速的常見配置)的功耗進行了仿真。仿真讀取權重和激活,讓數據移動通過脈動陣列(傳輸),然后執行計算(mac)。相對于基本設計,新的mac單元和鎖存sram使總能耗減少了三分之一以上,而傳輸能耗保持不變。以0.55v電壓工作會產生一個全面的大壓降,使該設計的總節電量達到68%。
格芯通過廣泛的物理元件庫(包括數字、模擬和無源器件)來支持12lp+工藝。格芯提供eda工具(如cadence和synopsys插件)、spice模型、設計規則檢查器、時序模型以及布局布線功能。為了提高良率,格芯提供了完整的可制造性設計(dfm)流程。格芯已針對12lp+重新優化了12lp物理ip,包括存儲器和i/o接口。除了arm的低壓標準單元庫外,rambus和synopsys等第三方ip供應商也支持12lp+。
新技術建立在格芯成功的12lp工藝基礎上,為行業領先的ai產品提供助力。硅谷初創公司groq開發了一種新的架構方法來加速集數百個功能單元于單個核心中的神經網絡。龐大的設計包括220mb的sram和200,000以上的mac單元(mpr 1/6/20,“groq撼動神經網絡”)。groq采用12lp使如此大型設計的功耗保持在300w的預算之內。該芯片以1.0ghz的初始速度,對int8數據實現了每秒820萬億次運算(tops)的峰值吞吐量,超過了所有其他已發布的加速器。
mkl16z128vlh4數據表
制造商: nxp
產品種類: arm微控制器 - mcu
rohs: 詳細信息
安裝風格: smd/smt
封裝 / 箱體: lqfp-64
系列: kinetis l1
核心: arm cortex m0+
數據總線寬度: 32 bit
最大時鐘頻率: 48 mhz
程序存儲器大小: 128 kb
數據 ram 大小: 16 kb
adc分辨率: 16 bit
輸入/輸出端數量: 70 i/o
最小工作溫度: - 40 c
最大工作溫度: + 105 c
接口類型: i2c, i2s, spi, uart
封裝: tray
程序存儲器類型: flash
商標: nxp / freescale
數據 ram 類型: ram
adc通道數量: 1
計時器/計數器數量: 3 timer
處理器系列: kl1
產品類型: arm microcontrollers - mcu
工廠包裝數量: 160
子類別: microcontrollers - mcu
商標名: kinetis
零件號別名: 935311433557
單位重量: 346.550 mg
12lp+的其余優勢來自于該技術專為ai設計的sram和mac單元。這種方法反映了晶圓廠的差異化:臺積電必須服務于廣泛的客戶,而格芯可以專注于特定的新興工作負載。ai市場尤其成果豐碩,因為有太多的公司(特別是初創公司)在開發cnn加速器。大型客戶通常會自行設計緩存和mac單元,但格芯的設計對于希望將開發成本降至最低而專注于獨特架構的初創公司很有用。
在沒有7nm及更小線寬技術的路線圖的情況下,格芯能否保持競爭力。臺積電的5nm技術正在量產中,客戶已經啟動未來節點的設計。這些先進的工藝使設計師能夠將更多存儲器和mac單元放入芯片中。市場份額最大的大型公司將繼續沿這條路走下去。面向ai市場的小型公司則會發現12lp+更實惠,而且可以使用小芯片來經濟高效地提高晶體管數量。groq和tenstorrent通過格芯的12lp技術實現了領先的ai性能,12lp+中的ai增強功能將使新技術更加卓越。
上一篇:鎖存器將多路復用器與陣列解耦