內存控制器調整頻率電壓曲線
發布時間:2020/10/17 21:57:34 訪問次數:2622
現今TWS耳塞和其他聽覺設備的用例已經遠遠超出了聽音樂或打電話的范圍。今天消費者期望擁有一款結合健身、娛樂、增強現實和游戲功能,并且更加直觀的情境感知設備。我們的MotionEngine Hear解決方案克服了在這些設備中添加功能強大的高精度運動感應功能的主要技術和性能難題,使得客戶能夠在這個利潤豐厚的市場中進行創新。
Cloud AI 100 推理芯片平臺,現已投產并向客戶出樣,預計 2021 上半年可實現商業發貨。雖然更偏向于“紙面發布”,且未能披露硬件的更多細節,但借助其在移動 SoC 世界的專業知識,這也是該公司首次涉足數據中心 AI 推理加速器業務、并將之推向企業市場。
隨著芯片開始出樣,高通 Cloud AI 100 推理芯片終于從實驗室走向了現實,并且披露了有關其架構設計、性能功耗目標在內的諸多細節。
據悉,高通為商業化部署提供了三種不同的封裝形式,包括成熟的 PCIe 4.0 x8 接口(在 75W TDP 上實現 400 TOPS 算力)、以及 DM.2 和 DM.2e 接口(25W / 15W TDP)。
DM.2 的外形類似于彼此相鄰的兩個 M.2 連接器,在企業市場上頗受歡迎。DM.2e 則是體型更小,封裝功耗也更低。
從架構的角度來看,該設計借鑒了高通在驍龍移動 SoC 上部署的神經處理單元(NPU)的豐富經驗,但仍基于一種完全針對企業工作負載而優化的獨特架構設計。
輔以 4 路 @ 64-bit 的 LPDDR4X-4200(2100MHz)的內存控制器,每個控制器管著 4 個 16-bit 通道,總系統帶寬達 134 GB/s 。
如果你對當前的 AI 加速器設計比較熟悉,就知道它與英偉達 A100 和英特爾 Goya 等推理加速器競品的帶寬有較大差距,因為后者具有高帶寬緩存(HBM2)和高達 1-1.6 TB/s 的帶寬。
即便如此,高通還是設法為 Cloud AI 100 平臺配備了 144MB 的片上 SRAM 高速緩存,以達成盡可能高的存儲流量。
在工作負載的內存空間占用超過片上 SRAM 的情況下,該架構的性能將有所不同。但對于目標客戶來說,這樣的平衡設計,仍是有意為之。
后續該公司還展望了更大的內核、以及在多個 Cloud AI 100 加速器之間橫向擴展。在被問及如何達成 15W 至 75W 的動態功耗范圍時,高通宣稱其正在調整頻率 / 電壓曲線,以及調制 AI 核心的數量。
(素材來源:chinaaet和ttic.如涉版權請聯系刪除。特別感謝)
現今TWS耳塞和其他聽覺設備的用例已經遠遠超出了聽音樂或打電話的范圍。今天消費者期望擁有一款結合健身、娛樂、增強現實和游戲功能,并且更加直觀的情境感知設備。我們的MotionEngine Hear解決方案克服了在這些設備中添加功能強大的高精度運動感應功能的主要技術和性能難題,使得客戶能夠在這個利潤豐厚的市場中進行創新。
Cloud AI 100 推理芯片平臺,現已投產并向客戶出樣,預計 2021 上半年可實現商業發貨。雖然更偏向于“紙面發布”,且未能披露硬件的更多細節,但借助其在移動 SoC 世界的專業知識,這也是該公司首次涉足數據中心 AI 推理加速器業務、并將之推向企業市場。
隨著芯片開始出樣,高通 Cloud AI 100 推理芯片終于從實驗室走向了現實,并且披露了有關其架構設計、性能功耗目標在內的諸多細節。
據悉,高通為商業化部署提供了三種不同的封裝形式,包括成熟的 PCIe 4.0 x8 接口(在 75W TDP 上實現 400 TOPS 算力)、以及 DM.2 和 DM.2e 接口(25W / 15W TDP)。
DM.2 的外形類似于彼此相鄰的兩個 M.2 連接器,在企業市場上頗受歡迎。DM.2e 則是體型更小,封裝功耗也更低。
從架構的角度來看,該設計借鑒了高通在驍龍移動 SoC 上部署的神經處理單元(NPU)的豐富經驗,但仍基于一種完全針對企業工作負載而優化的獨特架構設計。
輔以 4 路 @ 64-bit 的 LPDDR4X-4200(2100MHz)的內存控制器,每個控制器管著 4 個 16-bit 通道,總系統帶寬達 134 GB/s 。
如果你對當前的 AI 加速器設計比較熟悉,就知道它與英偉達 A100 和英特爾 Goya 等推理加速器競品的帶寬有較大差距,因為后者具有高帶寬緩存(HBM2)和高達 1-1.6 TB/s 的帶寬。
即便如此,高通還是設法為 Cloud AI 100 平臺配備了 144MB 的片上 SRAM 高速緩存,以達成盡可能高的存儲流量。
在工作負載的內存空間占用超過片上 SRAM 的情況下,該架構的性能將有所不同。但對于目標客戶來說,這樣的平衡設計,仍是有意為之。
后續該公司還展望了更大的內核、以及在多個 Cloud AI 100 加速器之間橫向擴展。在被問及如何達成 15W 至 75W 的動態功耗范圍時,高通宣稱其正在調整頻率 / 電壓曲線,以及調制 AI 核心的數量。
(素材來源:chinaaet和ttic.如涉版權請聯系刪除。特別感謝)
上一篇:加速度計陀螺儀和接近傳感器產品
上一篇:工作頻率較高的芯片在運行