性能密度的功耗和高達的帶寬降低
發布時間:2020/10/17 22:12:55 訪問次數:2082
與當前的通用計算硬件(CPU / GPU / FPGA)相比,專用型 AI 設計的最大優勢,在于能夠實現“傳統”平臺難以企及的更高的性能和能效目標。
性能數據方面,高通拿目前業內常用的解決方案進行了對比,包括英特爾 Goya 和英偉達 T4 推理加速器(基于砍了一刀的 TU104 GPU 芯片),每瓦每秒的推理能力為 ResNet-50 。
據說 Cloud AI 100 在每瓦性能上較競品實現了重大飛越,且高通在另一幅圖表中展示了一個相對公平的比較。
其甚至能夠在 75W 的 PCIe 外形尺寸內擊敗英偉達 Ampere 架構的 250W A100 加速器。且在功耗降低 25% 的情況下,性能還較英特爾 Goya 加速器翻了一番。
這樣的性能數據,讓許多人覺得難以置信,不過從 Cloud A100 的芯片規格來看,事情其實并不簡單。該芯片包含了 16 組 AI 內核,和達成 400 TOPS 的 INT8 推理吞吐量。
高通生產下一代5G高端智能手機移動應用處理器的1萬億韓元訂單。將于12月發布的驍龍875預計將用于三星、小米和OPPO的智能手機中。這是三星首次獲得高通旗艦芯片訂單。
據悉,三星已經開始使用EUV設備在韓國的生產線上大規模生產驍龍875,其將對飆臺積電5nm工藝代工的蘋果A14和華為麒麟9000。
除了驍龍875處理器外,據說三星的5nm工藝產線,還將代工驍龍X60調制解調器以及Exynos 1000。
驍龍875可能會首次引入Cortex-X1超大核心、Cortex-A78大核心的組合,其中全新設計的X1核心能效相比A77、A78分別高出30%、23%,機器學習能力也比A78高出一倍,其有望首次在高通旗艦平臺集成5G基帶,徹底告別外掛。
全新的IMG B系列(IMG B-Series)圖形處理器(GPU),進一步擴展了其GPU知識產權(IP)產品系列。憑借其先進的多核架構,B系列可以使Imagination的客戶在降低功耗的同時獲得比市場上任何其他GPU IP更高的性能水平。它提供了高達6 TFLOPS(每秒萬億次浮點運算)的計算能力,與前幾代產品相比,功耗降低了多達30%,面積縮減了25%,且填充率比競品IP內核高2.5倍。
憑借IMG A系列GPU,Imagination在前幾代產品基礎上實現了超乎尋常的飛躍,從而在性能和功耗特性方面占據了行業領先地位。B系列是Imagination GPU IP的再一次演進,可提供最高的性能密度(performance per mm2),同時提供了多種全新配置,可以針對給定的性能目標實現更低的功耗和高達35%的帶寬降低,這使其成為頂級設計的理想解決方案。
(素材來源:chinaaet和ttic.如涉版權請聯系刪除。特別感謝)
與當前的通用計算硬件(CPU / GPU / FPGA)相比,專用型 AI 設計的最大優勢,在于能夠實現“傳統”平臺難以企及的更高的性能和能效目標。
性能數據方面,高通拿目前業內常用的解決方案進行了對比,包括英特爾 Goya 和英偉達 T4 推理加速器(基于砍了一刀的 TU104 GPU 芯片),每瓦每秒的推理能力為 ResNet-50 。
據說 Cloud AI 100 在每瓦性能上較競品實現了重大飛越,且高通在另一幅圖表中展示了一個相對公平的比較。
其甚至能夠在 75W 的 PCIe 外形尺寸內擊敗英偉達 Ampere 架構的 250W A100 加速器。且在功耗降低 25% 的情況下,性能還較英特爾 Goya 加速器翻了一番。
這樣的性能數據,讓許多人覺得難以置信,不過從 Cloud A100 的芯片規格來看,事情其實并不簡單。該芯片包含了 16 組 AI 內核,和達成 400 TOPS 的 INT8 推理吞吐量。
高通生產下一代5G高端智能手機移動應用處理器的1萬億韓元訂單。將于12月發布的驍龍875預計將用于三星、小米和OPPO的智能手機中。這是三星首次獲得高通旗艦芯片訂單。
據悉,三星已經開始使用EUV設備在韓國的生產線上大規模生產驍龍875,其將對飆臺積電5nm工藝代工的蘋果A14和華為麒麟9000。
除了驍龍875處理器外,據說三星的5nm工藝產線,還將代工驍龍X60調制解調器以及Exynos 1000。
驍龍875可能會首次引入Cortex-X1超大核心、Cortex-A78大核心的組合,其中全新設計的X1核心能效相比A77、A78分別高出30%、23%,機器學習能力也比A78高出一倍,其有望首次在高通旗艦平臺集成5G基帶,徹底告別外掛。
全新的IMG B系列(IMG B-Series)圖形處理器(GPU),進一步擴展了其GPU知識產權(IP)產品系列。憑借其先進的多核架構,B系列可以使Imagination的客戶在降低功耗的同時獲得比市場上任何其他GPU IP更高的性能水平。它提供了高達6 TFLOPS(每秒萬億次浮點運算)的計算能力,與前幾代產品相比,功耗降低了多達30%,面積縮減了25%,且填充率比競品IP內核高2.5倍。
憑借IMG A系列GPU,Imagination在前幾代產品基礎上實現了超乎尋常的飛躍,從而在性能和功耗特性方面占據了行業領先地位。B系列是Imagination GPU IP的再一次演進,可提供最高的性能密度(performance per mm2),同時提供了多種全新配置,可以針對給定的性能目標實現更低的功耗和高達35%的帶寬降低,這使其成為頂級設計的理想解決方案。
(素材來源:chinaaet和ttic.如涉版權請聯系刪除。特別感謝)
上一篇:工作頻率較高的芯片在運行
上一篇:無人機ToF傳感器用于測量體積