邊緣計算芯片領域已經成為了各大巨頭的必爭之地。
6月10日,賽靈思針對邊緣市場推出了Versal AI Edge系列產品。該產品是一款自適應SoC,采用了7nm Versal架構,是面向下一代分布式智能系統的全球最具可擴展性且靈活應變的產品組合。
根據賽靈思相關負責人透露,Versal AI Edge系列產品將在汽車、工業等領域使用。目前該系列產品的設計文檔和支持已對早期試樣用戶開放,預計在2022年上半年進行早期的量產。
賽靈思一直在強調“自適應計算”這一概念,并定義其為當今創新的驅動力。早在2018年,賽靈思就推出了完全軟件可編程的自適應SoC——Versal ACAP(中央計算加速平臺),性能與靈活性遠超傳統CPU\GPU和FPGA,可以在硬件和軟件層進行修改。
截止目前,基于Versal ACAP這個異構處理器計算平臺,賽靈思已經推出了VersalAI Core、Versal Prime、Versal Premium等系列產品,用于云端和網絡。
此次推出的Versal AI Edge系列,便是Versal ACAP產品組合的最新成員,針對低時延AI計算進行了微型化處理,可以實現前所有未的最優化單位功耗性能。
“與英偉達Xavier相比,賽靈思Versal AI Edge系列器件在智能邊緣傳感器的單位功耗性能、自主系統或邊緣聚合單位功耗性能、CPU加速器單位功耗性能等方面均有優勢。”賽靈思Versal AI Edge系列高級產品線經理Rehan Tahir介紹。
總體來看,與競爭對手的同類型產品相比,Versal AI Edge系列器件具備AI單位功耗性能優于GPU四倍、能夠實現10倍計算密度、提供全球最具可擴展性且靈活應變的邊緣平臺三大差異化競爭優勢:
一、AI單位功耗性能是GPU的4倍
現階段,邊緣AI芯片市場正在快速發展,增長速度已經超過芯片市場整體平均水平,預計到2025年將達到650億美元,由此也迎來了MCU、GPU、DSP、FPGA的多方角力。
與其他芯片企業不同,賽靈思憑借FPGA的可編程性和靈活性,在安全性、可擴展性、實時性等層面打造差異化競爭優勢,能夠在嚴苛的散熱與時延限制下提供一系列靈活的計算處理架構。
Rehan Tahir介紹,Versal AI Edge系列器件采用了全新的專為機器學習優化的AI引擎:AIE-ML,并且在存儲器層級進行了加速器RAM的創新。
一方面,在AI引擎架構當中,賽靈思設置了一個計算核心陣列,能夠將乘法器翻倍,使得INT8的性能翻倍,另外還提供了原生地支持INT4和BFLOAT 16,實現了數據和存儲的本地化。
“所有的本地化存儲都能夠和AI引擎的陣列和塊進行分享,并且通過全新的分布式數據存儲器塊進行互聯。” Rehan Tahir表示,整個AI引擎陣列最大38兆字節,陣列可以加乘,也可以非常緊密的耦合。
另一方面,賽靈思在存儲器層面方面還進行了加速器RAM的創新。據介紹,靈活應變的存儲器層級包含標量存儲器、自適應引擎、智能引擎三大部分,能夠為大規模的帶寬提供一個4MB片上RAM。
基于這樣一個計算核心陣列、新分布式數據存儲器的靈活互聯等,就能夠實現軟件的可編程、硬件的靈活應變等功能,從而帶來相比GPU高達4倍的ML算力,在具備低時延和功耗的同時,支持多樣化工作負載。
例如,雷達/激光雷達處理等高級信號處理、以標量引擎支持嵌入式計算等。
Rehan Tahir提到,與英偉達Jetson AGX Xavier(同為最高配置)相比,Versal AI Edge的單位功耗性能是Jetson AGX Xavier的4.4倍。而在其他配置下,Versal AI Edge也占有功耗與性能的優勢。
二、能夠實現10倍計算密度
根據賽靈思公布的數據顯示,與上一代自適應SoC相比,Versal AI Edge系列產品的算力由4TOPS提升至17.4TOPS,算力提升了4.4倍;面積則由3個器件減少至1個器件,大幅縮小了近60%的面積。
Rehan Tahir介紹,相比此前推出的Zynq® UltraScale+™MPSoC,Versal AI Edge系列產品能夠提供10倍計算密度,并且均推出了車規級產品。
不可否認,汽車將是Versal AI Edge系列產品最大的應用市場之一。
“從傳感器到AI、再到實時控制,Versal AI Edge系列能夠加速整體應用。” Rehan Tahir補充說道,Versal AI Edge系列可用于ADAS與自動駕駛的各個方面。
例如,自適應引擎可以用于傳感器融合和預處理,而智能引擎則可以用于信號調理和低時延AI,標量引擎則用于決策和車輛控制……
目前,Versal AI Edge已經通過ISO 26262安全認證,并且支持Caffe、TensorFlow、PyTorch等軟件棧。
三、全球最具靈活應變且可拓展的邊緣平臺:軟硬件均可升級
當前,包括理想、小鵬等越來越多主機廠都在追求更多的軟件系統自定義能力,因而選擇更加開放的硬件平臺。
Rehan Tahir強調,Versal AI Edge系列產品是全球最靈活應變且可擴展性的邊緣平臺,同時也是當前唯一可在單個架構上從傳感器擴展到加速器的邊緣AI平臺。
這主要得益于Versal AI Edge系列采用了特定領域架構(DSA),以及提供軟硬件OTA升級、動態功能交換(DFx)的靈活應變能力。
其中,動態功能切換(DFx)可以用于汽車的車道偏離預警、停車輔助、駕駛員監測系統等場景,可以實現毫秒級的功能切換。
另一方面,Versal AI Edge系列可以根據不同需求和產品特性進行擴展,例如在單一平臺上實現從L2級ADAS擴展到L3級、甚至是L5級自動駕駛。
“客戶只需要設計一次,即可使用相同的工具、軟件、生態系統、安全認證等將產品組合從低端擴展到高端。” Rehan Tahir補充表示,英偉達給出的ADAS解決方案需要同時使用兩個器件才能滿足相應的功能,但使用賽靈思Versal AIEdge系列的單一器件即可滿足客戶的各類需求。
這無疑大幅降低了客戶的開發成本、功耗以及簡化了系統設計的復雜性。
Rehan Tahir提到,軟件和硬件開發者均可運用Versal AI Edge器件,它所提供的設計入門渠道適用于所有開發者,包括面向硬件開發者的Vivado、面向軟件開發者的Vitis統一軟件平臺、面向平臺目標應用的完整軟件協議棧……
過去幾年,得益于賽靈思在攝像頭、激光雷達等各類傳感器設備的融合計算和機器學習能力,以及對處理器的靈活應變能力,賽靈思的汽車業務一直保持著穩步增長態勢。截止目前,賽靈思汽車芯片的出貨量已經達到2.05億顆,其中有8000萬用于ADAS領域。
根據《高工智能汽車》了解,賽靈思的上一代自適應SoC——Zynq® UltraScale+™,目前已經在宏景智駕、英恒科技等的自動駕駛域控制器產品實現了成功應用。
現階段,汽車數據處理芯片不斷異構化,并且通過不斷添加神經網絡單元實現AI運算,已經成為未來發展的主要方向。例如華為、地平線等AI芯片均添加了神經網絡單元,而英偉達的自動駕駛芯片同樣也添加了神經網絡單元,以實現對AI的更高效處理。
很顯然,作為一款搭載多樣化處理器的異構平臺,賽靈思全新推出的Versal AI Edge系列產品憑借自身在單位功耗性能、可靈活應變、軟硬件均可升級等方面的優勢,將迅速在未來的智能汽車領域打開局面。
FS32K142UAT0VLHT
XC3S1400A-5FGG484C
XC6SLX100-2FGG676I
XC6SLX150-2CSG484I
XC6SLX150-2FGG484I
XC6SLX16-2CSG324C
XC6SLX16-2FTG256C
XC6SLX16-2FTG256I
XC6SLX25-2CSG324C
XC6SLX25-2CSG324I
XC6SLX25-2FTG256C
XC6SLX25-3FTG256C
XC6SLX4-2TQG144C
XC6SLX45-2FGG676C
XC6SLX45-2FGG484C
XC6SLX45-L1CSG324I
XC6SLX45T-2FGG484I
XC6SLX75T-3FGG484I
XC6SLX9-2CSG324C
XC6SLX9-2CSG324I
XC6SLX9-2FTG256C
XC6SLX9-2FTG256I
XC6SLX9-2TQG144C
XC7A75T-2FGG676I
XC7K160T-2FFG676C
XC7K160T-2FFG676I
XC7Z010-2CLG400I