上周,眾多芯片領域的重要人物齊聚舊金山,為了參加全球最重要的芯片領域會議ISSCC2023。今年是第七十屆ISSCC會議,其主題是“半導體電路設計創新70年”(Buildingon70yearsofinnovationinsolid-statecircuitdesign)。過去的70年是半導體芯片行業突飛猛進的70年,而到了今天,芯片領域下一個創新的機會在哪里呢?在今年ISSCC的主旨演講(Plenary)以及會議發表的論文中,我們認為核心關鍵詞就是“系統級創新”(systeminovation)。
在AMD的CEOLisaSu帶來的主旨演講“Innovationforthenextdecadeofcomputeefficiency“(下一個十年計算效率的創新)中,Su提到了AI應用的突飛猛進,以及它給芯片帶來的需求。隨著以ChatGPT為代表的大語言模型(LLM)逐漸流行,AI模型的參數量指數級上升,而相應地對于計算芯片和內存的需求也在快速提升,但是目前芯片的效率并不足以滿足模型的需求。根據目前計算效率每兩年提升2.2倍的規律,預計到2035年,一個超級計算機需要的功率可達500mW,相當于半個核電站能產生的功率。顯然,為了滿足這樣的計算需求,計算效率的提升需要遠遠超過每兩年2.2倍,而為了實現這樣的效率提升,系統級創新是最關鍵的思路之一。
在另一個由歐洲最著名三個的半導體研究機構IMEC/CEALeti/Fraunhofer帶來的主旨演講中,系統級創新也是一個核心關鍵詞。該演講中提到,隨著半導體工藝逐漸接近物理極限,新的應用對于芯片的需求也必須要從系統級考慮才能滿足,并且提到了下一代智能汽車和AI作為兩個尤其需要芯片從系統級創新才能支持其新需求的核心應用。
什么是系統級創新?
我們看到,系統級創新在本屆ISSCC最重要的主旨演講中被反復提起,那么什么是系統級創新呢?目前的共識是,系統級創新就是從整體設計的上下游多個環節協同設計來完成性能的提升。在系統級中,上游技術包括應用軟件,算法,系統架構,元器件需求等,而這些上游的需求最后會反映到芯片的需求中,包括芯片的設計,半導體器件的設計,以及半導體工藝的設計等。
在過去的設計中,性能提升往往只是體現在一個維度中,例如電路設計的成功標準是數字電路時鐘頻率能不能跑得夠快,模擬電路能不能帶寬做到更大等等。而在系統級創新中,性能提升不僅僅是由該技術層面的設計改善實現,更重要是由上游應用、算法和系統革新并且由電路、器件和工藝層面的設計滿足這些需求,來完成整體性能的提升。
LisaSu在演講中給出了一個系統級創新的一個經典案例,就是在人工智能模型算法層面通過優化從而可以使用一些創新的數制(例如16位浮點數BF16或8位浮點數FP8),同時在電路層面通過對這些算法層面優化給予支持,最終實現計算層面數量級的效率提升。相比傳統的32位浮點數(FP32),新的BF16可以提升10倍以上的計算效率,而FP8則可以將計算效率提升30倍之多。這也是系統級創新的威力:根據傳統思路,如果電路設計僅僅停留在電路的維度,只是考慮如何進一步優化FP32計算單元的效率,無論如何也難以實現數量級的效率提升。這也是為什么在新應用對于芯片性能提出非常激進的性能需求的時候,芯片行業需要從系統級的思維來滿足這樣的需求的原因。
作為系統級創新支柱的半導體技術
如前所述,半導體芯片的設計需要考慮系統級創新,才能滿足新的應用對于芯片性能提升的需求。從另一層面,在這樣的系統級創新中,有一些重要的半導體技術將會成為核心的支撐,因此在系統級創新成為核心技術演進動力的今天,這些半導體技術將會變得格外重要。
我們認為,系統級創新意味著整體芯片系統會變得更加復雜:這里的復雜意味著系統中會有更多的芯片(這也包括了把一塊大芯片拆分成多個小的芯片粒),因此這就需要能以一種靈活的方式支持這樣的多芯片系統,同時能提供性能和效率的顯著提升。一旦半導體技術能提供這樣的平臺來支持這樣的復雜系統,那么系統級設計就有了更大的設計空間,從而為系統級創新提供強有力的支持。
對于這樣的復雜芯片系統提供高效支持的半導體技術首先是高級封裝技術。使用高級封裝技術,可以把復雜芯片系統以高效的形式集成在一個封裝內,并且提供非常高的通信帶寬,因此可以為系統級芯片創新提供支持。例如,高級封裝可以把傳統的片上緩存(cache)和處理器芯片以芯片粒的形式集成在一起,這樣就大大減少了半導體工藝對于cache容量的限制,從而為系統設計提供了更大的設計空間,而這樣的設計(3DV-Cache)已經被證明可以顯著改善處理器的性能并且AMD已經在產品中使用。在未來,我們可望會看到更多的設計。