很顯然,站在Arm的角度來說,這顯然是一種對他們業務方式和“行業地位”的誤解。或許正是出于這樣的考量,就在今天,Arm方面在北京召開了新一屆的技術日活動,詳細介紹了他們如今的產品形態、設計,以及相關技術優勢。
發布終端CSS,Arm的業務不僅只有“架構授權”
對于現如今的Arm來說,這家公司已經不僅僅是一家提供"獨立的“CPU、GPU 產品的IP設計商,Arm已經轉型為一家計算平臺的提供商。在終端領域,從2021年開始,Arm就已經推出了名為”全面計算解決方案(TCS)“的參考平臺設計方案。隨著這個產品組合近年來的大獲成功,Arm方面也在前不久剛剛宣布了面向消費電子設備的全新產品方案,也就是本文的主角——Arm終端計算子系統(下文將簡稱為Arm終端CSS)。

Arm終端CSS具體包含哪些內容?簡單來說,它可以視為“IP+制程+軟件優化”這一整套組合。

在IP方面,Arm終端CSS首先就有最新一代的Arm v9.2 CPU集群,其中包括Cortex-X925超大核、Cortex-A725性能核,以及新版的Cortex-A520能效核設計。

其次,它還包含最新版本的Arm CoreLink互聯系統,以及其上所集成的系統級緩存和系統內存管理單元。
最后,Arm終端CSS還包含基于Arm第五代GPU架構而設計的新GPU系列。而根據不同的核心規模,它又可以被細分為Immortalis-G925、Mali-G725和Mali-625這三條產品線。
制程方面,Arm終端CSS包含了Arm與“領先代工廠伙伴”合作的3nm工藝的CPU和GPU物理實現。這既意味著新的產品在設計時就已經考慮到了3nm工藝的影響,可以充分發揮3nm的潛力,同時也代表著相關代工廠們已經針對這一代Arm的新產品做好了準備。

而在軟件層面,Arm也推出了針對Android設備的CSS參考軟件堆棧,除此之外還有能夠助力軟件開發者充分利用Arm CPU性能的Arm Kleidi軟件庫,讓他們順利打造新的AI體驗。
不只架構換代,新組合還有多的官方優化
不難發現,Arm終端CSS絕對不是單獨的CPU或GPU“架構授權”。那么這套方案的好處又到底是什么呢?
按照官方的說法,Arm終端CSS是從平臺面出發,以解決AI日新月異的計算需求。它的一大好處就是它具備非常高的性能。比如,它在Geekbench 6中的單核性能,就可以比去年的Arm TCS23平臺提升多達36%。

在一些更接近現實用例的測試場景中,Arm終端CSS的頭部流行應用平均啟動時間比去年的舊平臺加快了33%,網頁瀏覽速度加快了60%。而在包含了光追和可變速率著色的七項圖形基準測試當中,其峰值性能平均增長也達到了30%。

需要注意的是,這些實測性能的增長并不完全源自單純的CPU架構換代。事實上,通過Arm內部參考配置來看,終端CSS采用了 2+4+2的CPU集群組合,同時還有比前代大了一倍的系統緩存。而這種核心組合以及緩存的調整,實際上就相當于是Arm對于“新產品該如何發揮最大性能”的成熟研發結果,對比于過往從單一CPU的角度切入,這就是從平臺面思考所獲得的顯著成果。

不僅如此,在看到Arm終端CSS與前代TCS的AI性能對比時,既要注意到它在多個大模型項目中都有著接近50%的性能增長,但同時也要看到,這種增長并非完全源自NPU(或者說DSP)的換代,而是因為Arm終端CSS還利用了新架構CPU和/或GPU的AI計算能力。因此新平臺能夠在執行AI計算時,更好地同時調用多個不同的計算部件。而這背后就涉及到Arm新的互聯系統以及新的軟件堆棧,這同樣也是光從單一CPU切入所做不到的事情。

在今天的溝通中,Arm方面不止一次的強調,終端CSS可以有效地加快消費市場的SoC生產、換代速度。很顯然,考慮到它包含了CPU核心、緩存的“官方建議配置組合”,以及相對成熟的軟件優化,甚至是與代工廠之間的制程適配,這也就意味著對于SoC廠商來說,如果直接“選用”Arm的這套成熟方案,就可以節約大量的研發和適配時間,甚至完全有可能帶來比一些使用“魔改”CPU搭配芯片廠商自研GPU或其他部件的方案,具備更高的性能和能效比。
Arm終端CSS并不死板,或獲將造福更為廣泛的市場
當然,考慮到Arm終端CSS的“打包”特性,不免會讓有些朋友感到擔憂,它是否會導致市面上的Arm SoC在一定程度失去多樣性?
針對這個問題,其實大家要先明白一件事,那就是Arm終端CSS并不是固定的一種設計。實際上,Arm終端CSS具有相當高的可擴展性,它的很多細節都可以根據最終的需求進行微調。比如,它最多其實可以支持到14個CPU核心、而不是常見的8核,同時其“2+4+2”的CPU組合方式也并非絕對,廠商完全可以根據自身的需求去推出9核、10核CPU,或是集成了更多超大核和大核的方案。

其次根據不同的使用場景,Arm終端CSS的“內涵”也會有所不同。舉例而言,由于目前的Arm GPU不支持Direct X,所以如果要將其用于Windows PC,那么此時的Arm終端CSS就可以不包括GPU這個部件,而是僅提供CPU與總線、緩存部分,再搭配其他“外掛”GPU方案。但如果是用于Linux PC(比如Chrome Book),那么這時候就依然可以采用包含GPU的Arm終端CSS方案,以發揮出來自官方的異構計算和能效優化效果。
況且就算是目前版本下“完整”的Arm終端CSS,也遠非是一顆完全的SoC設計,比如它并不包含NPU、DSP、DPU、VPU等等周邊計算模組,也不帶有基帶、藍牙、WiFi和電源管理部件。

值得注意的是,Arm其實是有自己的NPU、DPU、VPU等產品線,所以當Arm終端CSS不帶有這些“組件”時,很明顯便是在為終端廠商的差異化在做考量。
綜合以上信息不難發現,當SoC廠商選擇了Arm終端CSS的時候,便可以自由調整CPU核心組合、修改緩存大小、替換GPU、配合自研或外購的ISP、NPU,以及其他外圍部件,去形成一套完整的SoC方案。除了不能使用自研CPU架構之外,Arm似乎就沒有做出更多的限制。

況且大家要明白,對于市面上幾乎所有的SoC廠商來說,就算他們有自研的CPU、GPU方案,很多時候這些方案也會受限于成本因素,不太可能完全覆蓋從最頂級的旗艦到入門級的完整市場。對于一些重視交付速度的主流產品線,或者是一些既要有新技術、又要控制成本的細分市場來說,Arm終端CSS的潛在競爭力甚至可能比它在旗艦領域的表現還要更好。
那么這些意味著什么?說得更直白一點,依托于Arm終端CSS,未來我們不僅會看到一些設計大膽、堆料“恐怖”的旗艦SoC方案。它更是有希望加快中高端、中端SoC的換代速度,從而解決大家經常詬病的“旗艦年年更新、但中端機卻原地踏步”的市場現狀。
海報生成中...