COMPUTEX 2024正如火如荼展開,安謀Arm基礎設施事業部行銷副總裁Eddie Ramirez於5日在COMPUTEX 2024生成式AI新賽局論壇中,以「以Arm Neoverse建構永續且能因應AI需求的雲端資料中心」為題發表演說。Arm 正努力促進新型晶片的創新,以提升AI運算硬體的效能及功耗效率,如與輝達、微軟與Google合作,設計工作負載最佳化的晶片。

我是廣告 請繼續往下閱讀
安謀Arm基礎設施事業部行銷副總裁Eddie Ramirez指出,AI日漸風行,在各行各業中無所不在,範圍涵蓋健康照護、零售、專業服務乃至於製造業等各種領域,這樣持續成長的AI工作負載,大幅增加能源消耗,指出指數型成長的人工智慧(AI)工作負載及其對能源消耗的影響。

也因此,Eddie Ramirez表示我們需要更高效率的AI硬體,傳統的AI硬體不但價格昂貴,也需要大量電力。Arm 正努力促進新型晶片的創新,以提升AI運算硬體的效能及功耗效率,其中,Arm 與大型的超大規模運算業者和科技公司合作,設計工作負載最佳化的晶片。例如 NVIDIA、AWS、Microsoft 及 Google,都已宣布推出 Arm 架構的伺服器產品。

Eddie Ramirez也提及CPU及GPU對AI工作負載的重要性。AI資料中心需要 CPU及GPU以便有效擴充AI運算效能。GPU非常適合用於大型AI工作負載,但是價格昂貴且需要大量電力。CPU用途更為多元,可用於各式各樣的工作負載。Arm持續努力為AI推論工作負載提升CPU效能。其中一個明顯的例子,即是 Arm Neoverse 提升的效能及每瓦效能,在市場上超越其他競爭對手。

他認為,透過量化技術可提升AI模型效率,量化是一種技術,可用於減少人工智慧模型呈現數據時所需的位元數,以便縮小AI模型,並提升執行效率。Arm 正努力開發新的量化技術,用來提升AI模型效率而不犧牲準確性。藉由使用記憶體用量更小的模型,使其單獨於CPU執行,並運用模型量化策略降低硬體需求,為於邊緣和雲端上實現AI聊天機器人伺服器,開闢了新的可能性,範圍從RaspberryPi4 這類小型邊緣裝置到像 AWS Graviton3 這樣強大的雲端服務供應商。

而Arm正努力推進小晶片技術,並致力於促成多元的小晶片生態系,Arm 全面設計(Arm Total Design) 生態系計畫,集結整個半導體供應鏈的業界領先企業,以更強大的力量促成客製化晶片、並降低其成本。Arm全面設計生態系計畫推出以來,在短短6個月內就吸引多達25家成員加入,包括新的EDA及輔助IP供應商,此外,來自龐大成長潛力市場的晶片設計合作夥伴也加入其中,例如韓國、台灣、中國及印度等地。

Eddie Ramirez指出,Arm與三大主要晶圓製造夥伴密切交流互動,如 6月4日聯發科技宣佈加入Arm全面設計生態系計畫。此外,ATD 的另一家合作夥伴聯詠科技和瑞昱科技,也宣布推出基於 Neoverse CSS N3 的 AI 小晶片和網路邊緣 SoC,並與台積電合作。

更多「COMPUTEX2024」相關新聞。