中國AI新創公司DeepSeek(深度求索)問世撼動了美國矽谷及科技業,更重創輝達股價,業界人士普遍認為,DeepSeek握有大量輝達H100高階晶片,研發大語言模型時可繞過了輝達的CUDA框架,如今更為未來適配中國國產晶片做好積極準備。
新加坡媒體《聯合早報》3日報導指出,由輝達開發的軟硬體整合技術「統一運算架構」(Compute Unified Device Architecture,CUDA)是一種通用程式框架,允許開發者利用輝達的圖形處理器(GPU)進行運算,藉此全球大模型開發商在研發過程可降低難度,因此也大部分傾向使用CUDA 技術,輝達因此占據全球人工智慧領域的壟斷地位。
美國科技網站Tom's Hardware報導則引述一名韓國未來資產證券分析師說法指,DeepSeek在使用輝達的H800晶片進行訓練時選擇使用的是輝達底層硬指令PTX(Parallel Thread Execution)語言,而非高階的CUDA語言進行模型訓練,這個決策使得DeepSeek在訓練效率上比其他模型高出10倍以上。
CUDA作為通用程式框架少了一些彈性,而PTX作為接近硬體層級的程式語言,允許開發者進行更細緻的優化調整,從而提高訓練速度。
報告指出,DeepSeek的做法使得其模型訓練時間從其他模型所需的10天縮短至5天。儘管這種設計方法複雜且難以維護,但DeepSeek內部擁有擅長PTX語言的開發者,使其在未來適配中國國產GPU時更具優勢。
隨著DeepSeek技術的崛起,美國方面對其表現出強烈關注。美國白宮及聯邦調查局正在調查DeepSeek是否透過新加坡等第三方取得輝達晶片,美國跨黨派議員也呼籲對輝達晶片出口實施新限制,以防止中國企業獲得先進技術。
我是廣告 請繼續往下閱讀
美國科技網站Tom's Hardware報導則引述一名韓國未來資產證券分析師說法指,DeepSeek在使用輝達的H800晶片進行訓練時選擇使用的是輝達底層硬指令PTX(Parallel Thread Execution)語言,而非高階的CUDA語言進行模型訓練,這個決策使得DeepSeek在訓練效率上比其他模型高出10倍以上。
CUDA作為通用程式框架少了一些彈性,而PTX作為接近硬體層級的程式語言,允許開發者進行更細緻的優化調整,從而提高訓練速度。
報告指出,DeepSeek的做法使得其模型訓練時間從其他模型所需的10天縮短至5天。儘管這種設計方法複雜且難以維護,但DeepSeek內部擁有擅長PTX語言的開發者,使其在未來適配中國國產GPU時更具優勢。
隨著DeepSeek技術的崛起,美國方面對其表現出強烈關注。美國白宮及聯邦調查局正在調查DeepSeek是否透過新加坡等第三方取得輝達晶片,美國跨黨派議員也呼籲對輝達晶片出口實施新限制,以防止中國企業獲得先進技術。