中國人工智慧(AI)新創公司DeepSeek日前推出標榜低成本、高效能的大型推理模型DeepSeek-R1以及開源模型DeepSeek-V3,引發矽谷熱烈討論。連帶讓美股與日股AI相關個股暴跌暴起,這場AI競逐也讓中國內部再度出現「內卷」,阿里巴巴旗下「阿里雲」竟在除夕夜發布「通義千問」Qwen 2.5-Max模型,並聲稱在測試表現超越了DeepSeek V3。
綜合中媒報導,阿里「通義千問」團隊在除夕夜發表了全新的「通義千問」Qwen 2.5-Max超大規模MoE模型,阿里雲團隊介紹中宣稱,研發過程中使用超過20兆token預訓練數據和精心設計的後訓練方案。
阿里雲放話稱,他們將這款Qwen 2.5-Max拿來與GPT-4o、DeepSeek-V3和Llama-3.1-405B進行對比,在多項基準測試中表現超越DeepSeek-V3。
阿里雲研發團隊強調,Qwen2.5-Max的模型在大多數基準測試中都展現出了顯著優勢,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水準,消息一出,阿里股價上揚。
路透指出,DeepSeek 以低成本加上開源策略撼動市場,導致阿里巴巴、百度、騰訊等被迫降價,並加速推出新模型; 阿里巴巴選擇在農曆新年發布Qwen 2.5-Max,顯示出 AI 市場的競爭極為激烈,甚至已經影響到企業的產品發布節奏。
我是廣告 請繼續往下閱讀
阿里雲放話稱,他們將這款Qwen 2.5-Max拿來與GPT-4o、DeepSeek-V3和Llama-3.1-405B進行對比,在多項基準測試中表現超越DeepSeek-V3。
阿里雲研發團隊強調,Qwen2.5-Max的模型在大多數基準測試中都展現出了顯著優勢,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水準,消息一出,阿里股價上揚。
路透指出,DeepSeek 以低成本加上開源策略撼動市場,導致阿里巴巴、百度、騰訊等被迫降價,並加速推出新模型; 阿里巴巴選擇在農曆新年發布Qwen 2.5-Max,顯示出 AI 市場的競爭極為激烈,甚至已經影響到企業的產品發布節奏。