
“天下大勢,分久必合,合久必分。”
2025年的人工智能賽道,正呈現出一種強烈的分裂感。如果說前幾年是“百模大戰”的“戰國時代”,所有玩家都在同一條“Scaling Law”(規模法則)的跑道上野蠻沖鋒;那么2025年,市場則在劇烈的震蕩后,清晰地分化出了兩條截然相反、卻又彼此糾纏的敘事。
一個“向上”,一個“向下”。
“向上”的敘事由行業巨頭領銜。不久前,阿里通義Qwen3-Max在多個權威基準測試中成功“登頂”,在被視為最能反映人類綜合偏好的LMArena盲測競技場上,躋身全球前三,一度超越了GPT-5-Chat的特定版本。這是國產大模型首次在性能的“珠峰”上,與OpenAI、Anthropic等全球頂級玩家實現了真正意義上的“同框競技”。這是“規模敘事”的延續,是“大力出奇跡”的階段性勝利。
“向下”的敘事則由技術新貴驅動。幾乎在同一時間,DeepSeek發布了其最新的DeepSeek-V3.2-Exp模型,在性能與前代旗艦保持相當的前提下,API價格悍然“腰斬”,降幅超過50%。尤其在輸出端,價格從12元/百萬Tokens驟降至3元/百萬Tokens。這場價格戰的背后并非是“流血補貼”,而是一場由底層技術突破發起的“成本突破”。
這不是偶然的巧合,而是兩條路線的必然碰撞。一方在不計代價地推高智能的“天花板”,另一方在不遺余力地擊穿成本的“地板”。
這場關乎“極限性能”與“極致普惠”的博弈,正在重塑AI的商業邏輯。它所激發的矛盾,比模型參數本身更值得深思:當“規模”遭遇“效率”,當“開源”挑戰“閉源”,當“中小企業的狂歡”遭遇“頭部巨頭的利潤保衛戰”,這場戰爭的“中場”,究竟在走向何方?
“登頂”的執念:AI巨頭的“3A游戲”
對于巨頭而言,似乎都對于一路陪伴走來的“Scaling Law”抱有執念,不斷探索著規模與能力的邊界。
例如,Qwen3-Max的出現,即是對“參數競賽”有效性的強力背書。在AI領域,“規模”一度是通往更高智能的唯一信仰。Qwen3-Max正是這一信仰的產物。


根據多方分析和披露,Qwen3-Max是一個參數量達到萬億級別的“龐然大物”,而巨大的體量也著實為其帶來了相匹配的實力:在SWE-Bench Verified上獲得了69.6分的世界級成績;在考驗Agent能力的Tau2-Bench上,超越了Claude Opus 4;在AIME等高難度推理任務上,其“Thinking”變體甚至取得了驚人的滿分或接近滿分的表現。
阿里不惜投入巨量資源,將Qwen3-Max推向SOTA,其戰略意圖清晰而堅定。這本質上是一場只有巨頭才能玩得起的“3A游戲”。
正如在游戲行業,3A大作意味著高昂的開發成本、頂級的制作水準和龐大的宣發資源,大模型領域的“規模競賽”亦是如此。它是通過人力、財力、物力的極致堆砌,構建起一道后來者難以逾越的性能壁壘和算力門檻。 目的很明確:在AGI的終極敘事中,必須手握一張能與OpenAI平起平坐的“王牌”,借以鞏固自身(尤其是云業務)的優勢,最后再依靠規模化應用實現盈利。在企業客戶選擇云服務商時,一個“全球第三”的旗艦模型,其象征意義和信任背書價值千金。
然而,這場“登頂”的盛宴之下,潛藏著“參數陷阱”的冰冷現實。
第一個沖突在于“規模”與“成本”的邊際效益。萬億參數帶來了性能的提升,但也帶來了指數級增長的訓練成本和推理成本。根據阿里云官網公布的價格,Qwen3-Max(0-32K檔)的輸入價格約為8.64元/百萬Tokens,輸出價格更是高達43.2元/百萬Tokens。這種定價,注定了它只能是少數頭部企業在核心、高價值場景中才能負擔的“奢侈品”。當性能提升的邊際收益,開始難以覆蓋其高昂的推理成本時,“規模競賽”就觸碰到了商業落地的“玻璃天花板”。
第二個,則是開源策略與商業變現的矛盾。在國內AI賽道中,“開源”正在成為行業的大勢所趨,然而矛盾在于,當一個性能“足夠好”的開源模型可以免費、私有化部署時,有多少開發者還愿意為其閉源的、價格高昂的模型支付溢價?開源模型雖然“教育”了市場,卻也親手“稀釋”了其旗艦API的商業價值。
“破價”的利刃:創業公司“另辟蹊徑”的效率革命
一方面是巨頭的“3A游戲”,那么另一方面,以DeepSeek的“破價”則是資源相對薄弱的創業公司被迫選擇的“另辟蹊徑”。
財力雄厚的巨頭可以豪賭Scaling Law,但對于創業公司而言,除非擁有OpenAI那樣能撬動千億美元的戰略合作,否則在“參數陷阱”面前幾乎沒有試錯空間。 它們唯一的活路,就是通過極致的技術優化——從架構到算法再到工程——在有限的算力里“擠”出更多的能力,為自己,也為客戶“擠”出寶貴的利潤空間。
而對于DeepSeek而言,從其聲名鵲起,便是因為它的“破價”之所以在行業內引發地震,因為它不是“補貼換市場”的互聯網舊劇本,而是由硬核技術驅動的“效率革命”。

據了解,DeepSeek能夠有降價50%以上的底氣,來自于一個關鍵的技術突破:DSA(DeepSeek Sparse Attention)。
在傳統Transformer架構中,注意力機制的計算復雜度是O(n^2)(n為序列長度),即每個Token都要和上下文中的所有其他Token進行計算。在處理長文本時,這種“全局關注”會帶來災難性的算力消耗。
DeepSeek V3.2-Exp(總參數量671B,激活參數37B的MoE模型)則徹底重寫了這一規則。DSA機制通過引入“Lightning Indexer”(閃電索引器)和“fine-grained selector”(細粒度選擇器),實現了兩階段的智能篩選。它不再“蠻力”地關注所有內容,而是像一個高效的速讀者,先快速索引、評估上下文的重要性,然后只讓當前Token與那些“真正相關”的Token進行精細計算。
其結果是,在處理長文本任務時,DSA“極大減少了每層處理的Token數量”,從而“大幅削減了推理成本和處理時間”。最關鍵的一點是,根據DeepSeek的官方評測,V3.2-Exp的性能與V3.1-Terminus保持在同一水平。
這徹底改變了游戲的性質。DeepSeek證明了,通過算法和架構的極致創新,可以在不犧牲模型質量的前提下,將推理成本壓縮一半甚至更多。
這是對“規模派”的一次精準“降維打擊”。它向市場傳遞了一個清晰的信號:AI的競爭,已經從單純比拼“肌肉”(參數規模)的1.0時代,進入了比拼“神經效率”(算法與工程優化)的2.0時代。
夾縫中的“新大陸”:API價格戰與巨頭的“利潤保衛戰”
高階模型所形成的巨大價格鴻溝,正是當前AI產業核心矛盾的爆發點。在這道鴻溝的兩側,是中小企業和巨頭們截然不同的命運。
對于數以萬計的中小企業、初創公司和獨立開發者而言,以DeepSeek為代表的“技術破價”無異于開辟了一片“新大陸”。在此之前,AI應用的成本是一只“攔路虎”,如今結束技術手段,正將AI的成本屬性從“咨詢費”拉向“水電費”。當API成本降低50%甚至90%時,AI應用的“可行性”就可以完成“從0到1”。
正如行業分析師所指出的,DeepSeek的低成本創新,正在推動AI應用“從頭部企業壟斷轉向長尾場景滲透”。這符合“杰文斯悖論”(Jevons Paradox)的經典邏輯:技術效率的提升(成本降低)并不會減少總消耗,反而會因為門檻的降低而激發海量的、前所未有的新需求,最終帶來算力總需求的爆發式增長。
然而,中小企業的狂歡,映襯出的卻是頭部巨頭的焦慮。DeepSeek的“技術破價”更是將這場沖突推向了高潮。
事實上,一場殘酷的“API價格戰”早已在國內AI巨頭(如阿里、百度、騰訊、字節)之間打響。早在2024年,字節豆包的“白菜價”就已迫使阿里云(Qwen-Long降價97%)和百度(文心兩大主力模型免費)倉促應戰。巨頭們不惜大幅降低API單價,甚至將中小型模型免費,其核心目的就是“搶占AI云市場”的入口。 他們試圖用“模型補貼”換取“云客戶”,將用戶鎖定在自己的生態高墻內。
這場“價格戰”與“效率戰”的疊加,讓巨頭們陷入了經典的兩難困境。
一位不愿透露姓名的大模型頭部企業從業者在一次模擬采訪中這樣表述:“我們內部現在很分裂。一方面,你必須跟進(降價),市場份額丟了就再也回不來了,云業務的增長指望著這個。另一方面,旗艦模型(如Qwen3-Max)的推理成本是實打實的,降價就是‘割肉’。”
“我們現在的策略是分裂的:用免費的中小模型去‘跑量’,穩住開發者生態;同時用頂尖的旗艦模型去‘立標桿’,服務那些真正愿意為0.1分性能提升付費的頭部客戶。”但在靠效率的創業公司的“攪局”之下,巨頭用‘規模’砸出來的性能溢價,正在被他們迅速拉平。
這段基于行業普遍現狀的模擬表述,精準地道出了巨頭的“利潤保衛戰”有多么艱難。他們試圖用“云服務+模型”的生態綁定構建“護城河”,但在絕對的性價比面前,這種綁定的吸引力正在受到嚴峻考驗。
超越“規模”與“效率”,AI價值正被再定義
Qwen3-Max的“登頂”和DeepSeek V3.2-Exp的“破價”,看似是兩條背道而馳的路線,但它們聯手導演的這場“極限沖突”,實際上共同終結了大模型競爭的“蠻荒時代”,并提前揭示了“中場戰事”的終局走向。

首先,未來“規模派”和“效率派”必然走向融合。
“規模派”同樣意識到單純堆料的不可持續。Qwen3-Max本身采用先進的MoE(混合專家)架構,就是其主動吸收“效率”技術的明證。未來,巨頭們必須將DSA這類稀疏算法和極致的推理優化,作為其旗艦模型的“標配”,否則其“規模”將因成本過高而喪失意義。
而“效率派”也不會永遠停留在“性價比”的舒適區。它們必須利用“技術破價”換來的海量市場和數據飛輪,反哺更高性能、更大規模模型的研發。否則,它們也將在“效率”的單一維度上,陷入新一輪的“內卷”。
其次,這場沖突正在倒逼AI產業回歸商業本質:從“模型跑分”轉向“應用價值”。
當最頂尖的模型和性價比最高的模型同時擺在貨架上,客戶的選擇不再是盲目的“追高”,而是精準的“適配”。市場被清晰地劃分:少數高敏、高價值的場景去追逐頂尖模型的極限性能;而海量的、對成本敏感的“長尾應用”,則會擁抱效率模型的極致效率。
這場由“規模”和“效率”共同導演的戲劇性沖突,其真正的價值在于“擠出”了AI的泡沫。它迫使所有玩家——無論是手握萬億參數的巨頭,還是掌握效率利器的新貴——都必須回答同一個終極問題:
你所提供的智能,究竟為客戶創造了多少可衡量的價值?
在AI的中場戰事中,誰能率先回答好這個問題,誰才能定義下半場。