你以為 AI 模型競爭就是打價格戰?
OpenRouter 剛發布的報告分析了 100 兆 tokens 的真實使用數據,發現一個驚人事實:**降價 10%,使用量只增加 0.5-0.7%**。
更扯的是,Claude 價格最貴,卻占了編程市場 60%。
到底發生什麼事?
為什麼這份報告值得關注?
這不是又一份「AI 趨勢預測」報告。
OpenRouter 是全球最大的 LLM API 聚合平台:
- 支援 300+ 模型
- 60+ 供應商(OpenAI、Anthropic、Google、DeepSeek...)
- 100 兆 tokens 真實使用數據(2024/11 - 2025/11)
這份報告揭露了三個開發者必須知道的反直覺發現。
發現 1:價格戰是假議題
數據打臉時刻
| 策略 | 實際結果 |
|---|---|
| 降價 10% | 使用量 ↑ 0.5-0.7% |
| Claude(最貴) | 編程市場占 60% |
| DeepSeek(便宜) | 用戶流失後又回流 |
報告原話:
"需求缺乏價格彈性,用戶優先考慮品質和可靠性而非價格。"
為什麼會這樣?
工程師選模型的真實決策流程:
- 能不能解決問題?(品質)
- 會不會突然掛掉?(可靠性)
- 貴多少?(成本排最後)
如果你的產品靠降價搶市場,代表你已經輸了。
這就像你不會因為便宜 10 塊就選擇會當機的 IDE。工程師時間成本遠高於 API 費用,穩定性和輸出品質才是關鍵。
發現 2:玻璃鞋效應(新概念警報)
什麼是玻璃鞋效應?
報告提出全新概念:如果模型首次解決了用戶未滿足的需求,會產生極強的鎖定效應。
就像灰姑娘的玻璃鞋,一旦找到完美契合的那雙,別人再好也不換。
數據證明
| 模型 | 早期用戶(6月/5月) | 後期用戶 |
|---|---|---|
| Claude 4 Sonnet | 5 個月後留存 40% | 留存 <20% |
| Gemini 2.5 Pro | 5 個月後留存 40% | 留存 <20% |
核心洞察:
- 早期用戶形成「基礎群體」(base cohort)
- 一旦找到「完美契合」的模型,很難被搶走
- 後來者即使更好,也難撬動這群人
對開發者的啟示
如果你在做 LLM 產品:
專注解決一個痛點
別想通吃所有場景,找到你的「玻璃鞋用戶」。搶早期用戶
他們會變成鐵粉,留存率是後期用戶的 2 倍。別妄想用「更好」搶別人的用戶
玻璃鞋效應會擋住你。與其正面硬剛,不如找未被滿足的需求。
真實案例:DeepSeek 回旋效應
報告觀察到有趣現象:某些流失用戶後來返回 DeepSeek。
為什麼?
1 | 用戶心路歷程: |
這證明了:用戶不是不在乎價格,而是會在品質和成本間找平衡點。
發現 3:推理 tokens 突破 50%
遊戲規則改變了
1 | 2024/11: 推理 tokens < 30% |
這意味著什麼?
AI 使用模式正在從:
- ❌ 單次文本生成(「幫我寫一封信」)
- ✅ 多步驟推理(「分析這份合約 → 找出風險 → 提出修改建議」)
領先者
| 模型 | 主打場景 | 市場占比 |
|---|---|---|
| xAI Grok Code Fast 1 | 編程推理 | 領先 |
| Google Gemini 2.5 Pro | 多步驟任務 | 快速增長 |
| Anthropic Claude | 複雜推理 | 60% 編程市場 |
開發者該做什麼?
如果你的產品還停留在「文字接龍」階段:
1 | # ❌ 舊思維:單次生成 |
優先支援工具調用(tool calling),這是報告觀察到的明確趨勢。
代理式推理模式(agentic reasoning)正成為標準,你的架構如果不支援,就會被淘汰。
其他值得關注的數據
開源 vs 閉源:三足鼎立
| 陣營 | 市場份額 | 年度變化 |
|---|---|---|
| 閉源(OpenAI/Anthropic/Google) | ~70% | 穩定 |
| 開源(Meta LLaMA/Mistral) | ~17% | 穩定增長 |
| 中國開源(DeepSeek/Qwen) | 13% | 從 0% 暴增 |
關鍵洞察:
- 開源陣營達到 30% 市場份額
- 中國模型一年內從可忽略不計增至 13%
- DeepSeek 仍領先開源,但市場已分散化
開源模型的真實用途:
| 類別 | 閉源模型 | 開源模型 |
|---|---|---|
| 編程 | 60%+ | 30%+ |
| 角色扮演 | ~30% | 52% |
| 技術/科學 | 主導 | 快速追趕 |
驚人發現:開源模型在角色扮演類別反超閉源。
這打破了「開源只能做低階任務」的迷思。創意內容、對話生成等領域,開源已經夠用。
編程主導一切
| 類別 | 使用占比 | 平均輸入 tokens |
|---|---|---|
| 編程 | >50% | 20K+ |
| 角色扮演 | ~52%(開源) | 6K |
| 技術/科學 | ~10% | 8K |
| 翻譯/教育 | <5% | 3K |
關鍵數據:
- 編程請求平均 20K+ tokens(其他類別 3-4 倍)
- 序列長度從 2K → 5.4K+ tokens(增長近 3 倍)
- 完成 tokens 從 150 → **400+**(增長近 3 倍)
這代表什麼?
如果你的產品主打編程場景:
- 長上下文必備(32K 起跳,建議 128K)
- 輸出品質 > 速度(工程師會等,但不接受爛代碼)
- Claude 是標竿(60% 市場占有率不是假的)
對開發者的三個行動建議
1. 多模型策略(別 All-in 單一模型)
1 | // ✅ 正確做法:任務導向的模型路由 |
為什麼?
報告明確指出:
"生態系統缺乏單一主導者,開發者應維持靈活性,根據特定任務選擇最佳模型。"
實戰經驗:
- Claude:編程場景無可取代(60% 市場證明)
- Gemini:推理任務和長上下文表現好
- DeepSeek:成本效能最佳,批量任務首選
- 開源模型:創意內容、角色扮演夠用
2. 優先支援長上下文
編程工作負載真實數據:
- 平均輸入:20K+ tokens
- 平均輸出:400+ tokens(成長 3 倍)
- 序列長度:從 2K → 5.4K+ tokens
實作建議:
1 | # ❌ 舊思維:4K 上下文窗口 |
檢查清單:
- 你的模型支援多長的上下文?(<32K 會吃虧)
- 編程任務是否常遇到上下文不足?
- 是否有智能截斷策略?(別傻傻從頭砍)
3. 投資工具調用能力
報告觀察:
"工具調用請求份額穩步上升,代理式推理模式正成為標準。"
什麼是工具調用?
1 | # 傳統方式:單次生成 |
支援工具調用的模型(2025 現況):
| 模型 | 工具調用支援 | 推薦場景 |
|---|---|---|
| Claude 4 Sonnet | ✅ 優秀 | 複雜多步驟任務 |
| Gemini 2.5 Pro | ✅ 優秀 | 推理 + 工具組合 |
| GPT-4 Turbo | ✅ 良好 | 通用場景 |
| DeepSeek V3 | ✅ 良好 | 成本敏感場景 |
| Qwen 2.5 | ✅ 基礎 | 簡單工具調用 |
實作檢查清單:
- 你的模型 API 支援 function calling / tool use?
- 是否設計了清晰的工具描述?(LLM 靠這個決策)
- 錯誤處理機制?(工具調用可能失敗)
- 成本控制?(多步驟推理會增加 token 消耗)
給產品經理和創業者的警告
如果你正在做 LLM 產品,這三個數據會影響你的策略:
1. 別打價格戰
1 | 降價 10% → 使用量增長 0.5-0.7% |
這代表什麼?
假設你的 API 定價從 $0.01/1K tokens 降到 $0.009:
- 成本下降:10%
- 使用量增長:0.5-0.7%
- 淨收入下降:~9.5%
正確策略:
- ✅ 提升品質和可靠性
- ✅ 找到「玻璃鞋用戶」(未被滿足的需求)
- ✅ 針對特定場景優化
- ❌ 瘋狂降價搶市場
2. 早期用戶 = 你的護城河
玻璃鞋效應數據:
- 早期用戶 5 個月留存:40%
- 後期用戶 5 個月留存:**<20%**
策略意義:
專注 Product-Market Fit
找到第一批「這就是我要的!」的用戶,遠比廣撒網重要。優化早期體驗
第一次互動決定了用戶會不會變鐵粉。別急著擴張
深耕早期用戶群,讓他們成為佈道者。
3. 推理能力 = 未來門票
推理 tokens 占比:
1 | 2024/11: <30% |
市場正在淘汰單次生成產品。
如果你的產品還是:
- 「輸入 prompt → 輸出結果」
- 沒有多步驟推理
- 不支援工具調用
你可能活不過 2026。
總結:五個關鍵洞察
價格戰沒用
降價 10% 只增加 0.5% 使用量,品質和可靠性才是關鍵。玻璃鞋效應
早期用戶一旦找到契合模型,留存率是後期用戶 2 倍。搶早期用戶,不是搶市場份額。推理 > 生成
多步驟推理已占 50%+ tokens,單次生成模式正在被淘汰。多模型策略
沒有單一最佳模型,針對任務選擇(編程用 Claude,成本敏感用 DeepSeek,創意用開源)。長上下文必備
編程任務平均 20K+ tokens,你的產品還在用 4K 窗口就落伍了。
下一步行動
如果你是開發者
檢視模型選擇策略
是否過度依賴單一模型?考慮實作任務導向的模型路由。評估長上下文支援
你的主要場景需要多長上下文?是否有智能截斷機制?驗證工具調用能力
你的模型是否支援 function calling?是否有完整的錯誤處理?
如果你是產品經理
停止價格戰思維
把資源投入品質優化,而非無意義的降價。找到你的玻璃鞋用戶
誰是第一批說「這就是我要的!」的人?深耕他們。規劃推理能力
你的產品路線圖是否包含多步驟推理?現在開始還不晚。
如果你是創業者
重新思考競爭策略
別想正面硬剛 Claude/GPT,找未被滿足的需求(垂直場景、特定語言、區域市場)。評估技術債
你的架構是否支援多模型切換?是否支援長上下文和工具調用?關注開源趨勢
中國開源模型一年內從 0% 增至 13%,這個趨勢會繼續。
完整報告
這篇文章只涵蓋了報告的核心發現。如果你想深入了解:
OpenRouter State of AI 2025 完整報告:
https://openrouter.ai/state-of-ai
報告包含更多數據:
- 全球使用分布(亞洲增長超過 2 倍)
- 各模型詳細排名和市場份額
- 不同類別的成本分析
- 用戶留存曲線和流失模式
100 兆 tokens 的數據不會騙人。市場已經告訴你答案,就看你聽不聽。
如果這篇文章對你有幫助,歡迎分享給同樣在做 LLM 產品的朋友。
