把過去半年三家 LLM 旗艦的價格軌跡攤開看,方向完全不同。

OpenAI 從 GPT-5(2025/08 發布)的 $1.25/$10,經 GPT-5.4 的 $2.5/$15,到 2026/04/23 GPT-5.5 直接拉到 $5/$30——輸入價漲 4 倍、輸出價漲 3 倍。Google 從 Gemini 2.5 Pro(2025/06)的 $1/$10 漲到 Gemini 3 Pro(2025/11/18)的 $2/$12,再到 2026/05/19 推出 Gemini 3.5 Flash $1.5/$9(比自家 3.1 Pro 還便宜)。Anthropic 從 Claude 3 Opus 的 $15/$75 直接砍到 Opus 4.5(2025/11)的 $5/$25,之後 4.6、4.7(2026/04/16)三代都維持同價。

VC Tomer Tunguz 上週把這幾條曲線畫在同一張圖,下了一個短評:「補貼在現金充裕、市占重要的時候發生;漲價在現金緊、利潤重要的時候發生。」 三家走的方向不同,意思就是他們現在缺的東西不一樣。

對每個月開 API 帳單的人來說,這不只是財經故事——直接影響「下個月該選哪個模型寫程式」「Claude Code 用到月底要多少錢」這類實際決策。

三家旗艦定價歷史攤開

先把數字釘在桌上:

模型 發佈日期 輸入 ($/1M) 輸出 ($/1M) 對比上一代
Claude 3 Opus 2024 初 $15 $75
Claude Opus 4.5 2025/11/24 $5 $25 −67%
Claude Opus 4.7 2026/04/16 $5 $25 持平
GPT-5 2025/08/07 $1.25 $10
GPT-5.4 2026/03/05 $2.50 $15 +100%
GPT-5.5 2026/04/23 $5 $30 +100%
Gemini 2.5 Pro 2025/06/17 $1.00 $10
Gemini 3 Pro 2025/11/18 $2.00 $12 +100% / +20%
Gemini 3.5 Flash 2026/05/19 $1.50 $9 比 3.1 Pro 還便宜 25%

幾個第一眼就能看到的事:

  • Anthropic 從 Opus 4.5 到 4.7 三代都沒動價——$5/$25 維持半年
  • OpenAI 旗艦 8 個多月內輸入漲 4 倍、輸出漲 3 倍(GPT-5 → GPT-5.5)
  • Google 旗艦 Gemini 3 Pro 和 3.1 Pro 也維持同價 $2/$12 沒動——不只 Anthropic 有「換代不漲價」的紀錄
  • Google 用 Flash 系列繼續殺價——3.5 Flash $1.5/$9 已經比自家 3.1 Pro 還便宜
  • 若把中國模型算進來,Gemini 不是「市場最便宜」——DeepSeek R1 $0.55/$2.19、V3 $0.14/$0.28 都更低;Gemini 3 Pro 是「美系三家最便宜」更精確

Tunguz 角度是「補貼結束」,更精確的描述是「三家現在缺的東西不一樣,所以走的方向不一樣」。

Google:守住「美系最便宜」+ Flash 持續殺價

Google 在三家美系廠中是價格最低的——而且還拿出 3.5 Flash $1.5/$9 反向打自家 Pro 線。Google 自有 TPU、Workspace(Docs/Gmail/Sheets)、Android、YouTube、Search 這套巨型 distribution,模型只要不離開「夠用」水準,搭上 Google 既有應用就能拿到 OpenAI 跟 Anthropic 拿不到的觸及面。低價是讓開發者社群繼續把 Gemini 當 default 選項的潤滑劑。

要注意一個常被忽略的細節:Gemini 3 Pro 的 $2/$12 只適用於 200k token 以內的 context;超過 200k 跳到 $4/$18,輸入翻倍、輸出多 50%。如果你在做需要餵長 doc 的 RAG / agent workflow,實際帳單會比表定貴一截。

對讀者實用建議:如果你只需要「夠用」的模型,在美系三家 Pro 級旗艦裡,沒有比 Gemini 3 Pro 更划算的選項——前提是 context 控制在 200k 內。要做高難度 coding、agent reasoning、長對話一致性,我自己在寫 Claude Code 替代腳本時拿 Gemini 跑過幾次 5-10 輪 tool call 的測試,多輪之後 Gemini 會開始忘記早期 context,差別不在小數點。

OpenAI:補貼期結束,開始把錢拿回來

GPT-5 在 2025 年 8 月發佈時的 $1.25/$10 是非常激進的價格。當時 Anthropic Claude 3 Opus 還在 $15/$75(Opus 4.5 同年 11 月才出來降到 $5/$25)——GPT-5 的輸入價格只到 Claude 3 Opus 的 1/12,輸出價也只到 1/7.5。這就是 Tunguz 講的「補貼期」。

8 個多月後,GPT-5.5 直接漲到 $5/$30,幾乎跟 Claude Opus 4.7 同價、輸出甚至更貴。OpenAI 的官方說法是「新一代推理能力」「agentic workflow 優化」——這套話術放在「8 個月把輸入價拉 4 倍、輸出價拉 3 倍」的事實旁邊,需要更多解釋。能拼湊的背景:

  1. OpenAI 估值已超過 5000 億美元,但訓練 + 推理算力支出長期遠高於營收(業界共識,OpenAI 沒揭露具體財務細節)
  2. 軟銀對 OpenAI 的投資承諾已超 600 億美元(公開新聞)
  3. CapEx 持續創高——Stargate 那個 5000 億美元的算力計畫已宣布,錢得從某處進來

API 漲價是這個壓力下最直接的收入修正手段之一。GPT-5 那批早期 adopter 大致已經被「套住」——production 程式碼、CI/CD pipeline、prompt template 都已經針對 GPT-5 API 調好,遷移成本高到大部分人會選擇付這個漲價。

GPT-5.5 那個 $5/$30 已經不便宜,加上 Pro 版的 $30/$180、Codex 版 GPT-5.3-Codex $1.75/$14——OpenAI 把產品線拆得很碎,意圖明顯是讓你用更貴的「Pro」版做高難度任務、用便宜的「Codex」版做日常 coding。如果你能精準分流,平均單價其實不會像表面那麼可怕。另外 GPT-5.5 在 input >272K token 後會進 long-context pricing tier 加收費用——和 Google 200k 加價類似,餵長 codebase 或長文件前要先試算。

Anthropic:換代不漲價的方向

Anthropic 是這次最有趣的角色。Claude Opus 從 3 代的 $15/$75 → 4.5 的 $5/$25 大幅降價,之後 4.6、4.7 連續兩代都維持同價。「同代或更強的下一代不漲價」這個方向,目前美系三家裡只有 Anthropic 和 Google Pro 線在走。

我看到幾個能拼湊的解釋:

模型架構效率。Anthropic 從 Claude 3.5 開始就比較注重 inference 效率。具體有沒有比 GPT 同代低我手上沒有獨立第三方數據,但從 Anthropic 一年多來持續把降價當主軸而 OpenAI 走相反方向看,至少 Anthropic 內部對自家成本結構有一定信心。

企業客戶基礎相對穩定。Anthropic 2025 年的 ARR 業界估計達數十億美元規模(具體數字 Anthropic 未公開),主要來自 Claude Code、Claude.ai Teams 訂閱、和 enterprise API。這些是相對 sticky 的訂閱式收入,現金流可預測性比 OpenAI 那種「消費者 ChatGPT 訂閱+一次性 API」混合結構好。

算力供應端的合作。Anthropic 持續跟 AWS、Google Cloud 簽訂大規模算力合約,2026 年也跟 SpaceX 在合作軌道資料中心方向上有公開消息。算力來源多元化有助於壓低長期成本。

實用層面:如果你用 Claude Code 寫程式,下個月成本會跟這個月一樣——這種可預測性對需要報 budget 的人很有用。但這個策略能撐多久要繼續觀察:如果 OpenAI 繼續漲、Google Pro 線哪天也突破現在的「換代不漲」規律,Anthropic 必然會面對「為什麼我們不跟進」的內部討論。

中國模型作為對照

把鏡頭拉開到中國模型,會看到「便宜」這件事被推到完全不同的尺度。DeepSeek 是最具代表性的對照組(以下都是 DeepSeek 官方直連 API 的定價,走 OpenRouter / SiliconFlow 中轉會多一層加價):

  • DeepSeek R1(reasoning):$0.55/$2.19,context cache hit 還能壓到 $0.14/M——輸入價格約等於 Gemini 3.5 Flash 的 1/3,是美系三家裡最便宜款的 1/3 ~ 1/4
  • DeepSeek V3(通用):$0.14/$0.28——這個價格已經接近「免費級」

中國模型對非敏感任務在價格上完全是另一個量級,但有兩個實務問題:

  1. 網路存取與合規:在台灣 / 日本 / 韓國直連 DeepSeek API 偶爾會不穩定,需要走 OpenRouter 或 SiliconFlow 中轉,又多一層加價。如果是 enterprise 場景,data residency、合規審查也是另一個議題
  2. 長 agent workflow 退化:DeepSeek 在多輪 tool call 中的一致性,我自己實測過幾次都比 Claude 同代有明顯差距,超過 5-6 輪之後 context 跟蹤會開始錯亂

純 chat、單輪 RAG、簡單 summary——DeepSeek 完全夠用且便宜到不可思議。長對話、agentic coding、複雜工具鏈——還是會回到 Claude / GPT 兩家。

標價不等於實際帳單

寫到這裡得補一段,因為單看「$x/$y」這種旗艦標價,會錯估真實月成本。三家都有一些影響實際帳單的細項:

Anthropic prompt caching:Claude API 支援 prompt caching,重複的長 system prompt 或 context 在 cache hit 時輸入價降到原價的 1/10。Claude Code 本身就大量使用這個機制——這也是為什麼 Claude Code Pro 訂閱「看起來不可能成立」的價格背後,cache 是關鍵。

OpenAI batch API:非即時任務(離線分類、批次標註、夜間 summary)走 batch API 半價——GPT-5.5 $5/$30 變成 $2.5/$15,加上 prompt caching 還能再壓。即時任務承受完整漲幅,離線任務可以用 batch 抵掉一部分——如果你的 workload 有相當比例是 ETL/批次,整體月成本沒像旗艦標價漲那麼多。

長 context 加價(Google + OpenAI 兩家都有):Gemini 3 Pro 超過 200k token 後跳 $4/$18(輸入 +100%、輸出 +50%);GPT-5.5 超過 272K input token 也進 long-context tier。長 doc RAG / 整個 codebase 餵 prompt 的場景,兩家都得先試算實際帳單。

OpenAI 把產品線切碎:GPT-5.5 $5/$30 是「旗艦」,但你不見得需要旗艦。GPT-5.3-Codex 在 coding 場景定價只到 $1.75/$14,輸入比 GPT-5.5 便宜 65%、輸出便宜 53%。如果你的 production workflow 是 coding 為主,分流到 Codex 變體比死守旗艦 GPT-5.5 划算很多。

DeepSeek cache hit $0.14:DeepSeek 在 cache hit 時輸入價 $0.14/M 已經接近「免費」——如果你的 prompt 結構穩定(system prompt + retrieval result + user question 這種固定 layout),cache hit 率很高,整體成本比標價還低一檔。

實務上:選 API 的時候先把 batch、cache、context 長度、產品線變體都算進去,再對比月成本。光看旗艦標價會做出錯的決策。

對開發者的實際建議

我自己用 Claude Code 寫程式快兩年,過去半年又把 GPT、Gemini 平行測過——以下是這次定價變動之後我的選擇邏輯:

  • 寫 production 程式碼、複雜 agent workflow:Claude Opus 4.7($5/$25)。價格穩定、長對話一致性好、tool use 失誤率最低。
  • 純 coding workflow(IDE 整合、PR review、CI 寫腳本):GPT-5.3-Codex($1.75/$14)。同樣 OpenAI 生態,但價格只到 GPT-5.5 旗艦的 1/3,coding 場景特化。
  • 大量低難度查詢(RAG、summary、簡單分類):Gemini 3.5 Flash($1.5/$9)。便宜到不需要思考,品質夠用——只要 context 不超過 200k。
  • 離線批次任務(標註、夜間 summary、ETL):OpenAI batch API 半價,加上 prompt caching 之後比即時呼叫便宜 70% 以上。
  • 個人實驗、隱私不敏感的玩票:DeepSeek R1。$0.55/$2.19 的價格根本是免費級,學習用很夠。

老實說我以前覺得 GPT-5 那波低價很危險——「補貼來的便宜,遲早要還」這句話現在驗證了。下次有廠商跳出來說「我們的旗艦只賣競爭對手 1/10」,記得這只是時間延遲的漲價通知。

不過 Anthropic 那邊讓我重新評估了一個假設:不是所有低價都是補貼,有些是真的成本優勢。如果 Anthropic 接下來兩季維持 $5/$25 不動、同時 Opus 5 還是這個價,那就證明它真的把 inference 成本壓下來了——這代表 OpenAI 和 Google 的漲價空間還會更小,因為 Anthropic 隨時可以再降一次價打回去。

下個月的 API 帳單會告訴我答案。