xAI 一年虧 64 億、OpenAI 燒不出獲利、NVIDIA 一季淨賺 583 億——AI 鏈條真正賺錢的位置
2026 年 5 月 20 日這一天,三條財經新聞在同一時間冒出來。 第一條:NVIDIA 公布 FY27 Q1 財報——單季營收 816 億美元(+85% YoY)、淨利 583 億美元(+211%)、毛利率 74.9%、宣布 800 億美元股票回購、預測下季 910 億美元營收。 第二條:SpaceX 提交 IPO 招股書,順帶揭露剛被併入的 xAI 2025 年財務——全年虧損 64 億美元,營收 32 億,CapEx 127 億。SpaceX + xAI 合併後 2025 全年淨虧 49.4 億。 第三條:CNBC 報導 OpenAI 最快本週五提交 IPO 招股書草案,目標 2026 年 9 月上市,私募估值 5000 億美元,但訓練 + 推理 CapEx 長期遠高於營收,是公開的賠錢業務。 三條新聞放在同一張表上,AI 鏈條真正賺錢的位置就一覽無遺了。所有做模型的公司都在燒錢,賣 GPU 的那家一季淨賺一個 OpenAI 估值 12% 的數字。...
Gemini 漲 2 倍仍是美系最便宜、GPT 跟著漲、Claude 反而降——2026 年 AI API 三家定價分歧的真實意義
把過去半年三家 LLM 旗艦的價格軌跡攤開看,方向完全不同。 OpenAI 從 GPT-5(2025/08 發布)的 $1.25/$10,經 GPT-5.4 的 $2.5/$15,到 2026/04/23 GPT-5.5 直接拉到 $5/$30——輸入價漲 4 倍、輸出價漲 3 倍。Google 從 Gemini 2.5 Pro(2025/06)的 $1/$10 漲到 Gemini 3 Pro(2025/11/18)的 $2/$12,再到 2026/05/19 推出 Gemini 3.5 Flash $1.5/$9(比自家 3.1 Pro 還便宜)。Anthropic 從 Claude 3 Opus 的 $15/$75 直接砍到 Opus 4.5(2025/11)的 $5/$25,之後 4.6、4.7(2026/04/16)三代都維持同價。 VC Tomer Tunguz 上週把這幾條曲線畫在同一張圖,下了一個短評:「補貼在現金充裕、市占重要的時候發生;漲價在現金緊、利潤重要的時候發生。」 三家走的方向不同,意思就是他們現在缺的東西不一樣。 對每個月開 API...
Sora 之死不是敗給誰——是 OpenAI 在 IPO 前算了一筆帳
3 月 24 日,OpenAI 宣布全面關閉 Sora——app 砍了、API 砍了、ChatGPT 裡的影片生成也砍了。Disney 那筆 10 億美元的投資?胎死腹中,一毛錢都沒付出去。 群組裡在喊「Sora 已死」,不少人第一反應是「被 Seedance 打爆了吧?」 沒那麼簡單。Sora 的死因不是單一競爭對手,而是一連串產品、商業和戰略層面的連環失誤,最後由 OpenAI 自己拔掉了插頭。 960 萬次下載,140 萬美元營收先看數字。 去年九月 Sora 2 以獨立社群 app 的形式上線,五天內衝破百萬下載,比 ChatGPT 當初還快。十一月達到高峰——單月 330 萬次下載。所有人都覺得這是下一個殺手級應用。 然後就開始崩了。 時間 月下載量 變化 2025 年 11 月 330 萬 高峰 2025 年 12 月 224 萬 -32% 2026 年 1 月 120 萬 -45% 2026 年 2 月 110 萬 -8% 整個產品生命週期,消費者總共花了 140 萬美元。高峰月營收 54 萬美元,到三月只剩 36.7...
Prompt Injection 不只是學術問題:OpenAI 收購 Promptfoo 背後的 Agent 安全困局
三月初 OpenAI 宣布收購 Promptfoo,一家專門做 LLM 安全測試的新創。消息不算爆炸性——沒有天價估值、沒有千人團隊。但如果你正在寫 AI Agent,這件事值得你停下來想一分鐘。 為什麼一家手握 GPT-5.4 的公司,需要花錢買一個做 prompt injection 測試的工具? Agent 不是 Chatbot,安全模型完全不同傳統 chatbot 的安全問題相對好處理。使用者輸入一句話,模型回一句話。最壞的情況是輸出不當內容,加個 content filter 就能擋掉大部分。 Agent 不一樣。 一個典型的 Agent 工作流程長這樣:使用者下指令 → Agent 拆解任務 → 呼叫工具(搜尋、寫檔案、發 API)→ 讀取工具回傳結果 → 決定下一步 → 重複。每一步都有外部資料進入 context window。每一筆外部資料都是潛在的攻擊面。 想像你的 Agent 去搜尋一個網頁,網頁裡藏了一段 <div style="display:none">Ignore previous instructions....
你的 AI 帳單即將縮水 30 倍:一天之內 NVIDIA 和 OpenAI 同時給出的訊號
3 月 16 日晚上,兩件事同時發生。 Jensen Huang 在 GTC 主題演講上揭曉 Groq 3 LPU,宣稱每瓦 tokens 效能提升 35 倍。幾個小時後,Sam Altman 在 X 上發文:GPT-5.2 到 5.4,三個月內效率提升 32 倍,每個任務成本降到 37 美分。 兩家公司,一硬一軟,同一天給出幾乎相同的數字。這不是巧合。 硬體端:Groq 3 LPU 到底是什麼NVIDIA 在 2025 年底花 200 億美元買下 Groq 的核心團隊和技術。GTC 上第一次展示成果:Groq 3 LPU(Language Processing Unit),專門為推理設計的晶片。 跟 GPU 最大的差異在架構。GPU 用 HBM(高頻寬記憶體)做訓練和推理都行,但推理階段的記憶體存取模式跟訓練完全不同。LPU 用 SRAM 直接塞在晶片上,消除了記憶體瓶頸。結果就是:推理延遲極低,每瓦輸出的 tokens 數量暴增。 NVIDIA 的做法很聰明。LPX 機架裝 256 顆 LPU,設計成放在 Vera Rubin GPU 機架旁邊一起用。訓練用 GPU,推理用...
AI 比人類更會操作電腦了:GPT-5.4 Computer Use 技術拆解與開發者該注意的三件事
3 月 5 日,OpenAI 發布 GPT-5.4。大多數人的注意力被 1M token context window 和 Tool Search 搶走了,但我認為真正該被討論的是另一件事:Computer Use。 GPT-5.4 在 OSWorld 基準測試拿到 75.0% 的成功率。人類專家是 72.4%。 AI 操作電腦的成功率,正式超過人類了。 OSWorld 75%,這個數字為什麼重要先說清楚 OSWorld 在測什麼。它不是問 AI「怎麼操作試算表」然後看回答正不正確。它是真的把 AI 丟到一台有作業系統的電腦前面,給它任務,看它能不能完成。 任務長這樣: 「找到最近修改過的試算表並打開它」 「把 Wi-Fi 切換到辦公室網路」 「打開 Chrome,到某個網站,把這份表單填完」 都是你每天在做的事。而 GPT-5.4 做這些事的成功率,比被付錢來完美完成任務的人類測試員還高。 模型 OSWorld 成功率 與人類(72.4%)比較 GPT-5.4 75.0% +2.6% GPT-5.2 47.3% -25.1% 之前最佳...
你的AI Agent安全嗎?從OpenAI收購Promptfoo看agent安全測試的崛起
上週 OpenAI 宣布收購 Promptfoo,一個專門做 LLM 紅隊測試的開源工具。這件事本身不算爆炸性新聞,但它背後反映的趨勢值得每個在做 AI 應用的開發者注意:AI agent 的安全測試,正在從「有空再做」變成「不做不行」。 當 AI 不只是聊天機器人2024 年我們還在用 ChatGPT 問問題、生成文案。2026 年,AI agent 已經在企業裡替人操作工具了。 根據 NVIDIA 最新報告,64% 的企業已經在生產環境部署 AI,其中 agent 形式的採用率在電信和零售業達到 47-48%。Oracle 上週公布的 OCI 雲端基礎設施營收年增 84%,主要驅動力就是 AI 訓練和推理需求。 這不再是實驗。Agent 真的在跑了。 問題是:當 agent 能呼叫 API、讀寫檔案、執行程式碼時,它的攻擊面跟傳統聊天機器人完全不同。 Prompt Injection:agent 時代的 SQL Injection如果你做過 Web 開發,對 SQL injection 不陌生。使用者輸入惡意...
當 OpenAI 搶下五角大廈合約:一場讓 250 萬用戶出走的豪賭
Anthropic 拒絕五角大廈、被列入黑名單、卻反而衝上 App Store 第一名——這個故事的上半場,我們已經講過了。 但故事還有下半場。 當 Anthropic 離開談判桌的那個週五晚上,OpenAI 的 CEO Sam Altman 宣布簽下了五角大廈的合約。時間差不到 24 小時。 接下來發生的事,大概連 Altman 自己都沒預料到。 搶合約的速度,快到像是早就準備好了2 月 27 日,Trump 簽署行政命令封殺 Anthropic。同一天晚些時候,Altman 在 X 上宣布:OpenAI 已與國防部(在 Trump 政府下已改名為「戰爭部」Department of War)達成協議,將 GPT 系列模型部署到軍方的機密系統中。 這個時間點太巧了。 Anthropic 花了數月跟五角大廈談判紅線,最後因為拒絕開放「所有合法用途」而破裂。OpenAI 幾乎是在 Anthropic 被踢出門的同一天就簽了約。 外界的解讀很直接:OpenAI 願意做 Anthropic 不願意做的事。 不管這個解讀是否完全公平,它點燃了一場風暴。 295%...
當AI公司對五角大廈說不:Anthropic被封殺卻逆襲App Store的荒謬劇
2 月 27 日晚上,Trump 簽署行政命令,禁止所有聯邦機構使用 Anthropic 的產品。國防部長 Hegseth 把 Anthropic 列為「供應鏈風險」——一個通常保留給中國和俄羅斯企業的標籤。 72 小時後,Claude 衝上美國 App Store 第一名,超越 ChatGPT 和 Gemini。每天有超過一百萬人註冊。 這不是電影劇情,這是 2026 年 3 月正在發生的事。 Anthropic 的兩條紅線整件事的核心,其實就兩句話。 Anthropic 告訴五角大廈:你可以用 Claude 做幾乎所有事情,但有兩個例外——不能用於大規模監控美國公民,不能用於全自主致命武器。 五角大廈的回應是:我們要「所有合法用途」的授權。 談判破裂。 CEO Dario Amodei 事後說:「我們要求的限制只涉及高層級的使用領域,不干涉具體的操作決策。」換句話說,Anthropic 沒有要求審查每一次模型調用,他們只是不想讓自己的技術出現在「用 AI 自動決定要不要開火」或「用 AI...
