Prompt Injection 不只是學術問題:OpenAI 收購 Promptfoo 背後的 Agent 安全困局
三月初 OpenAI 宣布收購 Promptfoo,一家專門做 LLM 安全測試的新創。消息不算爆炸性——沒有天價估值、沒有千人團隊。但如果你正在寫 AI Agent,這件事值得你停下來想一分鐘。 為什麼一家手握 GPT-5.4 的公司,需要花錢買一個做 prompt injection 測試的工具? Agent 不是 Chatbot,安全模型完全不同傳統 chatbot 的安全問題相對好處理。使用者輸入一句話,模型回一句話。最壞的情況是輸出不當內容,加個 content filter 就能擋掉大部分。 Agent 不一樣。 一個典型的 Agent 工作流程長這樣:使用者下指令 → Agent 拆解任務 → 呼叫工具(搜尋、寫檔案、發 API)→ 讀取工具回傳結果 → 決定下一步 → 重複。每一步都有外部資料進入 context window。每一筆外部資料都是潛在的攻擊面。 想像你的 Agent 去搜尋一個網頁,網頁裡藏了一段 <div style="display:none">Ignore previous instructions....
AI Agent 不寫程式了——2026 年 Agent 生態從寫 Code 走向裝 Skill
上個月我盯 GitHub Trending 的時候,發現一個微妙的轉變:排行榜上最火的 AI 專案,不再是「更好的模型」或「更快的推理引擎」。而是一堆教 Agent 怎麼裝外掛、怎麼組合技能的框架。 OpenClaw 60 天內從 9,000 顆星飆到 250,000 顆。Obra/superpowers 緊隨其後,定位自己是「Agent 的 App Store」。ByteDance 的 DeerFlow v2 上線當天就衝上 Trending 第一。Karpathy 的 autoresearch 三天拿了 23,000 顆星。 這幾個專案各做各的,但拼在一起看,指向同一件事:Agent 的核心能力正從「寫程式碼」轉移到「組合技能」。 從「什麼都自己幹」到「會裝外掛就好」2024 年的 AI Agent 長這樣:給它一個任務,它會嘗試用程式碼從零搭出解決方案。寫 API 呼叫、處理 JSON、做錯誤處理——全部即時生成。 問題很明顯。每次執行同樣的任務,Agent...
AI 投資三年了,錢到底花到哪去了?從 Bloomberg 的靈魂拷問看開發者該知道的事
Bloomberg 今天丟出一篇標題很直白的文章:「AI 泡沫要破了嗎?」三年過去,華爾街自己都搞不定這個問題——有人說投資人低估了 AI,有人說砸進去的錢已經變成一顆定時炸彈。 我不是金融分析師,但身為一個每天跟 AI 工具打交道的開發者,我想從技術端的角度聊聊:錢到底去了哪裡,哪些地方看得到回報,哪些地方還在燒。 錢去了三個地方第一塊:算力基礎設施。 Jensen Huang 在 GTC 2026 說 Blackwell 加 Vera Rubin 的訂單量預計到 2027 年達到一兆美元。雲端合作夥伴的 GPU 總量突破 100 萬顆。這些錢是實打實花出去的——資料中心、電力、散熱、光纖。你用 Claude、GPT 或任何一個 AI 服務,背後都是這些硬體在撐。 第二塊:模型研發。 OpenAI、Anthropic、Google、xAI、DeepSeek——每家都在瘋狂燒錢訓練下一代模型。GPT-5.4 三個月內把推理效率提升 32 倍,Groq 3 LPU 的推理速度是 GPU 的 35...
Chrome DevTools MCP vs Claude in Chrome:兩種 AI 瀏覽器自動化方案,你該選哪個?
GitHub 頁面:Chrome DevTools MCP瀏覽器自動化進入 MCP 時代我在 Claude Code 裡已經用了好幾個月的 Claude in Chrome,拿它來做網頁截圖、填表單、讀取頁面內容。直到最近看到 Google 官方推出了 Chrome DevTools MCP——由 Chrome DevTools 團隊維護,整合了 Puppeteer、效能追蹤、Lighthouse 審計等功能。 這就讓我好奇了:同樣都是讓 AI 控制瀏覽器的 MCP server,兩者的定位和能力差在哪裡? Chrome DevTools MCP:它是什麼Chrome DevTools MCP 是 Google 官方維護的 MCP server,透過 Chrome DevTools Protocol(CDP)讓 AI agent 控制和檢查 Chrome 瀏覽器。它不只是「能點按鈕、填表單」這種程度,而是把 Chrome DevTools 的完整除錯能力暴露給 AI。 核心特點: 效能追蹤:錄製 Performance trace,分析載入瓶頸,整合 CrUX...
QTTabBar 預覽功能陣亡後,我用 AI 寫了一個替代品:HoverPeek
QTTabBar 的懸停預覽,大概是我用過最順手的檔案總管增強功能。滑鼠停在檔案上,圖片、影片、文字就直接浮出來,不用按任何鍵,不用切換視窗。 直到某次 Windows 更新改動了檔案總管的底層結構,QTTabBar 的預覽功能就此陣亡。軟體本身還能裝,但懸停預覽再也觸發不了了。 我找了一圈替代品——QuickLook、Seer、WinQuickLook——功能都有,但全部都要按空白鍵或其他快捷鍵才能觸發預覽。對我來說,這就像把自動門改成手動門,技術上可以用,但體驗完全不對。 我要的很簡單:滑鼠停在檔案上,預覽就出來。移開就消失。不需要按任何東西。 找不到,那就自己寫一個。 HoverPeek:滑鼠懸停就能預覽檔案HoverPeek...
你的 AI 帳單即將縮水 30 倍:一天之內 NVIDIA 和 OpenAI 同時給出的訊號
3 月 16 日晚上,兩件事同時發生。 Jensen Huang 在 GTC 主題演講上揭曉 Groq 3 LPU,宣稱每瓦 tokens 效能提升 35 倍。幾個小時後,Sam Altman 在 X 上發文:GPT-5.2 到 5.4,三個月內效率提升 32 倍,每個任務成本降到 37 美分。 兩家公司,一硬一軟,同一天給出幾乎相同的數字。這不是巧合。 硬體端:Groq 3 LPU 到底是什麼NVIDIA 在 2025 年底花 200 億美元買下 Groq 的核心團隊和技術。GTC 上第一次展示成果:Groq 3 LPU(Language Processing Unit),專門為推理設計的晶片。 跟 GPU 最大的差異在架構。GPU 用 HBM(高頻寬記憶體)做訓練和推理都行,但推理階段的記憶體存取模式跟訓練完全不同。LPU 用 SRAM 直接塞在晶片上,消除了記憶體瓶頸。結果就是:推理延遲極低,每瓦輸出的 tokens 數量暴增。 NVIDIA 的做法很聰明。LPX 機架裝 256 顆 LPU,設計成放在 Vera Rubin GPU 機架旁邊一起用。訓練用 GPU,推理用...
從 10 萬到 9700 萬下載:MCP 如何在 14 個月內變成 AI 工具連接的 USB
2024 年 11 月,Anthropic 發了一篇不起眼的公告,介紹一個叫 Model Context Protocol 的東西。SDK 月下載量大約 10 萬。 14 個月後的今天,MCP 月下載量 9,700 萬。970 倍。OpenAI、Google、Microsoft、AWS 全部原生支援。治理權捐給了 Linux Foundation 底下的 Agentic AI Foundation。 10 萬到 9,700 萬,一年多一點。我想聊聊這件事為什麼值得開發者認真看待。 問題不是技術,是膠水2024 年底的 AI 開發長這樣:你的 LLM 需要讀 GitHub issue,你寫一個 function call。需要查 Slack 訊息,再寫一個。需要讀資料庫,再來一個。每個整合都是客製化的,每換一個 LLM 供應商就要重寫一遍。 這跟 USB 出現之前的電腦周邊一模一樣。印表機用 parallel port,滑鼠用 serial port,鍵盤用 PS/2。每種設備一種接口,每種接口一個驅動程式。 MCP...
當銅線跑不動 AI:NVIDIA 花 40 億美元押注光子學,你的 GPU 叢集正在碰上物理極限
我在追蹤 NVIDIA GTC 2026 的預告資訊時,撞上一個讓我停下來想了很久的數字:2 公尺。 在 1.6 Tb/s 的傳輸速度下,銅線的訊號完整性和散熱問題,讓它連 2 公尺都撐不住。這不是理論推導,是工程實測。NVIDIA 在 3 月 2 日宣布砸 40 億美元投資 Lumentum 和 Coherent 兩家光子學公司,接著在 GTC 發表 Spectrum-X 和 Quantum-X 矽光子網路交換器。 銅線時代正在結束。如果你在管 AI 叢集,或者你的工作跟 GPU 運算基礎設施沾上邊,這件事值得花十分鐘搞懂。 問題出在哪:銅線碰上了物理牆GPU 跑得再快,資料傳不過去就是白搭。 現代 AI 訓練和推理的瓶頸早就不只在運算力。一個 NVL72 機架裡塞了 72 張 Rubin GPU,它們之間的資料交換量是天文數字。第六代 NVLink 的頻寬達到 260 TB/s,但這些資料要在 GPU 之間、機架之間、甚至跨資料中心移動。 銅線在低速時代不是問題。但當每個埠口要跑 1.6 Tb/s,物理定律就開始反咬: 訊號衰減:高頻電訊號在銅線裡跑得越遠,衰減越嚴重。2...
NVIDIA 不只賣 GPU 了:從 200 億 Groq 收購到 NemoClaw,黃仁勳怎麼蓋出 AI 全棧帝國
2026 年 3 月 16 日,NVIDIA GTC 大會在聖荷西 SAP Center 開幕。39,000 人從 190 個國家飛來,等著看黃仁勳穿皮夾克站上台講兩個小時。 但今年的 GTC 跟往年不一樣。往年你聽到的是「我們的新 GPU 比上一代快幾倍」。今年的主軸是:NVIDIA 已經不是一家 GPU 公司了。 200 億美元買下 Groq,買的不是公司2025 年底,NVIDIA 花了 200 億美元跟 Groq 簽了一份「非排他性授權協議」。說是授權,實際上 Groq 的創辦人 Jonathan Ross(Google TPU 的設計者)和 80% 的工程團隊都跑去 NVIDIA 了。Groq 名義上還在,GroqCloud 繼續營運,但核心技術和人才已經搬家。 CNBC 分析師直接說:這筆交易的結構是「維持競爭存在的假象」。 NVIDIA 買的是 Groq 的 LPU(Language Processing Unit)技術。LPU 專為推理設計,不跑訓練。它的架構跟 GPU 完全不同——沒有外部記憶體存取的瓶頸,推理延遲極低。 根據 GTC 前夕的報導,NVIDIA...
你選的程式語言,其實是 AI 替你選的:GitHub 數據揭露的便利迴圈
2025 年 8 月,TypeScript 在 GitHub 上超越 Python 和 JavaScript,成為平台上最多人使用的程式語言。一年內新增超過一百萬名貢獻者,成長幅度 66%。 這不是自然演化。這是 AI 在背後推了一把。 GitHub 的開發者倡導者 Andrea Griffiths 替這個現象取了一個名字:便利迴圈(Convenience Loop)。當 AI 讓某個技術用起來特別順手,開發者就會湧向它。湧入的開發者產出更多程式碼,這些程式碼成為 AI 的訓練資料,AI 對這個技術變得更強,吸引更多開發者。 迴圈就這樣轉起來了。而且停不下來。 TypeScript 為什麼是最大贏家一個數字就能說明問題:2025 年一項學術研究發現,LLM 產出的編譯錯誤中,94% 是型別檢查失敗。 想想這代表什麼。AI 寫的程式碼,十次編譯錯誤有九次以上是型別搞錯了。TypeScript 的型別系統就像一張安全網——你宣告了 x: string,AI 立刻知道該排除所有不適用於字串的操作。Python 的動態型別沒有這道防線,錯誤要到 runtime 才會爆開。 對 AI...
