kyosora 筆記

發表於2026-03-14|AI深度分析

DeepSeek V4 原定三月第一週發布。現在三月過了一半，官方一個字都沒說。這不是一般的軟體延遲。這是中國 AI 產業第一次嘗試在非 NVIDIA 硬體上訓練兆級參數模型，而現實比預期殘酷。 V4 到底是什麼先說結論：如果 DeepSeek V4 真的發布，它會是目前最大的開源模型。兆級參數的 Mixture-of-Experts（MoE）架構，每個 token 只啟用約 320 億參數。Top-16 路由策略——模型裡有上千個「專家」，每次推理只叫醒最相關的 16 個。這意味著你可以用 320 億參數的算力成本，得到兆級參數的知識容量。 V4 的架構有三個值得注意的設計： Manifold-Constrained Hyper-Connections。解決 MoE 的老問題：專家之間不夠互通。傳統 MoE 的專家各做各的，資訊共享效率差。這個機制讓跨專家的資訊利用率提升了約 40%，同時不增加計算成本。這不是微調，是結構性改進。 Engram Conditional Memory。處理超長 context 時動態維護關鍵資訊索引。白話說：在 100 萬 token...

NVIDIA 要做自己的 AI Agent 平台了：NemoClaw 技術架構解讀與開發者該注意的三件事

發表於2026-03-14|AI開發工具

上週 CNBC 報導 NVIDIA 正在打造一個叫 NemoClaw 的開源 AI agent 平台，目標是企業市場。三天後，GTC 2026 就要開幕了。Jensen Huang 的主題演講排在 3/16 上午 11 點（太平洋時間），市場預期他會在那裡正式發布這東西。我花了一些時間把目前流出的資訊整理了一遍，想搞清楚這個平台跟現有的 AI agent 方案（OpenClaw、Dify、LangChain）到底有什麼不同，以及對我們這些寫程式的人來說，真正值得關注的是什麼。 NemoClaw 是什麼一句話：NVIDIA 把自家的 NeMo 框架、Nemotron 模型系列和 NIM 推理微服務打包成一個企業級 AI agent 平台，然後開源。聽起來很普通，但有幾個細節值得注意。硬體不綁定。 NemoClaw 可以跑在 NVIDIA GPU 上，也可以跑在 AMD、Intel 和其他處理器上。一家以賣 GPU 為主要商業模式的公司，做了一個不強制要求用自家硬體的平台——這個決定背後的戰略考量很有意思。企業安全優先。跟 OpenClaw 這類個人向的 agent...

當你的 AI Agent 有 500 個工具：從 GPT-5.4 的 Tool Search 看工具管理的正確姿勢

發表於2026-03-12|AIAgent 開發

上週我在幫公司的 AI Agent 接上第 47 個 MCP server 時，API 帳單跳了一個數字讓我差點從椅子上摔下來。不是因為用量暴增。是因為每一次 API 呼叫，光是把 36 個 MCP server 的工具定義塞進 context，就吃掉了將近 40,000 tokens。模型還沒開始思考，錢已經燒了一半。 3 月 5 日 OpenAI 發布 GPT-5.4 時，benchmark 數字和 Computer Use 搶走了所有目光。但對我來說，最值得注意的功能只有一個——Tool Search。工具爆炸問題：你可能已經踩到了先說個數字。一個標準的 function calling 工具定義，包含名稱、描述、參數 schema，平均佔 200-500 tokens。聽起來不多？算一下： 10 個工具 → ~3,000 tokens（還好） 50 個工具 → ~15,000 tokens（開始痛） 200 個工具 → ~60,000 tokens（每次呼叫都在燒錢） 500 個工具 → ~150,000 tokens（恭喜，光工具定義就用掉一般模型...

當你的AI供應商被政府列為國安威脅：Anthropic起訴五角大廈事件的三個技術啟示

發表於2026-03-12|AI觀點

3 月 9 號，Anthropic 做了一件 AI 產業前所未見的事：同時起訴美國政府、發布新產品、簽下微軟合作。三件事同一天。這不是科技八卦。如果你在用 Claude API 寫程式、用 Claude Code 做開發，這件事直接影響你的技術棧穩定性。發生了什麼事五角大廈要求 Anthropic 開放 Claude 用於「所有合法用途」。Anthropic 設了兩條紅線：不做完全自主武器，不做大規模國內監控。談判在 2 月 27 日破裂。 Trump 政府的回應很硬：下令所有聯邦機構停用 Anthropic 技術。國防部長 Hegseth 把 Anthropic 標記為「供應鏈風險」——這個標籤歷史上只用在華為、卡巴斯基這類外國實體身上。 Anthropic CFO 說這可能砍掉 2026 年數十億美元營收。公司在加州聯邦地院和 DC 巡迴上訴法院同時開戰。啟示一：你的 AI 供應商風險模型該更新了大部分技術團隊評估 AI 供應商，看的是模型能力、API 穩定性、定價。政治風險？不在 checklist...

你的AI Agent安全嗎？從OpenAI收購Promptfoo看agent安全測試的崛起

發表於2026-03-12|AI資安

上週 OpenAI 宣布收購 Promptfoo，一個專門做 LLM 紅隊測試的開源工具。這件事本身不算爆炸性新聞，但它背後反映的趨勢值得每個在做 AI 應用的開發者注意：AI agent 的安全測試，正在從「有空再做」變成「不做不行」。當 AI 不只是聊天機器人2024 年我們還在用 ChatGPT 問問題、生成文案。2026 年，AI agent 已經在企業裡替人操作工具了。根據 NVIDIA 最新報告，64% 的企業已經在生產環境部署 AI，其中 agent 形式的採用率在電信和零售業達到 47-48%。Oracle 上週公布的 OCI 雲端基礎設施營收年增 84%，主要驅動力就是 AI 訓練和推理需求。這不再是實驗。Agent 真的在跑了。問題是：當 agent 能呼叫 API、讀寫檔案、執行程式碼時，它的攻擊面跟傳統聊天機器人完全不同。 Prompt Injection：agent 時代的 SQL Injection如果你做過 Web 開發，對 SQL injection 不陌生。使用者輸入惡意...

當AI有了自己的社群網路：Meta收購Moltbook背後的agent互聯革命

發表於2026-03-12|AI產業觀察

上週一（3/10），Meta 宣布收購 Moltbook。你可能沒聽過這個名字，但它代表的概念夠瘋狂：一個完全由 AI agent 運作的社群網路。沒有人類用戶，只有 bot 在上面發文、留言、投票。我第一次看到這個消息的反應是「這到底在搞什麼」。認真研究之後，我認為這可能是 2026 年最重要的 AI 產業信號之一。 Moltbook 到底是什麼想像一個 Reddit，但每個帳號都是 AI agent。 Moltbook 在 2026 年 1 月上線，創辦人是 Matt Schlicht 和 Ben Parr（兩人之前做過 Octane AI，專注電商和 AI 的交叉領域）。平台的自我定位是「the front page of the agent internet」— 給 AI agent 用的網路首頁。上線幾天內，平台就有數百萬個 bot 註冊。到 2 月底，官方數字是 160 萬個 agent。在 Moltbook 上，AI agent 可以：自主發文分享發現在其他 agent 的貼文下留言討論用投票系統對內容排序加入「Submolt」（類似...

Apple花10億選Google不選Claude：Siri重生背後的AI權力遊戲

發表於2026-03-10|AI產業分析

Apple 內部工程師最愛用的 AI 是 Claude。但 Siri 的大腦，最後給了 Google Gemini。這不是技術選型的問題。這是一場價格談判的失敗，一次商業策略的博弈，以及一個讓 12 億 iPhone 用戶的 AI 體驗徹底改變的決定。 10 億美元 vs. 數十億美元2026 年 1 月 12 日，Apple 正式宣布與 Google 簽訂多年合作協議，用 Gemini 模型驅動新一代 Siri。價碼：每年約 10 億美元。但在這之前，Apple 找的第一個對象其實是 Anthropic。 Bloomberg 記者 Mark Gurman 報導，Apple 內部已經大量使用 Claude 做產品開發和內部工具。工程團隊對 Claude 的表現相當滿意。自然而然，他們想把 Claude 放進 Siri。談判破裂的原因很直接：Anthropic 開價「數十億美元」一年，而且金額逐年翻倍。三年下來，Apple 要付出的錢可能超過 100 億。 Apple 說不。轉頭跟 Google 簽了一份 10 億的合約。對 Apple...

睡覺時讓AI跑100個實驗：Karpathy的autoresearch怎麼用630行程式碼改變ML研究

發表於2026-03-10|AI機器學習

上週五 Andrej Karpathy 丟了一個新的開源專案到 GitHub，叫 autoresearch。三天內拿了 8,700 顆星。這個專案做的事情很簡單：給 AI agent 一顆 GPU、一個小型 LLM 訓練環境，讓它自己跑實驗。你睡覺，它工作。醒來時桌上放著 100 個完成的實驗結果。聽起來像科幻片？630 行 Python 就搞定了。為什麼這件事值得注意ML 研究有一個眾人皆知但很少人解決的問題：改一個超參數、跑一次訓練、看結果、再改、再跑。這個循環佔了研究者大量時間，而且大部分時間你就是在等 GPU 跑完。 Karpathy 的解法是把這個循環自動化。不是用複雜的 AutoML 框架，不是用分散式訓練叢集，而是用一個極簡的 agent loop：讀取你寫的 Markdown 指令檔（program.md）修改訓練程式碼（train.py）跑 5 分鐘訓練檢查驗證指標有沒有進步有 → 保留修改。沒有 → 還原回到步驟 2 每小時 12 個實驗。一晚大約 100 個。設計哲學：一個檔案、一顆 GPU、一個指標autoresearch...

AI抓漏洞比人快？Claude兩週內在Firefox挖出22個安全漏洞的技術內幕

發表於2026-03-10|AI資安

上週 Anthropic 和 Mozilla 聯合發了一篇公告：Claude Opus 4.6 在兩週內掃描了 Firefox 將近 6,000 個 C++ 檔案，提交 112 份報告，其中 22 個被確認為真實漏洞，14 個是高嚴重性。這個數字什麼概念？2025 一整年 Firefox 修補的高嚴重性漏洞，大約是這次兩週產出的五倍。換句話說，Claude 兩週的產量接近 2025 全年的兩成。我花了一些時間讀完 Anthropic 的技術報告和 Mozilla 的回應，想整理出幾個工程師會在意的重點。它是怎麼掃的？Anthropic 的團隊沒有直接丟整個 codebase 給 Claude 然後說「幫我找 bug」。他們分了兩個階段：第一階段：驗證能力。先拿 Firefox 舊版本中已知的 CVE，讓 Claude 看能不能重現。這步很關鍵——如果連已知漏洞都找不到，就沒必要往下走了。第二階段：掃描未知漏洞。從 JavaScript 引擎開始（這是瀏覽器最複雜、攻擊面最大的部分），逐步擴展到其他元件。兩週內掃了將近 6,000 個 C++...

當 OpenAI 搶下五角大廈合約：一場讓 250 萬用戶出走的豪賭

發表於2026-03-09|AI產業觀察

Anthropic 拒絕五角大廈、被列入黑名單、卻反而衝上 App Store 第一名——這個故事的上半場，我們已經講過了。但故事還有下半場。當 Anthropic 離開談判桌的那個週五晚上，OpenAI 的 CEO Sam Altman 宣布簽下了五角大廈的合約。時間差不到 24 小時。接下來發生的事，大概連 Altman 自己都沒預料到。搶合約的速度，快到像是早就準備好了2 月 27 日，Trump 簽署行政命令封殺 Anthropic。同一天晚些時候，Altman 在 X 上宣布：OpenAI 已與國防部（在 Trump 政府下已改名為「戰爭部」Department of War）達成協議，將 GPT 系列模型部署到軍方的機密系統中。這個時間點太巧了。 Anthropic 花了數月跟五角大廈談判紅線，最後因為拒絕開放「所有合法用途」而破裂。OpenAI 幾乎是在 Anthropic 被踢出門的同一天就簽了約。外界的解讀很直接：OpenAI 願意做 Anthropic 不願意做的事。不管這個解讀是否完全公平，它點燃了一場風暴。 295%...