一張 $500 的顯卡跑贏 Claude Sonnet?ATLAS 專案的 benchmark 數字背後
「$500 GPU outperforms Claude Sonnet on coding benchmarks」——這個標題在 Hacker News 上拿了 370 分,208 則討論。一個叫 ATLAS 的開源專案,用一張 RTX 5060 Ti 16GB 跑 Qwen3-14B 量化模型,在 LiveCodeBench 上拿到 74.6%,超過 Claude 4.5 Sonnet 的 71.4%。 聽起來像是本地派的勝利號角。但數字不說謊,數字只是不說完整的故事。 ATLAS 做了什麼ATLAS 全名是 Adaptive Test-time Learning and Autonomous Specialization。核心思路:不微調模型,不呼叫 API,而是在推理時用「智慧基礎設施」包裝一個凍結的小模型,讓它表現得像大模型。 具體來說,它有三個階段: Phase 1:生成。 用 PlanSearch 從題目中提取約束條件,生成多樣化的解題計畫,然後控制 thinking token 的 budget,產出 k=3 個候選答案。 Phase 2:篩選。 用...
Anthropic 拒絕讓 AI 做武器,被美國政府列入黑名單:技術紅線背後的架構抉擇
3 月 9 日,Anthropic 同時在加州北區聯邦法院和華盛頓特區上訴法院提起訴訟,控告美國國防部違法將其列為「供應鏈風險」。原因很單純:CEO Dario Amodei 拒絕讓 Claude 被用於大規模監控美國公民,也拒絕讓它操控自主武器。 這不是一般的商業糾紛。這是一家估值數百億美元的 AI 公司,因為堅持技術紅線而被自己國家的軍方封殺。 兩條紅線Anthropic 和五角大廈的談判卡在兩個條款上: 禁止大規模監控:Claude 不能被用來對美國公民進行未經授權的大規模數據蒐集和分析 禁止自主武器:Claude 不能作為完全自主殺傷性武器的決策核心 Amodei 的立場很明確——這兩條不談。五角大廈的回應也很明確——那你就別做政府生意了。 2 月底,國防部正式將 Anthropic 列入「供應鏈風險」名單。這個標籤的殺傷力不只是失去國防合約,而是所有聯邦政府承包商在六個月內都必須停止使用 Claude。根據 Anthropic 的法庭文件,超過 100...
當你的AI供應商被政府列為國安威脅:Anthropic起訴五角大廈事件的三個技術啟示
3 月 9 號,Anthropic 做了一件 AI 產業前所未見的事:同時起訴美國政府、發布新產品、簽下微軟合作。三件事同一天。 這不是科技八卦。如果你在用 Claude API 寫程式、用 Claude Code 做開發,這件事直接影響你的技術棧穩定性。 發生了什麼事五角大廈要求 Anthropic 開放 Claude 用於「所有合法用途」。Anthropic 設了兩條紅線:不做完全自主武器,不做大規模國內監控。談判在 2 月 27 日破裂。 Trump 政府的回應很硬:下令所有聯邦機構停用 Anthropic 技術。國防部長 Hegseth 把 Anthropic 標記為「供應鏈風險」——這個標籤歷史上只用在華為、卡巴斯基這類外國實體身上。 Anthropic CFO 說這可能砍掉 2026 年數十億美元營收。 公司在加州聯邦地院和 DC 巡迴上訴法院同時開戰。 啟示一:你的 AI 供應商風險模型該更新了大部分技術團隊評估 AI 供應商,看的是模型能力、API 穩定性、定價。政治風險?不在 checklist...
AI抓漏洞比人快?Claude兩週內在Firefox挖出22個安全漏洞的技術內幕
上週 Anthropic 和 Mozilla 聯合發了一篇公告:Claude Opus 4.6 在兩週內掃描了 Firefox 將近 6,000 個 C++ 檔案,提交 112 份報告,其中 22 個被確認為真實漏洞,14 個是高嚴重性。 這個數字什麼概念?2025 一整年 Firefox 修補的高嚴重性漏洞,大約是這次兩週產出的五倍。換句話說,Claude 兩週的產量接近 2025 全年的兩成。 我花了一些時間讀完 Anthropic 的技術報告和 Mozilla 的回應,想整理出幾個工程師會在意的重點。 它是怎麼掃的?Anthropic 的團隊沒有直接丟整個 codebase 給 Claude 然後說「幫我找 bug」。他們分了兩個階段: 第一階段:驗證能力。 先拿 Firefox 舊版本中已知的 CVE,讓 Claude 看能不能重現。這步很關鍵——如果連已知漏洞都找不到,就沒必要往下走了。 第二階段:掃描未知漏洞。 從 JavaScript 引擎開始(這是瀏覽器最複雜、攻擊面最大的部分),逐步擴展到其他元件。兩週內掃了將近 6,000 個 C++...
當AI公司對五角大廈說不:Anthropic被封殺卻逆襲App Store的荒謬劇
2 月 27 日晚上,Trump 簽署行政命令,禁止所有聯邦機構使用 Anthropic 的產品。國防部長 Hegseth 把 Anthropic 列為「供應鏈風險」——一個通常保留給中國和俄羅斯企業的標籤。 72 小時後,Claude 衝上美國 App Store 第一名,超越 ChatGPT 和 Gemini。每天有超過一百萬人註冊。 這不是電影劇情,這是 2026 年 3 月正在發生的事。 Anthropic 的兩條紅線整件事的核心,其實就兩句話。 Anthropic 告訴五角大廈:你可以用 Claude 做幾乎所有事情,但有兩個例外——不能用於大規模監控美國公民,不能用於全自主致命武器。 五角大廈的回應是:我們要「所有合法用途」的授權。 談判破裂。 CEO Dario Amodei 事後說:「我們要求的限制只涉及高層級的使用領域,不干涉具體的操作決策。」換句話說,Anthropic 沒有要求審查每一次模型調用,他們只是不想讓自己的技術出現在「用 AI 自動決定要不要開火」或「用 AI...
三月AI模型大亂鬥:GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 到底誰贏了
3 月 5 日,OpenAI 丟出 GPT-5.4。兩週前,Google 才發了 Gemini 3.1 Pro。Anthropic 的 Claude Opus 4.6 也在持續迭代。三家模型同時站在擂台上,跑分互有勝負,開發者選擇困難症大爆發。 我花了幾天把三家的 benchmark 數據、定價和實際使用場景整理了一遍。結論先說:沒有全能冠軍,但各有各的殺手鐧。 GPT-5.4:第一個真正會用電腦的 AIOpenAI 這次最大的賣點不是跑分——是 Computer Use。 GPT-5.4 能直接操作桌面應用程式:看螢幕截圖、移動滑鼠、敲鍵盤。在 OSWorld 測試中,它拿到 75% 的成功率,超越人類的 72.4%。這不是小數字的進步,GPT-5.2 在同一個測試只有 47.3%。 另一個重點是「統合模型」架構。OpenAI 把之前分散在不同模型的能力——Codex 的寫程式、推理模型的思考鏈、Agent 的自主操作——塞進同一個模型裡。不用再煩惱「這個任務該叫哪個模型」。 硬指標 項目 GPT-5.4 跟 GPT-5.2...
100 兆 tokens 告訴你:為什麼降價 10% 也救不了你的 LLM 產品
你以為 AI 模型競爭就是打價格戰? OpenRouter 剛發布的報告分析了 100 兆 tokens 的真實使用數據,發現一個驚人事實:**降價 10%,使用量只增加 0.5-0.7%**。 更扯的是,Claude 價格最貴,卻占了編程市場 60%。 到底發生什麼事? 為什麼這份報告值得關注?這不是又一份「AI 趨勢預測」報告。 OpenRouter 是全球最大的 LLM API 聚合平台: 支援 300+ 模型 60+ 供應商(OpenAI、Anthropic、Google、DeepSeek...) 100 兆 tokens 真實使用數據(2024/11 - 2025/11) 這份報告揭露了三個開發者必須知道的反直覺發現。 發現 1:價格戰是假議題數據打臉時刻 策略 實際結果 降價 10% 使用量 ↑ 0.5-0.7% Claude(最貴) 編程市場占...
Notion MCP 使用教學:讓 Claude 直接操作你的 Notion 工作區
Notion MCP 使用教學:讓 Claude 直接操作你的 Notion 工作區你是不是經常在 Notion 和 Claude 之間來回複製貼上,覺得很麻煩?現在有了 Notion MCP(Model Context Protocol),Claude 可以直接連接你的 Notion 工作區,就像有了一個貼心的 AI 助手,能幫你建立頁面、整理資料、查詢內容,完全不用再手動操作了! 什麼是 Notion MCP?想像一下,如果 Claude 能直接「看到」你的 Notion 工作區,不僅能讀取你的筆記內容,還能幫你新增頁面、整理資料庫,甚至建立複雜的專案管理系統。這就是 Notion MCP 帶來的魔力! MCP 就像是 Claude 和 Notion 之間的橋梁,讓 AI 不再只是聊天工具,而是真正能幫你「做事」的智能助手。 設置前的準備工作在開始之前,你需要準備這些東西: Claude Desktop 應用程式(必須是桌面版) 一個 Notion 帳戶 基本的終端操作能力(不用怕,我們會一步步教你) 大約 15 分鐘的耐心 第一步:建立 Notion...
讓你的Claude如虎添翼:MCP功能實戰筆記
喚醒沉睡的潛能:Claude桌面版的隱藏神器還記得科幻電影中,AI助手能夠幫你整理檔案、搜尋資料、管理電腦嗎?這不再是科幻,而是現實。Anthropic最近悄悄為Claude桌面版添加了一項革命性功能——MCP(Model Context Protocol),讓你的AI助手終於能夠「看見」並「操作」你電腦中的檔案。 我第一次發現這功能時,簡直驚呆了:「等等,這是說Claude現在可以幫我整理桌面上的混亂檔案?」沒錯,而且還能做更多。 這篇文章將帶你一步步解鎖Claude的這項隱藏能力,讓你的AI助手真正成為你的數位管家。 MCP是什麼?為何你應該立刻開啟它MCP(Model Context...
