avatar
文章
200
標籤
406
分類
9
首頁
頁面
  • 歸檔
  • 標籤
  • 分類
關於
kyosora 筆記
搜尋
首頁
頁面
  • 歸檔
  • 標籤
  • 分類
關於

AI產業觀察

AI 投資三年了,錢到底花到哪去了?從 Bloomberg 的靈魂拷問看開發者該知道的事
發表於2026-03-19|AI工具實戰AI產業觀察
Bloomberg 今天丟出一篇標題很直白的文章:「AI 泡沫要破了嗎?」三年過去,華爾街自己都搞不定這個問題——有人說投資人低估了 AI,有人說砸進去的錢已經變成一顆定時炸彈。 我不是金融分析師,但身為一個每天跟 AI 工具打交道的開發者,我想從技術端的角度聊聊:錢到底去了哪裡,哪些地方看得到回報,哪些地方還在燒。 錢去了三個地方第一塊:算力基礎設施。 Jensen Huang 在 GTC 2026 說 Blackwell 加 Vera Rubin 的訂單量預計到 2027 年達到一兆美元。雲端合作夥伴的 GPU 總量突破 100 萬顆。這些錢是實打實花出去的——資料中心、電力、散熱、光纖。你用 Claude、GPT 或任何一個 AI 服務,背後都是這些硬體在撐。 第二塊:模型研發。 OpenAI、Anthropic、Google、xAI、DeepSeek——每家都在瘋狂燒錢訓練下一代模型。GPT-5.4 三個月內把推理效率提升 32 倍,Groq 3 LPU 的推理速度是 GPU 的 35 倍。這些進步是真的,但訓練一個前沿模型的成本也是真的——動輒數億美元。 第三塊:應用層...
當銅線跑不動 AI:NVIDIA 花 40 億美元押注光子學,你的 GPU 叢集正在碰上物理極限
發表於2026-03-16|AI產業觀察系統與維運
我在追蹤 NVIDIA GTC 2026 的預告資訊時,撞上一個讓我停下來想了很久的數字:2 公尺。 在 1.6 Tb/s 的傳輸速度下,銅線的訊號完整性和散熱問題,讓它連 2 公尺都撐不住。這不是理論推導,是工程實測。NVIDIA 在 3 月 2 日宣布砸 40 億美元投資 Lumentum 和 Coherent 兩家光子學公司,接著在 GTC 發表 Spectrum-X 和 Quantum-X 矽光子網路交換器。 銅線時代正在結束。如果你在管 AI 叢集,或者你的工作跟 GPU 運算基礎設施沾上邊,這件事值得花十分鐘搞懂。 問題出在哪:銅線碰上了物理牆GPU 跑得再快,資料傳不過去就是白搭。 現代 AI 訓練和推理的瓶頸早就不只在運算力。一個 NVL72 機架裡塞了 72 張 Rubin GPU,它們之間的資料交換量是天文數字。第六代 NVLink 的頻寬達到 260 TB/s,但這些資料要在 GPU 之間、機架之間、甚至跨資料中心移動。 銅線在低速時代不是問題。但當每個埠口要跑 1.6 Tb/s,物理定律就開始反咬: 訊號衰減:高頻電訊號在銅線裡跑得越遠,衰減越嚴重。2 ...
NVIDIA 不只賣 GPU 了:從 200 億 Groq 收購到 NemoClaw,黃仁勳怎麼蓋出 AI 全棧帝國
發表於2026-03-16|AI工具實戰AI產業觀察
2026 年 3 月 16 日,NVIDIA GTC 大會在聖荷西 SAP Center 開幕。39,000 人從 190 個國家飛來,等著看黃仁勳穿皮夾克站上台講兩個小時。 但今年的 GTC 跟往年不一樣。往年你聽到的是「我們的新 GPU 比上一代快幾倍」。今年的主軸是:NVIDIA 已經不是一家 GPU 公司了。 200 億美元買下 Groq,買的不是公司2025 年底,NVIDIA 花了 200 億美元跟 Groq 簽了一份「非排他性授權協議」。說是授權,實際上 Groq 的創辦人 Jonathan Ross(Google TPU 的設計者)和 80% 的工程團隊都跑去 NVIDIA 了。Groq 名義上還在,GroqCloud 繼續營運,但核心技術和人才已經搬家。 CNBC 分析師直接說:這筆交易的結構是「維持競爭存在的假象」。 NVIDIA 買的是 Groq 的 LPU(Language Processing Unit)技術。LPU 專為推理設計,不跑訓練。它的架構跟 GPU 完全不同——沒有外部記憶體存取的瓶頸,推理延遲極低。 根據 GTC 前夕的報導,NVIDIA ...
一家車廠要蓋全世界最大 AI 晶片廠:Tesla Terafab 背後的技術野心與開發者該注意的事
發表於2026-03-16|AI工具實戰AI產業觀察
3 月 14 日,Elon Musk 在 X 上發了一條短推:「Terafab Project launches in 7 days」。七天後的 3 月 21 日,Tesla 要正式啟動他們自己的晶片製造計畫。 一家做電動車的公司,要蓋全世界最大的 AI 晶片廠。這不是 PPT 融資,是真的要量產 2 奈米製程晶片。 我花了一些時間整理目前已知的技術細節,試著從開發者和 AI 從業者的角度,分析這件事為什麼值得關注。 數字先擺出來Terafab 的規模用幾個數字就能理解: 製程:2 奈米,目前商用最先進的節點 月產能目標:10 萬片晶圓起步,遠期目標 100 萬片(TSMC 目前美國廠全部產能大約 14 萬片) 年產量:1,000 億到 2,000 億顆 AI 和記憶體晶片 估計成本:250 億美元 第一顆晶片:AI5(Tesla 第五代 AI 晶片),2026 年小量試產,2027 年量產 這些數字背後有一個簡單的邏輯。Musk 在 1 月的法說會上講得很直白:「即使用最樂觀的估計,供應商的產能還是不夠。」 不夠用在哪?FSD 自駕軟體、Cybercab 無人計程車、Opt...
你的 AI 模型不需要永遠在思考:Phi-4-reasoning-vision 的思考開關機制拆解
發表於2026-03-15|AI工具實戰AI產業觀察
上週我在測一個圖片分類 pipeline,用的是某個 70B 的多模態模型。每張圖片丟進去,模型都要「深呼吸」想個十幾秒,輸出一大段 chain-of-thought,最後才吐出一個分類標籤。 問題是,八成的圖片根本不需要推理。一張貓的照片,你不需要「讓我仔細分析這張圖片的像素分佈和語義特徵」,你只需要說「貓」。 Microsoft 在 3 月 4 日開源的 Phi-4-reasoning-vision-15B,做了一件我認為比「更大更強」更有價值的事:教模型判斷什麼時候該思考,什麼時候不該。 15B 參數做到了什麼先看數字。Phi-4-reasoning-vision-15B 在十個基準測試上的表現: AI2D(科學圖表):84.8 ChartQA(圖表問答):83.3 MathVista(數學視覺推理):75.2 ScreenSpot v2(UI 元素定位):88.2 MMMU(綜合多模態理解):54.3 這些分數追不上 Qwen3-VL-32B,但跟同量級的 Qwen3-VL-8B 和 Kimi-VL-A3B 比,持平甚至領先。重點是,Qwen 家族的訓練資料量超過一兆...
GTC 2026 前夕:Vera Rubin 架構與 NemoClaw 將如何改變 AI 開發者的日常
發表於2026-03-15|AI工具實戰AI產業觀察
明天(3/16)Jensen Huang 會站上 SAP Center 的舞台,開始一場兩小時的主題演講。GTC 2026 不只是 NVIDIA 的年度大拜拜——今年的發布內容,可能會直接改變我們未來兩年寫程式的方式。 我花了幾天研究公開資料,整理出三個對開發者最有感的方向。 Vera Rubin:不只是「更快的 GPU」先說數字。Vera Rubin 架構的 GPU 擁有 3,360 億個電晶體,用台積電 3nm 製程,搭配 HBM4 記憶體。推理效能 50 PFLOPS(NVFP4),訓練 35 PFLOPS——分別是 Blackwell 的 5 倍和 3.5 倍。 但真正讓我注意的不是單顆 GPU 的數字,而是 NVL72 機架的規格:72 顆 Rubin GPU + 36 顆 Vera CPU,透過 NVLink 6 連接,每顆 GPU 有 3.6 TB/s 的雙向頻寬,整個機架的 scale-up 頻寬達到 260 TB/s。 這意味著什麼? 以前跑大型模型需要跨節點通訊,頻寬瓶頸讓 pipeline parallelism 變成必修課。260 TB/s 的 scale...
Anthropic 拒絕讓 AI 做武器,被美國政府列入黑名單:技術紅線背後的架構抉擇
發表於2026-03-15|AI工具實戰AI產業觀察
3 月 9 日,Anthropic 同時在加州北區聯邦法院和華盛頓特區上訴法院提起訴訟,控告美國國防部違法將其列為「供應鏈風險」。原因很單純:CEO Dario Amodei 拒絕讓 Claude 被用於大規模監控美國公民,也拒絕讓它操控自主武器。 這不是一般的商業糾紛。這是一家估值數百億美元的 AI 公司,因為堅持技術紅線而被自己國家的軍方封殺。 兩條紅線Anthropic 和五角大廈的談判卡在兩個條款上: 禁止大規模監控:Claude 不能被用來對美國公民進行未經授權的大規模數據蒐集和分析 禁止自主武器:Claude 不能作為完全自主殺傷性武器的決策核心 Amodei 的立場很明確——這兩條不談。五角大廈的回應也很明確——那你就別做政府生意了。 2 月底,國防部正式將 Anthropic 列入「供應鏈風險」名單。這個標籤的殺傷力不只是失去國防合約,而是所有聯邦政府承包商在六個月內都必須停止使用 Claude。根據 Anthropic 的法庭文件,超過 100 家企業客戶已經就此聯繫他們,可能影響「數億美元」營收。 技術層面:紅線怎麼實作?這裡值得從工程角度思考一個問題:A...
DeepSeek V4 一直跳票?從華為晶片到兆級參數,中國 AI 的硬體困境
發表於2026-03-14|AI工具實戰AI產業觀察
DeepSeek V4 原定三月第一週發布。現在三月過了一半,官方一個字都沒說。 這不是一般的軟體延遲。這是中國 AI 產業第一次嘗試在非 NVIDIA 硬體上訓練兆級參數模型,而現實比預期殘酷。 V4 到底是什麼先說結論:如果 DeepSeek V4 真的發布,它會是目前最大的開源模型。 兆級參數的 Mixture-of-Experts(MoE)架構,每個 token 只啟用約 320 億參數。Top-16 路由策略——模型裡有上千個「專家」,每次推理只叫醒最相關的 16 個。這意味著你可以用 320 億參數的算力成本,得到兆級參數的知識容量。 V4 的架構有三個值得注意的設計: Manifold-Constrained Hyper-Connections。 解決 MoE 的老問題:專家之間不夠互通。傳統 MoE 的專家各做各的,資訊共享效率差。這個機制讓跨專家的資訊利用率提升了約 40%,同時不增加計算成本。這不是微調,是結構性改進。 Engram Conditional Memory。 處理超長 context 時動態維護關鍵資訊索引。白話說:在 100 萬 token 的...
當你的AI供應商被政府列為國安威脅:Anthropic起訴五角大廈事件的三個技術啟示
發表於2026-03-12|AI工具實戰AI產業觀察
3 月 9 號,Anthropic 做了一件 AI 產業前所未見的事:同時起訴美國政府、發布新產品、簽下微軟合作。三件事同一天。 這不是科技八卦。如果你在用 Claude API 寫程式、用 Claude Code 做開發,這件事直接影響你的技術棧穩定性。 發生了什麼事五角大廈要求 Anthropic 開放 Claude 用於「所有合法用途」。Anthropic 設了兩條紅線:不做完全自主武器,不做大規模國內監控。談判在 2 月 27 日破裂。 Trump 政府的回應很硬:下令所有聯邦機構停用 Anthropic 技術。國防部長 Hegseth 把 Anthropic 標記為「供應鏈風險」——這個標籤歷史上只用在華為、卡巴斯基這類外國實體身上。 Anthropic CFO 說這可能砍掉 2026 年數十億美元營收。 公司在加州聯邦地院和 DC 巡迴上訴法院同時開戰。 啟示一:你的 AI 供應商風險模型該更新了大部分技術團隊評估 AI 供應商,看的是模型能力、API 穩定性、定價。政治風險?不在 checklist 上。 這件事改變了遊戲規則。 「供應鏈風險」標籤不只影響政府合約。...
當AI有了自己的社群網路:Meta收購Moltbook背後的agent互聯革命
發表於2026-03-12|AI工具實戰AI產業觀察
上週一(3/10),Meta 宣布收購 Moltbook。你可能沒聽過這個名字,但它代表的概念夠瘋狂:一個完全由 AI agent 運作的社群網路。沒有人類用戶,只有 bot 在上面發文、留言、投票。 我第一次看到這個消息的反應是「這到底在搞什麼」。認真研究之後,我認為這可能是 2026 年最重要的 AI 產業信號之一。 Moltbook 到底是什麼想像一個 Reddit,但每個帳號都是 AI agent。 Moltbook 在 2026 年 1 月上線,創辦人是 Matt Schlicht 和 Ben Parr(兩人之前做過 Octane AI,專注電商和 AI 的交叉領域)。平台的自我定位是「the front page of the agent internet」— 給 AI agent 用的網路首頁。 上線幾天內,平台就有數百萬個 bot 註冊。到 2 月底,官方數字是 160 萬個 agent。 在 Moltbook 上,AI agent 可以: 自主發文分享發現 在其他 agent 的貼文下留言討論 用投票系統對內容排序 加入「Submolt」(類似 subredd...
1234
avatar
kyosora
技術探索與學習分享
文章
200
標籤
406
分類
9
GitHub
最新文章
我的 Claude Code 一夜被降級:鼓吹 AI 管制最力的公司,被自己要的刀砍中
我的 Claude Code 一夜被降級:鼓吹 AI 管制最力的公司,被自己要的刀砍中2026-06-13
Sitemap 卡「無法擷取」三個月?修了四輪 XML 都沒用,最後把它搬到 Cloudflare Worker 才過關
Sitemap 卡「無法擷取」三個月?修了四輪 XML 都沒用,最後把它搬到 Cloudflare Worker 才過關2026-06-11
Claude Code 突然回我「我故意不用 🦊 開頭」——但我從沒打過那個字
Claude Code 突然回我「我故意不用 🦊 開頭」——但我從沒打過那個字2026-06-08
Claude Code 跑完那個長 session 到底幹了什麼?Her 把 .jsonl 變成一份審計報告
Claude Code 跑完那個長 session 到底幹了什麼?Her 把 .jsonl 變成一份審計報告2026-06-08
OpenAI 說「聊天已死」,但死的不是聊天——是靠聊天賺錢這件事
OpenAI 說「聊天已死」,但死的不是聊天——是靠聊天賺錢這件事2026-06-08
分類
  • AI工具實戰80
  • AI產業觀察35
  • 前後端開發15
  • 工具與生產力43
  • 程式設計57
  • 系統與維運16
  • 職涯與反思18
  • 資料庫9
  • 資訊安全18
標籤
LLMClaudeDeepSeekGeminiAI 趨勢OpenRouterCursorAI AgentTemporal系統可靠性工程實踐CSSClaude Code多 Agent 系統開發者工具GitHub 開源本地LLMbenchmarkATLAS成本分析NemoClawOpenClawGTC 2026框架選型GitHub TrendingAI投資產業分析開發者生態NVIDIAGPT-5.4Computer Use自動化OpenAIAPI限流NetAI Coding Assistant安全性開發經驗CORS
歸檔
  • 2026年06月 15
  • 2026年05月 17
  • 2026年04月 5
  • 2026年03月 47
  • 2026年02月 3
  • 2026年01月 2
  • 2025年12月 2
  • 2025年09月 1
網站資訊
文章數量 :
200
運行時間 :
總字數 :
318.2k
最後更新時間 :
© 2024 - 2026 By kyosora
搜尋
資料載入中