當 Siri 終於有了大腦：Apple 與 Google 聯手打造的三層 AI 架構解析

等了快十年，Siri 終於要從「智障助理」畢業了。

Apple 在 iOS 26.4 中重新打造了 Siri，背後用的是 Google 的 Gemini 模型。這不是小改版——是整個架構砍掉重練。22 億台 Apple 裝置將在三月底收到更新，這是史上最大規模的 AI 助理部署。

身為開發者，我最關心的不是行銷話術，而是三個問題：架構怎麼設計的？隱私怎麼處理？對我們的 App 有什麼影響？

三層處理架構：該在哪算就在哪算

新 Siri 的核心設計是一個三層漸進式架構。不是所有請求都丟給雲端，而是根據任務複雜度，動態決定在哪一層處理。

第一層：裝置端處理（On-Device）

簡單任務直接在手機上跑。設鬧鐘、開 App、查天氣——這些不需要網路請求，回應速度在毫秒等級。Apple 在 A17/M 系列晶片上跑的本地模型處理這些綽綽有餘。

隱私上最安全，因為資料根本不離開裝置。

第二層：Apple Private Cloud Compute

本地模型搞不定的中等複雜度任務，送到 Apple 自己的私有雲。這層用的是 Apple 自研的模型，跑在 Apple Silicon 伺服器上。

重點是 Apple 在這層做了幾件事：

伺服器上的程式碼經過獨立安全稽核
處理完的資料不會被保留
Apple 自己也無法存取使用者的請求內容

這不是新概念——Apple 從 2024 年 WWDC 就開始講 Private Cloud Compute。但到 iOS 26.4 才真正大規模啟用。

第三層：Google Gemini

真正需要深度推理的任務才會到這層。多步驟規劃（「幫我規劃下週的東京行程，考慮天氣和預算」）、即時網路資訊整合、複雜分析——這些需要 Gemini 的完整推理能力。

Apple 在使用者和 Google 之間扮演「隱私代理人」的角色。送到 Gemini 的請求會經過匿名化處理：Google 看不到使用者的身份、裝置資訊、或原始個人資料。Apple 確保 Gemini 只拿到完成任務所需的最少資訊。

Tim Cook 在一月的聲明講得很直白：「我們不會改變隱私規則。即使與 Google 合作，底層技術仍掌握在 Apple 手中，不在 Google 手中。」

開發者該知道的事

如果你的 App 有 SiriKit 整合，iOS 26.4 帶來了一個值得注意的變化：processingTier callback。

你的 intent handler 現在會收到一個回調，告訴你使用者的請求是在哪一層被處理的。這代表什麼？

你可以根據處理層級調整 App 的行為。如果是本地處理，回應可以更即時。如果走到了 Gemini 層，你知道使用者的請求更複雜，可以提供更豐富的回應選項。

更實際的影響是 Siri 的「螢幕感知」（On-Screen Awareness）能力。新 Siri 能讀取當前畫面的內容。使用者在 Safari 看到一家餐廳，可以直接叫 Siri 訂位——不需要複製名稱或地址。收到一封機票確認信，Siri 能自動加到日曆並設定出發提醒。

對 App 開發者來說，這代表使用者與你的 App 互動的方式可能改變。過去使用者需要主動開啟你的 App、找到功能、手動操作。現在 Siri 可以從任何畫面觸發你的 App 功能，前提是你有實作對應的 intent。

如果你還沒認真看過 App Intents framework，現在該看了。

十億美元的合作：為什麼是 Google？

Apple 沒有選 OpenAI，沒有自己從頭練模型，而是選了 Google。

原因很現實。Google 的 Gemini 在多模態理解上有優勢——它能同時處理文字、圖片、程式碼、語音。Apple 需要的不只是聊天機器人能力，而是一個能理解「螢幕上有什麼」的模型。

據報導，這筆合作金額超過 10 億美元。但對 Google 來說，這筆錢買到的是 22 億台裝置的推理流量——即使匿名化處理，這些請求的分佈模式本身就有巨大的數據價值。

對 Apple 來說，這解決了一個根本問題：他們在大型語言模型的訓練上落後了。與其花三年追趕，不如用架構設計來化解差距。本地處理 + 隱私代理的設計，讓 Apple 在用別人的模型的同時，仍然控制了使用者體驗和資料流。

這個架構決策很有意思。Apple 把 AI 能力當作「水電」——需要的時候接上就好，重點是自己控制管線和閥門。

AI 助理市場的重新洗牌

放在 2026 年三月的時間點來看，AI 助理市場正在經歷劇烈重組。

根據最新數據，ChatGPT 在美國的每日活躍用戶佔比從去年八月的 57% 降到今年二月的 42%。Gemini 從 13% 翻倍到 25%。Claude 因為五角大廈事件衝上 App Store 第一名。

現在加上 Siri 的 22 億裝置部署，市場格局會再次改變。

我認為最大的影響不在「誰的模型比較強」，而在「AI 助理在哪裡」。

ChatGPT 和 Claude 需要使用者主動開啟 App 或網頁。Siri 嵌在作業系統裡，使用者只要喊一聲或長按按鈕就能觸發。Gemini 透過 Android 有類似的系統級整合。

對一般使用者來說，最方便的 AI 助理會贏。不是最聰明的，是隨手可得的。

這對我們開發者的啟示是什麼？別再把 AI 功能當作獨立的 feature 來做。把它當作介面的一部分——使用者不需要「去用 AI」，AI 應該在使用者需要的時候自然出現。

隱私 vs 能力的平衡

Apple 的三層架構是一個務實的妥協。

純粹的隱私派會說：「為什麼要把任何資料送出裝置？」純粹的能力派會說：「為什麼不全部用最強的模型？」

Apple 的答案是：看情況。

能在本地做的就在本地做。需要更多能力的，用自己可控的雲端。真正需要頂級推理的，用合作夥伴的模型，但把隱私防護做在中間。

這個「漸進式信任」的設計，我覺得會成為 AI 應用架構的參考模式。不是所有場景都需要最強的模型，也不是所有場景都能接受資料外流。根據實際需求，動態選擇處理層級——這比「全上雲」或「全在本地」都更實際。

我的觀察

iOS 26.4 的 Siri 更新不只是 Apple 的產品升級。它反映了 AI 產業正在從「誰的模型最大」轉向「怎麼把 AI 塞進使用者的日常」。

幾個值得持續關注的點：

螢幕感知的邊界在哪？ Siri 能讀取螢幕內容，這對隱私敏感的場景（例如銀行 App、醫療資訊）怎麼處理？Apple 目前的做法是讓開發者標記哪些畫面不允許 Siri 讀取。但執行面會不會出問題？

Gemini 的服務等級協議？ 當 22 億裝置同時上線，Google 端的推理延遲和可用性會不會成為瓶頸？如果 Gemini 當機，Siri 的體驗會降級到什麼程度？

競爭者的反應。 OpenAI 在手機端的佈局相對弱。微軟有 Copilot 整合到 Windows，但在行動端缺乏系統級入口。接下來半年的競爭會很精彩。

作為開發者，我建議先做兩件事：一，確認你的 App 有實作 App Intents，這是讓 Siri 理解你的 App 能做什麼的入口。二，測試螢幕感知功能和你的 App 的互動——確認敏感資訊不會被 Siri 意外讀取。

Siri 從蠢了十年到一夜之間變聰明，聽起來像是奇蹟。但看了架構設計，更像是 Apple 終於想通了一件事：不需要什麼都自己做，只要控制住介面和資料流就好。

這個思路，值得所有在做 AI 產品的人想想。