用 Claude Code Agent Teams 編排 BE / FE / QA 三隊友協作開發,搭配 GCP Cloud Run 全 serverless 架構, 實現「合併前多重把關 + 模組級 BU 驗收」的高品質 SDLC,加速 feature delivery 同時控管成本。
把 Claude Code 從「單一工程師助手」升級成「AI 開發團隊編制」:Team Lead 讀完 SA 文件後, 派出 BE、FE、QA 三個專業隊友協作完成 feature,並用 GCP Cloud Run 全 serverless 架構支撐 per-PR preview deployment 與 模組級 UAT 驗收。實驗階段月成本 $40-110, 正式上線 $200-500,無需自管 K8s 或機房,10 倍降低運維複雜度。
從 BU 需求到正式部署,總共 8 個階段:
Skill 生成 → 人工 Review → 文件」,BU / SA / Tech Lead 各階段把關| 維度 | GKE (Kubernetes Engine) | Cloud Run | 對 merchant-portal |
|---|---|---|---|
| 本質 | 托管 Kubernetes | Serverless 容器(Knative) | — |
| 學習曲線 | 陡(pod / deployment / service / ingress / autoscaler) | 平(gcloud run deploy 一行指令) |
Cloud Run 勝 |
| 閒置成本 | 24/7 node pool 費用最少 ~$70/月起跳 | Scale to zero = $0 | Cloud Run 勝 |
| Preview Deploy | 每 PR 開 namespace,要寫 helm / kustomize 模板 | 每 PR 一個 revision with traffic tag URL,原生支援 | Cloud Run 完勝 |
| 運維複雜度 | 需要管 node、autoscaler、cert、ingress controller | 幾乎為零(Google 全管) | Cloud Run 勝 |
| Web app 場景 | overkill | 完美對應 | Cloud Run 勝 |
| 何時才該用 GKE | long-running > 60min / service mesh / stateful / 已有 K8s 團隊 | — | merchant-portal 都不需要 |
四層環境階梯:Preview(per PR)→ Dev(常駐)→ UAT(常駐)→ Prod(常駐 + canary)
asia-east1(彰化資料中心,台灣本地延遲最低)pr-<num>---merchant-dev.run.app(traffic tag)merchant-dev.run.appdev
merchant-uat.run.appmerchant.com(Cloud LB 在前)| 類別 | 用途 | GCP 服務 | 備註 |
|---|---|---|---|
| 🏗️ 核心 | 容器運行 | Cloud Run |
4 個 service(preview/dev/uat/prod),preview 用 traffic tag |
| 🏗️ 核心 | Image registry | Artifact Registry |
取代舊版 GCR;asia-east1 私有 repo |
| 🏗️ 核心 | CI 建置 | Cloud Build |
透過 GitHub Actions 觸發;每月 120 分鐘免費 |
| 🏗️ 核心 | 資料庫 | Cloud SQL for Postgres |
3 個 instance:preview+dev 合用 / uat / prod (HA) |
| 🔐 安全 | Secret 管理 | Secret Manager |
API key / DB password / JWT secret |
| 🔐 安全 | 身份驗證 | Identity Platform (Firebase Auth) |
商戶登入;支援 OAuth / SAML / MFA |
| 🔐 安全 | WAF / DDoS | Cloud Armor |
OWASP Top 10 防護;prod only |
| 🔐 安全 | GitHub ↔ GCP 認證 | Workload Identity Federation |
無 long-lived key;GitHub OIDC 直接交換 GCP token |
| 🌐 網路 | Load Balancer | Cloud Load Balancer |
HTTPS termination + global anycast;prod only |
| 🌐 網路 | CDN | Cloud CDN |
前端 static asset 快取 |
| 🌐 網路 | DNS | Cloud DNS |
merchant.com / *.merchant.com |
| 📊 觀測 | Logging | Cloud Logging |
前 50 GiB / 月免費;自動關聯 trace |
| 📊 觀測 | Monitoring + Alerting | Cloud Monitoring |
SLO-based alerts;異常觸發 canary rollback |
| 📦 儲存 | 檔案 / build artifacts | Cloud Storage |
商戶上傳檔案、build artifact 暫存 |
$150、正式階段 $700,超出自動暫停非必要服務申請 GCP project、啟用必要 API、設定 IAM、Workload Identity Federation 連 GitHub、Budget Alert
建 2 個 Cloud SQL instance(dev 共用 / uat 獨立)、Artifact Registry repo、Secret Manager 設定
寫 GHA workflow:on PR opened → Cloud Build → push image → Cloud Run deploy with PR tag → comment URL
裝 GitHub Spec Kit + superpowers plugin、啟用 Agent Teams(v2.1.32+ + experimental flag)、建第一個 CLAUDE.md routing 規則
挑一個小 feature(如 DowntimeNotice),全程跑 BU 對話 → SA → Agent Team 實作 → PR preview → PG iterate → Code Review → Merge
累積 3-5 個 feature 後,PM 手動 dispatch deploy to UAT,BU 完成第一次模組級驗收,建立驗收 checklist 範本
建 Prod Cloud Run + Cloud SQL HA + LB + Cloud Armor,實作 canary(5%→25%→100%)+ 自動 rollback(基於 Cloud Monitoring SLO)
主管 approve 首次上 prod,整理 runbook / on-call / 故障演練文件、寫 retrospective 給未來 onboarding
Anthropic 官方標註為 experimental,已知限制:in-process 隊友沒 session resume、任務狀態可能 lag、關閉慢。
本架構拿掉 staging(用 UAT 取代 + 合併前測試完整),Prod 部署沒有最後一道環境緩衝。
Scale-to-zero 機制下,閒置後第一個請求會有 1-3 秒 cold start 延遲。
min-instances=1(保留一個 warm instance,月成本 +$10);Preview / UAT 可接受 cold start。Cloud Run 按請求量計費,異常流量(爬蟲 / DoS)可能造成意外帳單。
max-instances 設定上限。單一 region 部署,asia-east1 整體故障時服務中斷(GCP region SLA 99.99%)。
以下事項請主管確認後即可進入 Week 1 實施: