Engineering Proposal · 2026-05-15

merchant-portal AI 驅動開發架構

用 Claude Code Agent Teams 編排 BE / FE / QA 三隊友協作開發,搭配 GCP Cloud Run 全 serverless 架構, 實現「合併前多重把關 + 模組級 BU 驗收」的高品質 SDLC,加速 feature delivery 同時控管成本。

提案人Tim Huang
日期2026-05-15
版本v1.0
類別部門級實驗專案
部署平台GCP asia-east1
01

執行摘要

Executive Summary
開發效率
3 隊友協作
Team Lead 編排 BE/FE/QA 三隊友並行開發,task list 共享、隊友間直接訊息傳遞、依賴自動 unblock
品質把關
3 道閘門
合併前:CI/QA 自動 + PG 人工 iterate;合併後:BU 模組級驗收;上 Prod 前:canary 灰度 5%
基礎建設
100% Serverless
Cloud Run scale-to-zero,閒置成本趨近 0,每 PR 自動 preview deploy 零額外資源管理
月度成本
$40-500
實驗階段 $40-110/月,部門級正式上 prod 後 $200-500/月(含 HA + WAF + CDN)
TL;DR — 一段話講完

把 Claude Code 從「單一工程師助手」升級成「AI 開發團隊編制」:Team Lead 讀完 SA 文件後, 派出 BE、FE、QA 三個專業隊友協作完成 feature,並用 GCP Cloud Run 全 serverless 架構支撐 per-PR preview deployment模組級 UAT 驗收。實驗階段月成本 $40-110, 正式上線 $200-500,無需自管 K8s 或機房,10 倍降低運維複雜度。

02

SDLC 完整流程圖

8 phases · Agent Teams · Unified Review Pattern

從 BU 需求到正式部署,總共 8 個階段:

  • 節點配色:橘色=人類角色(BU / SA / PG / 團隊);紫色=AI Agent(Skill / Teammate / Team Lead)
  • Phase 1–3:統一三段式「Skill 生成 → 人工 Review → 文件」,BU / SA / Tech Lead 各階段把關
  • Phase 4–6:Claude Code Agent Teams 自動實作,BE → FE → QA 三隊友依任務依賴解 block
  • Phase 7:PR → PG Code Review → Merge;fail 分流到 Team Lead 或 SA 重做
  • Phase 8:PM 手動部署 UAT,BU 用 Phase 1 產出的測試案例做模組級驗收,通過後人工 approve 上 Prod
03

技術選型決策

GKE vs Cloud Run for merchant-portal
維度 GKE (Kubernetes Engine) Cloud Run 對 merchant-portal
本質 托管 Kubernetes Serverless 容器(Knative)
學習曲線 陡(pod / deployment / service / ingress / autoscaler) 平(gcloud run deploy 一行指令) Cloud Run 勝
閒置成本 24/7 node pool 費用最少 ~$70/月起跳 Scale to zero = $0 Cloud Run 勝
Preview Deploy 每 PR 開 namespace,要寫 helm / kustomize 模板 每 PR 一個 revision with traffic tag URL,原生支援 Cloud Run 完勝
運維複雜度 需要管 node、autoscaler、cert、ingress controller 幾乎為零(Google 全管) Cloud Run 勝
Web app 場景 overkill 完美對應 Cloud Run 勝
何時才該用 GKE long-running > 60min / service mesh / stateful / 已有 K8s 團隊 merchant-portal 都不需要
✅ 決策結論:選 Cloud Run
  • merchant-portal 是標準 web app,沒有 long-running process / stateful workload / service mesh 需求
  • Cloud Run 完美對應且運維成本趨近 0;GKE 帶來不必要的複雜度與固定成本
  • 未來若真需要 K8s(極不可能),container 化的 codebase 可無痛遷移到 GKE
04

GCP 部署架構

4 個環境 · asia-east1 · Workload Identity Federation

四層環境階梯:Preview(per PR)→ Dev(常駐)→ UAT(常駐)→ Prod(常駐 + canary)

  • DB 拓撲:Preview + Dev 共用一個 Cloud SQL instance(多 database 隔離);UAT 與 Prod 各自獨立 instance
  • Region:所有環境跑在 asia-east1(彰化資料中心,台灣本地延遲最低)
  • 認證:GitHub Actions 透過 Workload Identity Federation 認證,無 long-lived service account key
P1

Preview Environment

per PR · ephemeral · 自動建/拆
  • Cloud Run: pr-<num>---merchant-dev.run.app(traffic tag)
  • Cloud SQL: 共用 dev DB(成本最低)
  • PR opened → 自動 build + deploy → 評論貼 URL
  • PR closed → 自動 remove tag(零成本、零殘留)
自動觸發 GHA on PR
opened / sync / closed
↓ merge to dev branch
P2

Dev Environment

常駐 · 整合驗證
  • Cloud Run: merchant-dev.run.app
  • Cloud SQL: dev DB(同 Preview 共用 instance)
  • 每次 merge to dev 自動 deploy 最新版
  • 給 PG / SA 做跨 feature 整合驗證
自動觸發 on merge to dev
↓ PM 手動 dispatch
P3

UAT Environment

常駐 · BU 模組級驗收
  • Cloud Run: merchant-uat.run.app
  • Cloud SQL: 獨立 UAT instance(資料初期 mock,之後 prod mask 同步)
  • 累積多 feature 後 PM 手動觸發部署
  • BU 在此驗收整個模組(多 feature 統合)
👤 手動觸發 GHA workflow_dispatch
by PM
↓ BU 模組驗收通過 + 主管 approve
P4

Production Environment

常駐 · HA · canary 灰度
  • Cloud Run: merchant.com(Cloud LB 在前)
  • Cloud SQL: HA 配置 + 自動 backup + PITR
  • Cloud LB + Cloud CDN + Cloud Armor (WAF)
  • Canary deployment:5% → 25% → 100% traffic split
  • 異常自動 rollback(基於 Cloud Monitoring SLO)
👤 手動 approve GHA workflow_dispatch
by 主管 / PM
05

GCP 完整服務清單

14 項服務 · 全 managed
類別 用途 GCP 服務 備註
🏗️ 核心 容器運行 Cloud Run 4 個 service(preview/dev/uat/prod),preview 用 traffic tag
🏗️ 核心 Image registry Artifact Registry 取代舊版 GCR;asia-east1 私有 repo
🏗️ 核心 CI 建置 Cloud Build 透過 GitHub Actions 觸發;每月 120 分鐘免費
🏗️ 核心 資料庫 Cloud SQL for Postgres 3 個 instance:preview+dev 合用 / uat / prod (HA)
🔐 安全 Secret 管理 Secret Manager API key / DB password / JWT secret
🔐 安全 身份驗證 Identity Platform (Firebase Auth) 商戶登入;支援 OAuth / SAML / MFA
🔐 安全 WAF / DDoS Cloud Armor OWASP Top 10 防護;prod only
🔐 安全 GitHub ↔ GCP 認證 Workload Identity Federation 無 long-lived key;GitHub OIDC 直接交換 GCP token
🌐 網路 Load Balancer Cloud Load Balancer HTTPS termination + global anycast;prod only
🌐 網路 CDN Cloud CDN 前端 static asset 快取
🌐 網路 DNS Cloud DNS merchant.com / *.merchant.com
📊 觀測 Logging Cloud Logging 前 50 GiB / 月免費;自動關聯 trace
📊 觀測 Monitoring + Alerting Cloud Monitoring SLO-based alerts;異常觸發 canary rollback
📦 儲存 檔案 / build artifacts Cloud Storage 商戶上傳檔案、build artifact 暫存
06

成本估算

月度 / USD / 不含上線後流量增長
Stage 1 · 實驗階段

Preview + Dev + UAT(無 prod 流量)

Cloud Run × 3-4 service$0 - 30
Cloud SQL × 2 instance(dev / uat, db-f1-micro)$30 - 60
Artifact Registry(image storage)$2 - 5
Cloud Build(CI build time)$0 - 5
Cloud Logging(前 50 GiB 免費)$0 - 10
月度小計$40 - 110
Stage 2 · 部門級正式

+ Prod 環境 + HA + LB + WAF + CDN

Stage 1 全部$40 - 110
Prod Cloud Run(含流量計算)$50 - 200
Prod Cloud SQL(HA 配置)$80 - 200
Cloud Load Balancer$20
Cloud Armor(WAF)$5
Cloud CDN(依流量)$5 - 30
Identity Platform(依 MAU)$0 - 50
月度小計$200 - 500
💰 成本控管機制
  • Budget Alert 雙閾值:50% / 90% 觸發 email 通知
  • Quota 限額:實驗階段月預算上限 $150、正式階段 $700,超出自動暫停非必要服務
  • Cloud Run scale-to-zero:沒流量=沒費用;最壞情況整月閒置 Preview 環境費用 = $0
07

實施 Roadmap

8 個里程碑 · 預估 6-8 週
01

GCP project 開立 + 基礎設定

申請 GCP project、啟用必要 API、設定 IAM、Workload Identity Federation 連 GitHub、Budget Alert

Week 1
02

Cloud SQL 建置 + Artifact Registry

建 2 個 Cloud SQL instance(dev 共用 / uat 獨立)、Artifact Registry repo、Secret Manager 設定

Week 1
03

第一條 Cloud Run deploy workflow

寫 GHA workflow:on PR opened → Cloud Build → push image → Cloud Run deploy with PR tag → comment URL

Week 2
04

AI 開發框架部署

裝 GitHub Spec Kit + superpowers plugin、啟用 Agent Teams(v2.1.32+ + experimental flag)、建第一個 CLAUDE.md routing 規則

Week 2
05

第一個 feature 全流程跑通

挑一個小 feature(如 DowntimeNotice),全程跑 BU 對話 → SA → Agent Team 實作 → PR preview → PG iterate → Code Review → Merge

Week 3-4
06

UAT env + BU 模組驗收流程

累積 3-5 個 feature 後,PM 手動 dispatch deploy to UAT,BU 完成第一次模組級驗收,建立驗收 checklist 範本

Week 5
07

Prod 環境建置 + canary 機制

建 Prod Cloud Run + Cloud SQL HA + LB + Cloud Armor,實作 canary(5%→25%→100%)+ 自動 rollback(基於 Cloud Monitoring SLO)

Week 6-7
08

首次 Prod 部署 + 文件化

主管 approve 首次上 prod,整理 runbook / on-call / 故障演練文件、寫 retrospective 給未來 onboarding

Week 8
08

風險 & 緩解

已識別 5 項主要風險
Medium

Agent Teams 是實驗性功能

Anthropic 官方標註為 experimental,已知限制:in-process 隊友沒 session resume、任務狀態可能 lag、關閉慢。

緩解:保留 fallback 機制(隊友卡住 → fall back 到單一 Claude Code session);密切追蹤 Anthropic release notes;不在 critical path 上強依賴。
High

無 staging 環境直接上 Prod

本架構拿掉 staging(用 UAT 取代 + 合併前測試完整),Prod 部署沒有最後一道環境緩衝。

緩解:強制 canary 灰度(5% → 25% → 100%)+ Cloud Monitoring SLO 觸發自動 rollback;BU UAT 必須過才能上 prod;主管 approve 機制。
Low

Cloud Run cold start

Scale-to-zero 機制下,閒置後第一個請求會有 1-3 秒 cold start 延遲。

緩解:Prod 設定 min-instances=1(保留一個 warm instance,月成本 +$10);Preview / UAT 可接受 cold start。
Medium

成本失控

Cloud Run 按請求量計費,異常流量(爬蟲 / DoS)可能造成意外帳單。

緩解:Budget Alert 雙閾值(50% / 90%)+ Quota 硬上限;Cloud Armor 過濾異常流量;Cloud Run max-instances 設定上限。
Low

asia-east1 區域故障

單一 region 部署,asia-east1 整體故障時服務中斷(GCP region SLA 99.99%)。

緩解:初期接受單 region 風險(成本/複雜度考量);未來流量大時可加 asia-east2(香港)做 active-passive failover。
09

待主管 Approve 項目

Decision Required

📋 拍板事項

以下事項請主管確認後即可進入 Week 1 實施:

預算
月度上限 $700(含 Stage 1 + Stage 2)
時程
6-8 週完成 8 個 milestone
GCP 平台
Cloud Run 為核心,不選 GKE
部署 Region
asia-east1(彰化)
Cloud SQL 拓撲
3 instance:dev 共用 / uat / prod (HA)
GitHub ↔ GCP 認證
Workload Identity Federation(無 key)
AI 開發框架
GitHub Spec Kit + superpowers + Agent Teams
Staging 取捨
無 staging,由 canary + auto rollback 替代