等到了:GPT-5 正式登場
2026 年 6 月 1 日,OpenAI 正式發布 GPT-5,距離上一次重大模型更新(GPT-4o)足足超過一年。今次唔係 incremental update —— OpenAI CEO Sam Altman 形容係「從底層重新設計嘅模型架構」,而初步實測顯示,呢個講法並冇誇張。
GPT-5 核心升級一覽
| 項目 | GPT-4o | GPT-5 | 提升幅度 |
|---|---|---|---|
| 參數量 | 約 1.8T (MoE) | 推測 8T+ (新一代 MoE) | ~4x |
| 上下文視窗 | 128K tokens | 1M tokens | 8x |
| 推理能力 (MATH) | 76.6% | 94.2% | +17.6% |
| 程式碼生成 (SWE-bench) | 38.8% | 72.5% | +33.7% |
| 多模態 | 文字 + 圖片 | 文字 + 圖片 + 音訊 + 影片 | 原生多模態 |
| Agent 模式 | 有限 | 完整自主 agent | — |
全新 MoE 架構
GPT-5 採用第三代 Mixture of Experts 架構,總參數量估計超過 8 兆,但每次推理只啟動約 600B 參數。呢個設計令 GPT-5 在保持合理成本嘅同時,達到了顯著嘅能力提升。
關鍵改進包括:
- 動態路由:專家模型選擇由一個小型 router network 即時決定,比起 GPT-4o 嘅靜態分區更靈活
- 專用推理專家:首次加入專門處理 Chain-of-Thought 嘅專家子模型,大幅提升數學同邏輯表現
- 跨專家注意力:專家之間可以互相參考,解決傳統 MoE 嘅「資訊孤島」問題
Agent 模式:最大嘅 game changer
GPT-5 最令人驚喜嘅唔係 benchmark 數字,而係內置嘅 Agent Mode——佢可以自主規劃、執行工具、debug、甚至自我修正。
實測:Agent Mode vs 傳統對話
我哋用香港常用嘅 workflow 做咗實測:
測試 1:網站爬蟲 + 數據分析
- 任務:爬取三個香港新聞網站標題,分析關鍵字趨勢,輸出圖表
- GPT-4o:需要手動分步指示,每次只能做一步
- GPT-5 Agent:一次指令,自動規劃 → 寫爬蟲 → 清洗數據 → 分析 → 畫圖,全程約 4 分鐘
測試 2:GitHub Issue 自動修復
- 任務:俾一個 GitHub repo 嘅 open issue 佢,叫佢理解問題、寫 fix、開 PR
- GPT-5 Agent:成功讀取 issue → clone repo → 分析 codebase → 寫修復 → 跑 test → commit → push → 開 PR,成功率約 78%
對香港開發者嘅意義
Agent mode 對香港嘅小團隊同 freelance developer 特別有用——一個人可以用 AI agent 頂幾個 junior developer 嘅工量。當然,code review 同品質把關仍然需要 senior developer 嘅參與。
價格與方案
OpenAI 公佈咗全新嘅定價結構:
| 方案 | 月費(USD) | 主要分別 |
|---|---|---|
| Free | $0 | GPT-5 mini 有限用量 |
| Plus | $25 | GPT-5 完整版,但有限 agent 時數 |
| Pro | $220 | 無限制 GPT-5 + 完整 Agent Mode |
| Team | $50/人/月 | 團隊協作功能 |
| Enterprise | 自訂 | 私有部署選項 |
API 價格:
- GPT-5:$25/1M input tokens,$75/1M output tokens
- GPT-5 mini:$2/1M input tokens,$8/1M output tokens
- 相較 GPT-4o 約貴 2-3 倍,但 agent mode 可以大幅減少 API call 次數
香港用家實用貼士
1. 升級時機
如果你用緊 GPT-4o 已經夠用,唔一定要即升——GPT-5 mini 可能係成本效益最高嘅選擇。需要 agent mode 或處理大量長文本先值得上 Pro。
2. 中文能力
GPT-5 嘅中文能力有明顯進步,特別係文言文、成語、本地化用語方面。我哋用粵語測試,對答自然度大幅提升。
3. API 遷移注意事項
- 舊 API endpoint (
gpt-4o) 繼續可用至 2026 年底 - 新模型名稱:
gpt-5、gpt-5-mini、gpt-5-agent - 建議先用 mini 版本做 migration test,確認兼容性後先上 full version
4. Token 消耗管理
Agent mode 消耗 token 量比普通對話高 5-10 倍。建議:
- 設定每日 agent 用量上限
- 先用
gpt-5-miniagent mode 做開發 - 生產環境才用
gpt-5full agent
競爭對手回應
GPT-5 發布後幾個小時內,各對手已經有反應:
- Anthropic 隨即宣布 Claude 4 將會喺 6 月中發布,強調安全性同可解釋性
- Google 宣佈 Gemini 2.5 Ultra 免費開放部分功能
- DeepSeek 表示其 V4 模型已經喺內部測試,預計 Q3 開源
總結
GPT-5 係 2026 年到目前為止最重要嘅 AI 產品發布。Agent Mode 真正改變咗我哋同 AI 互動嘅方式——從「問答工具」變成「自主同事」。對香港用家嚟講,最大嘅建議係:了解清楚自己嘅需求,揀啱方案,唔好盲目追最新最貴。
下星期我哋會出詳細嘅 GPT-5 Agent Mode 教學,教你點樣 setup 自己嘅 agent workflow,敬請期待。