news

OpenAI GPT-5 正式發布:全面實測與香港用家升級指南

等到了:GPT-5 正式登場

2026 年 6 月 1 日,OpenAI 正式發布 GPT-5,距離上一次重大模型更新(GPT-4o)足足超過一年。今次唔係 incremental update —— OpenAI CEO Sam Altman 形容係「從底層重新設計嘅模型架構」,而初步實測顯示,呢個講法並冇誇張。

GPT-5 核心升級一覽

項目 GPT-4o GPT-5 提升幅度
參數量 約 1.8T (MoE) 推測 8T+ (新一代 MoE) ~4x
上下文視窗 128K tokens 1M tokens 8x
推理能力 (MATH) 76.6% 94.2% +17.6%
程式碼生成 (SWE-bench) 38.8% 72.5% +33.7%
多模態 文字 + 圖片 文字 + 圖片 + 音訊 + 影片 原生多模態
Agent 模式 有限 完整自主 agent

全新 MoE 架構

GPT-5 採用第三代 Mixture of Experts 架構,總參數量估計超過 8 兆,但每次推理只啟動約 600B 參數。呢個設計令 GPT-5 在保持合理成本嘅同時,達到了顯著嘅能力提升。

關鍵改進包括:

  • 動態路由:專家模型選擇由一個小型 router network 即時決定,比起 GPT-4o 嘅靜態分區更靈活
  • 專用推理專家:首次加入專門處理 Chain-of-Thought 嘅專家子模型,大幅提升數學同邏輯表現
  • 跨專家注意力:專家之間可以互相參考,解決傳統 MoE 嘅「資訊孤島」問題

Agent 模式:最大嘅 game changer

GPT-5 最令人驚喜嘅唔係 benchmark 數字,而係內置嘅 Agent Mode——佢可以自主規劃、執行工具、debug、甚至自我修正。

實測:Agent Mode vs 傳統對話

我哋用香港常用嘅 workflow 做咗實測:

測試 1:網站爬蟲 + 數據分析

  • 任務:爬取三個香港新聞網站標題,分析關鍵字趨勢,輸出圖表
  • GPT-4o:需要手動分步指示,每次只能做一步
  • GPT-5 Agent:一次指令,自動規劃 → 寫爬蟲 → 清洗數據 → 分析 → 畫圖,全程約 4 分鐘

測試 2:GitHub Issue 自動修復

  • 任務:俾一個 GitHub repo 嘅 open issue 佢,叫佢理解問題、寫 fix、開 PR
  • GPT-5 Agent:成功讀取 issue → clone repo → 分析 codebase → 寫修復 → 跑 test → commit → push → 開 PR,成功率約 78%

對香港開發者嘅意義

Agent mode 對香港嘅小團隊同 freelance developer 特別有用——一個人可以用 AI agent 頂幾個 junior developer 嘅工量。當然,code review 同品質把關仍然需要 senior developer 嘅參與。

價格與方案

OpenAI 公佈咗全新嘅定價結構:

方案 月費(USD) 主要分別
Free $0 GPT-5 mini 有限用量
Plus $25 GPT-5 完整版,但有限 agent 時數
Pro $220 無限制 GPT-5 + 完整 Agent Mode
Team $50/人/月 團隊協作功能
Enterprise 自訂 私有部署選項

API 價格:

  • GPT-5:$25/1M input tokens,$75/1M output tokens
  • GPT-5 mini:$2/1M input tokens,$8/1M output tokens
  • 相較 GPT-4o 約貴 2-3 倍,但 agent mode 可以大幅減少 API call 次數

香港用家實用貼士

1. 升級時機

如果你用緊 GPT-4o 已經夠用,唔一定要即升——GPT-5 mini 可能係成本效益最高嘅選擇。需要 agent mode 或處理大量長文本先值得上 Pro。

2. 中文能力

GPT-5 嘅中文能力有明顯進步,特別係文言文、成語、本地化用語方面。我哋用粵語測試,對答自然度大幅提升。

3. API 遷移注意事項

  • 舊 API endpoint (gpt-4o) 繼續可用至 2026 年底
  • 新模型名稱:gpt-5gpt-5-minigpt-5-agent
  • 建議先用 mini 版本做 migration test,確認兼容性後先上 full version

4. Token 消耗管理

Agent mode 消耗 token 量比普通對話高 5-10 倍。建議:

  • 設定每日 agent 用量上限
  • 先用 gpt-5-mini agent mode 做開發
  • 生產環境才用 gpt-5 full agent

競爭對手回應

GPT-5 發布後幾個小時內,各對手已經有反應:

  • Anthropic 隨即宣布 Claude 4 將會喺 6 月中發布,強調安全性同可解釋性
  • Google 宣佈 Gemini 2.5 Ultra 免費開放部分功能
  • DeepSeek 表示其 V4 模型已經喺內部測試,預計 Q3 開源

總結

GPT-5 係 2026 年到目前為止最重要嘅 AI 產品發布。Agent Mode 真正改變咗我哋同 AI 互動嘅方式——從「問答工具」變成「自主同事」。對香港用家嚟講,最大嘅建議係:了解清楚自己嘅需求,揀啱方案,唔好盲目追最新最貴。

下星期我哋會出詳細嘅 GPT-5 Agent Mode 教學,教你點樣 setup 自己嘅 agent workflow,敬請期待。