OpenAI GPT-5 正式發布：全面實測與香港用家升級指南 · AgentFlow HK

等到了：GPT-5 正式登場

2026 年 6 月 1 日，OpenAI 正式發布 GPT-5，距離上一次重大模型更新（GPT-4o）足足超過一年。今次唔係 incremental update —— OpenAI CEO Sam Altman 形容係「從底層重新設計嘅模型架構」，而初步實測顯示，呢個講法並冇誇張。

項目	GPT-4o	GPT-5	提升幅度
參數量	約 1.8T (MoE)	推測 8T+ (新一代 MoE)	~4x
上下文視窗	128K tokens	1M tokens	8x
推理能力 (MATH)	76.6%	94.2%	+17.6%
程式碼生成 (SWE-bench)	38.8%	72.5%	+33.7%
多模態	文字 + 圖片	文字 + 圖片 + 音訊 + 影片	原生多模態
Agent 模式	有限	完整自主 agent	—

GPT-5 採用第三代 Mixture of Experts 架構，總參數量估計超過 8 兆，但每次推理只啟動約 600B 參數。呢個設計令 GPT-5 在保持合理成本嘅同時，達到了顯著嘅能力提升。

關鍵改進包括：

GPT-5 最令人驚喜嘅唔係 benchmark 數字，而係內置嘅 Agent Mode——佢可以自主規劃、執行工具、debug、甚至自我修正。

我哋用香港常用嘅 workflow 做咗實測：

測試 1：網站爬蟲 + 數據分析

測試 2：GitHub Issue 自動修復

任務：俾一個 GitHub repo 嘅 open issue 佢，叫佢理解問題、寫 fix、開 PR
GPT-5 Agent：成功讀取 issue → clone repo → 分析 codebase → 寫修復 → 跑 test → commit → push → 開 PR，成功率約 78%

Agent mode 對香港嘅小團隊同 freelance developer 特別有用——一個人可以用 AI agent 頂幾個 junior developer 嘅工量。當然，code review 同品質把關仍然需要 senior developer 嘅參與。

OpenAI 公佈咗全新嘅定價結構：

API 價格：

如果你用緊 GPT-4o 已經夠用，唔一定要即升——GPT-5 mini 可能係成本效益最高嘅選擇。需要 agent mode 或處理大量長文本先值得上 Pro。

GPT-5 嘅中文能力有明顯進步，特別係文言文、成語、本地化用語方面。我哋用粵語測試，對答自然度大幅提升。

Agent mode 消耗 token 量比普通對話高 5-10 倍。建議：

GPT-5 發布後幾個小時內，各對手已經有反應：

GPT-5 係 2026 年到目前為止最重要嘅 AI 產品發布。Agent Mode 真正改變咗我哋同 AI 互動嘅方式——從「問答工具」變成「自主同事」。對香港用家嚟講，最大嘅建議係：了解清楚自己嘅需求，揀啱方案，唔好盲目追最新最貴。

下星期我哋會出詳細嘅 GPT-5 Agent Mode 教學，教你點樣 setup 自己嘅 agent workflow，敬請期待。