What’s new in Gemma 4
一句話版本
Gemma 4 係 Google 新推出嘅開放模型家族,主打可以直接喺你自己部手機、手提電腦同桌面機本地運行,仲首次改用 Apache 2.0 開源授權,重點係令代理型工作流、長上下文同企業落地變得更實際。
點解重要
- 授權模式變咗,商用同整合門檻低咗。
- 片入面最關鍵嘅變化唔只係模型升級,而係首次用 Apache 2.0。對我哋嚟講,呢個直接影響可唔可以放心做內部產品化、再分發、改模同長期維護,法律同採購阻力通常會細好多。
- 明確押注「本地運行」而唔係純雲端。
- 佢特別強調可以喺電話、手提電腦、桌面機跑,代表定位唔係示範性 open model,而係真係想打入邊緣裝置、個人電腦同受控環境。對需要資料唔出機、唔出網嘅場景,吸引力會大好多。
- 代理型工作流係核心賣點,唔係附加功能。
- 佢唔止話模型更聰明,而係直接講到複雜邏輯、多步規劃、tool use 同 agentic workflows。即係產品方向已經預設模型會「規劃 + 執行」,唔再只係問答或補全文字。
- 長上下文令「整個 codebase 分析」變成官方主推用例。
- 大模型最高去到 25 萬 token context,片中直接點名可以分析完整程式庫。呢點對開發工具、程式審查、長流程任務拆解特別重要,因為官方已經將軟件工程場景放到前台。
- 26B MoE 同 31B Dense 係兩條唔同取向。
- 26B MoE 主打速度,31B Dense 主打輸出質素,呢個分工好實際。對團隊嚟講,唔同任務可以唔同配搭:需要回應快就揀 MoE,需要質素穩就揀 Dense,唔使一刀切。
- 細模型唔再只係「縮水版」,而係為低記憶體設備重新設計。
- 2B 同 4B 被描述成高記憶體效率,目標係 mobile 同 IoT。呢個意思係 Google 唔係單純將大模型縮細,而係想搶實際裝置端部署市場,令離線、低延遲、低成本變成可選項。
- 多模態能力開始下沉去細模型。
- 片中提到 audio + vision 支援,而且係即時處理。重要之處唔只係功能多,而係顯示多模態唔再只屬於高階雲端模型,之後裝置端 agent 有機會直接「睇到、聽到、即時反應」。
- 140+ 語言支援代表全球化部署會更自然。
- 佢特登示範跨語言任務,說明多語唔係邊緣能力。對面向多地區、多語使用者嘅系統,呢種原生支援會直接影響提示設計、客服流程同地區化成本。
- 企業安全訊息係佢想切入正式基建市場嘅訊號。
- 片中講到跟 Google DeepMind 同級安全流程,重點其實係建立信任感。即係佢哋知道 open model 要入企業,障礙通常唔係 benchmark,而係風險管理、審批同可控性。
- 佢強調「用你而家熟悉嘅工具」,反映生態整合會係成敗位。
- 唔係淨係放權重出嚟,而係想降低現有開發棧遷移成本。對團隊嚟講,真正價值要睇佢同現有推論框架、代理框架、部署工具接得幾順,而唔係只睇模型本身。
- Google 將 Gemma 定位為 Gemini 技術外溢嘅開放版本。
- 片中直接講係建基於 Gemini 3 背後研究與技術,呢種講法其實係品牌承諾:開放模型唔再係邊線實驗,而係主線技術策略之一。對市場判斷嚟講,代表 Google 對 open model 係認真加碼。
我哋點睇
- 如果我哋有任何「資料最好留喺本機/內網」嘅需求,Gemma 4 值得列入第一輪評估名單,因為佢嘅定位正正對住受控環境同本地代理。
- 評估時唔好只問「夠唔夠聰明」,要分三條線睇:31B 做高質輸出、26B MoE 做快回應、2B/4B 做裝置端或低成本常駐任務,咁先貼近真實架構選型。
- 如果團隊想做 coding agent、文件分析 agent 或內部操作助理,Gemma 4 最值得驗證嘅唔係一般聊天效果,而係長上下文、tool use 穩定性同本地部署後嘅延遲/記憶體表現。
- Apache 2.0 令佢由「可以試」變成「有機會入正式產品」,所以後續如果要做 PoC,重點應該放喺授權、部署、可觀察性同安全邊界,而唔係只追 demo。