What’s new in Gemma 4

一句話版本

Gemma 4 係 Google 新推出嘅開放模型家族，主打可以直接喺你自己部手機、手提電腦同桌面機本地運行，仲首次改用 Apache 2.0 開源授權，重點係令代理型工作流、長上下文同企業落地變得更實際。

點解重要

授權模式變咗，商用同整合門檻低咗。
片入面最關鍵嘅變化唔只係模型升級，而係首次用 Apache 2.0。對我哋嚟講，呢個直接影響可唔可以放心做內部產品化、再分發、改模同長期維護，法律同採購阻力通常會細好多。
明確押注「本地運行」而唔係純雲端。
佢特別強調可以喺電話、手提電腦、桌面機跑，代表定位唔係示範性 open model，而係真係想打入邊緣裝置、個人電腦同受控環境。對需要資料唔出機、唔出網嘅場景，吸引力會大好多。
代理型工作流係核心賣點，唔係附加功能。
佢唔止話模型更聰明，而係直接講到複雜邏輯、多步規劃、tool use 同 agentic workflows。即係產品方向已經預設模型會「規劃 + 執行」，唔再只係問答或補全文字。
長上下文令「整個 codebase 分析」變成官方主推用例。
大模型最高去到 25 萬 token context，片中直接點名可以分析完整程式庫。呢點對開發工具、程式審查、長流程任務拆解特別重要，因為官方已經將軟件工程場景放到前台。
26B MoE 同 31B Dense 係兩條唔同取向。
26B MoE 主打速度，31B Dense 主打輸出質素，呢個分工好實際。對團隊嚟講，唔同任務可以唔同配搭：需要回應快就揀 MoE，需要質素穩就揀 Dense，唔使一刀切。
細模型唔再只係「縮水版」，而係為低記憶體設備重新設計。
2B 同 4B 被描述成高記憶體效率，目標係 mobile 同 IoT。呢個意思係 Google 唔係單純將大模型縮細，而係想搶實際裝置端部署市場，令離線、低延遲、低成本變成可選項。
多模態能力開始下沉去細模型。
片中提到 audio + vision 支援，而且係即時處理。重要之處唔只係功能多，而係顯示多模態唔再只屬於高階雲端模型，之後裝置端 agent 有機會直接「睇到、聽到、即時反應」。
140+ 語言支援代表全球化部署會更自然。
佢特登示範跨語言任務，說明多語唔係邊緣能力。對面向多地區、多語使用者嘅系統，呢種原生支援會直接影響提示設計、客服流程同地區化成本。
企業安全訊息係佢想切入正式基建市場嘅訊號。
片中講到跟 Google DeepMind 同級安全流程，重點其實係建立信任感。即係佢哋知道 open model 要入企業，障礙通常唔係 benchmark，而係風險管理、審批同可控性。
佢強調「用你而家熟悉嘅工具」，反映生態整合會係成敗位。
唔係淨係放權重出嚟，而係想降低現有開發棧遷移成本。對團隊嚟講，真正價值要睇佢同現有推論框架、代理框架、部署工具接得幾順，而唔係只睇模型本身。
Google 將 Gemma 定位為 Gemini 技術外溢嘅開放版本。
片中直接講係建基於 Gemini 3 背後研究與技術，呢種講法其實係品牌承諾：開放模型唔再係邊線實驗，而係主線技術策略之一。對市場判斷嚟講，代表 Google 對 open model 係認真加碼。

我哋點睇

如果我哋有任何「資料最好留喺本機／內網」嘅需求，Gemma 4 值得列入第一輪評估名單，因為佢嘅定位正正對住受控環境同本地代理。
評估時唔好只問「夠唔夠聰明」，要分三條線睇：31B 做高質輸出、26B MoE 做快回應、2B/4B 做裝置端或低成本常駐任務，咁先貼近真實架構選型。
如果團隊想做 coding agent、文件分析 agent 或內部操作助理，Gemma 4 最值得驗證嘅唔係一般聊天效果，而係長上下文、tool use 穩定性同本地部署後嘅延遲/記憶體表現。
Apache 2.0 令佢由「可以試」變成「有機會入正式產品」，所以後續如果要做 PoC，重點應該放喺授權、部署、可觀察性同安全邊界，而唔係只追 demo。

來源

原文：https://www.youtube.com/feeds/videos.xml?channel_id=UC_x5XG1OV2P6uZZ5FSM9Ttw