Microsoft takes on AI rivals with three new foundational models
一句話版本
微軟一次過推出三個自家基礎模型,擺明想喺多模態 AI 供應鏈上減少對 OpenAI 依賴,重點賣點係更平、更快、而且直接放入自己平台賣。
點解重要
- 策略層面:呢次唔係單一功能更新,而係文字、語音、影像三條線一齊補齊,代表微軟想控制更多核心模型能力,唔再只係做上層分發同雲端承載。
- 合作關係變咗味:佢一邊重申同 OpenAI 繼續合作,一邊又高調推自家模型,反映未來大廠合作未必等於單一依賴,平台方會同時培養內部替代方案。
- 價格會變成正面戰場:文中明講微軟想用「比 Google 同 OpenAI 更平」做賣點,對企業買家嚟講,模型選型之後會更似雲服務採購,而唔只係比能力。
- 速度可以打入實際流程:語音轉錄模型標榜比 Azure Fast 快 2.5 倍,語音生成模型又可以 1 秒出 60 秒音訊,呢類指標對即時客服、會議整理、內容流水線特別有吸引力。
- Microsoft Foundry 地位上升:三個模型集中上架 Foundry,同部分能力放入 MAI Playground,說明微軟唔係淨係做研究發佈,而係想把自家模型變成可直接試、可直接買、可直接接入產品的標準入口。
- 多模態競爭更加平台化:當同一間公司同時供應模型、雲基建、測試平台同產品入口,客戶會更容易被完整工作流綁住,轉移成本亦會提高。
- Suleyman 團隊開始交功課:MAI Superintelligence team 去到 2025 年 11 月先成立,依家已經有成套模型推出,代表微軟內部自研節奏比外界想像更快。
- 「Humanist AI」係產品定位唔止口號:佢哋強調以人類溝通方式為中心,實際上係幫模型定義商業方向,即係優先做語音、轉錄、生成呢啲貼近真實互動場景嘅能力。
- 影音內容生產門檻再降:自訂聲線加高速語音生成,會令品牌語音、客服聲音、內容配音變得更低成本,對內容安全、授權同濫用治理都會帶來新壓力。
- 微軟想複製「晶片雙軌制」到模型:文中類比佢造自家晶片同時亦外購,說明未來模型策略都可能係「自研 + 外部供應」並行,目的係掌握議價權同供應安全。
- 對 Azure 生態有加乘:如果 Foundry 內部模型夠平又夠快,微軟可以用模型本身帶動更多雲端工作負載,唔止賺 API,仲賺整個部署與運行環境。
- 市場訊號好清楚:連最大 OpenAI 金主之一都持續加碼自家基礎模型,代表頂級模型能力已被視為不能完全外包的核心資產。
我哋點睇
- 如果我哋之後做模型供應商選型,唔應該再用「某某平台 = 某某模型」去理解市場,要預設同一平台會同時賣自家模型同第三方模型。
- 做系統設計時,介面要保持模型供應商可替換,特別係語音轉錄、TTS、影像生成呢類能力,否則價格戰一來就好難食到紅利。
- 成本評估要由「單次模型效果」轉做「整條工作流總成本」,因為微軟呢類玩家會用平台整合、速度同定價一齊打包搶單。
- 如果產品牽涉自訂聲線或自動內容生成,依家就要先補授權、審批同可追溯設計;技術門檻下降得太快,治理唔可以等功能上線後先補。