Microsoft takes on AI rivals with three new foundational models

一句話版本

微軟一次過推出三個自家基礎模型，擺明想喺多模態 AI 供應鏈上減少對 OpenAI 依賴，重點賣點係更平、更快、而且直接放入自己平台賣。

點解重要

策略層面：呢次唔係單一功能更新，而係文字、語音、影像三條線一齊補齊，代表微軟想控制更多核心模型能力，唔再只係做上層分發同雲端承載。
合作關係變咗味：佢一邊重申同 OpenAI 繼續合作，一邊又高調推自家模型，反映未來大廠合作未必等於單一依賴，平台方會同時培養內部替代方案。
價格會變成正面戰場：文中明講微軟想用「比 Google 同 OpenAI 更平」做賣點，對企業買家嚟講，模型選型之後會更似雲服務採購，而唔只係比能力。
速度可以打入實際流程：語音轉錄模型標榜比 Azure Fast 快 2.5 倍，語音生成模型又可以 1 秒出 60 秒音訊，呢類指標對即時客服、會議整理、內容流水線特別有吸引力。
Microsoft Foundry 地位上升：三個模型集中上架 Foundry，同部分能力放入 MAI Playground，說明微軟唔係淨係做研究發佈，而係想把自家模型變成可直接試、可直接買、可直接接入產品的標準入口。
多模態競爭更加平台化：當同一間公司同時供應模型、雲基建、測試平台同產品入口，客戶會更容易被完整工作流綁住，轉移成本亦會提高。
Suleyman 團隊開始交功課：MAI Superintelligence team 去到 2025 年 11 月先成立，依家已經有成套模型推出，代表微軟內部自研節奏比外界想像更快。
「Humanist AI」係產品定位唔止口號：佢哋強調以人類溝通方式為中心，實際上係幫模型定義商業方向，即係優先做語音、轉錄、生成呢啲貼近真實互動場景嘅能力。
影音內容生產門檻再降：自訂聲線加高速語音生成，會令品牌語音、客服聲音、內容配音變得更低成本，對內容安全、授權同濫用治理都會帶來新壓力。
微軟想複製「晶片雙軌制」到模型：文中類比佢造自家晶片同時亦外購，說明未來模型策略都可能係「自研 + 外部供應」並行，目的係掌握議價權同供應安全。
對 Azure 生態有加乘：如果 Foundry 內部模型夠平又夠快，微軟可以用模型本身帶動更多雲端工作負載，唔止賺 API，仲賺整個部署與運行環境。
市場訊號好清楚：連最大 OpenAI 金主之一都持續加碼自家基礎模型，代表頂級模型能力已被視為不能完全外包的核心資產。

我哋點睇

如果我哋之後做模型供應商選型，唔應該再用「某某平台 = 某某模型」去理解市場，要預設同一平台會同時賣自家模型同第三方模型。
做系統設計時，介面要保持模型供應商可替換，特別係語音轉錄、TTS、影像生成呢類能力，否則價格戰一來就好難食到紅利。
成本評估要由「單次模型效果」轉做「整條工作流總成本」，因為微軟呢類玩家會用平台整合、速度同定價一齊打包搶單。
如果產品牽涉自訂聲線或自動內容生成，依家就要先補授權、審批同可追溯設計；技術門檻下降得太快，治理唔可以等功能上線後先補。

來源

原文：https://techcrunch.com/category/artificial-intelligence/feed/