Paramita Loom Paramita Loom
EN
← 知識

Microsoft takes on AI rivals with three new foundational models

Microsoft takes on AI rivals with three new foundational models

Microsoft takes on AI rivals with three new foundational models

一句話版本

微軟一次過推出三個自家基礎模型,擺明想喺多模態 AI 供應鏈上減少對 OpenAI 依賴,重點賣點係更平、更快、而且直接放入自己平台賣。

點解重要

  • 策略層面:呢次唔係單一功能更新,而係文字、語音、影像三條線一齊補齊,代表微軟想控制更多核心模型能力,唔再只係做上層分發同雲端承載。
  • 合作關係變咗味:佢一邊重申同 OpenAI 繼續合作,一邊又高調推自家模型,反映未來大廠合作未必等於單一依賴,平台方會同時培養內部替代方案。
  • 價格會變成正面戰場:文中明講微軟想用「比 Google 同 OpenAI 更平」做賣點,對企業買家嚟講,模型選型之後會更似雲服務採購,而唔只係比能力。
  • 速度可以打入實際流程:語音轉錄模型標榜比 Azure Fast 快 2.5 倍,語音生成模型又可以 1 秒出 60 秒音訊,呢類指標對即時客服、會議整理、內容流水線特別有吸引力。
  • Microsoft Foundry 地位上升:三個模型集中上架 Foundry,同部分能力放入 MAI Playground,說明微軟唔係淨係做研究發佈,而係想把自家模型變成可直接試、可直接買、可直接接入產品的標準入口。
  • 多模態競爭更加平台化:當同一間公司同時供應模型、雲基建、測試平台同產品入口,客戶會更容易被完整工作流綁住,轉移成本亦會提高。
  • Suleyman 團隊開始交功課:MAI Superintelligence team 去到 2025 年 11 月先成立,依家已經有成套模型推出,代表微軟內部自研節奏比外界想像更快。
  • 「Humanist AI」係產品定位唔止口號:佢哋強調以人類溝通方式為中心,實際上係幫模型定義商業方向,即係優先做語音、轉錄、生成呢啲貼近真實互動場景嘅能力。
  • 影音內容生產門檻再降:自訂聲線加高速語音生成,會令品牌語音、客服聲音、內容配音變得更低成本,對內容安全、授權同濫用治理都會帶來新壓力。
  • 微軟想複製「晶片雙軌制」到模型:文中類比佢造自家晶片同時亦外購,說明未來模型策略都可能係「自研 + 外部供應」並行,目的係掌握議價權同供應安全。
  • 對 Azure 生態有加乘:如果 Foundry 內部模型夠平又夠快,微軟可以用模型本身帶動更多雲端工作負載,唔止賺 API,仲賺整個部署與運行環境。
  • 市場訊號好清楚:連最大 OpenAI 金主之一都持續加碼自家基礎模型,代表頂級模型能力已被視為不能完全外包的核心資產。

我哋點睇

  • 如果我哋之後做模型供應商選型,唔應該再用「某某平台 = 某某模型」去理解市場,要預設同一平台會同時賣自家模型同第三方模型。
  • 做系統設計時,介面要保持模型供應商可替換,特別係語音轉錄、TTS、影像生成呢類能力,否則價格戰一來就好難食到紅利。
  • 成本評估要由「單次模型效果」轉做「整條工作流總成本」,因為微軟呢類玩家會用平台整合、速度同定價一齊打包搶單。
  • 如果產品牽涉自訂聲線或自動內容生成,依家就要先補授權、審批同可追溯設計;技術門檻下降得太快,治理唔可以等功能上線後先補。

來源