文 | 窄播 李威
這是《窄播Weekly》的第55期。本周我們關注的商業(yè)動態(tài)是:微軟和Google都在開發(fā)者大會上進行了一次AI戰(zhàn)略聚焦。
微軟的Build 2025大會和Google的I/O開發(fā)者大會都選擇了在本周舉辦,并且兩場活動談論的核心都是AI。
不同的是,微軟的重心是向行業(yè)展示如何更好搭建Agent。微軟在Build 2025大會上向用戶呈現(xiàn)了一套更加成熟的Agent基礎設施,想要吸引更多開發(fā)者加入到構(gòu)建開放Agent網(wǎng)絡(Open Agentic Web)的進程中——這是一個 AI 智能體能夠在個人、組織、團隊乃至整個端到端業(yè)務流程中協(xié)同運作的體系。
Google則致力于展示一個圍繞Gemini搭建的AI操作系統(tǒng)雛形。谷歌首席執(zhí)行官Sundar Pichai在演講中使用了「Gemini時代(Gemini Era)」來描述未來。一方面,Google展示了更強的模型研發(fā)能力;另一方面,Google在將Gemini的能力融入到各個C端產(chǎn)品中。
微軟和Google雖然重心不同,但其面向AI的戰(zhàn)略規(guī)劃都具備了一定的整體性,不再是進行散點的嘗試,而是開始找到一條線,將散落的點串聯(lián)起來,成為一個體系。這個體系的使命就如Pichai所言——讓研究成果真正發(fā)揮作用,將其盡快轉(zhuǎn)化為現(xiàn)實應用。
這是目前我們在國內(nèi)大廠中尚未觀察到的一種變化。我們能夠觀察到阿里、騰訊、字節(jié)都在模型基礎層、業(yè)務AI化和產(chǎn)品創(chuàng)新方面進行著積極布局,但很難像總結(jié)本次微軟和Google一樣,為國內(nèi)廠商提煉出一面指引整個企業(yè)向前推進的旗幟。蘋果也是如此。
這可能是由于謹慎,也可能是還未下定決心。但無論出于何種考量,旗幟的出現(xiàn)都將是企業(yè)的AI戰(zhàn)略推進到下一個階段的標志之一。
微軟:一切為了開放代理網(wǎng)絡
一個展現(xiàn)出神奇效果,但還不夠成熟的起步階段——這是微軟在Build 2025大會上對當下AI技術發(fā)展階段的判斷。微軟CEO Satya Nadella選擇用1991年的Win32、1996年的Web棧以及2008年的智能手機來類比當下AI所處的發(fā)展階段。
以上這些節(jié)點,并不是一個C端用戶大爆發(fā)的節(jié)點,而是B端用戶面向未來布局的開始。
因此,微軟將重心放在吸引更偏向B端的企業(yè)和開發(fā)者,并為其準備了一個擁有豐富工具和設備的操作間。
我們可以將各種讓人眼花撩亂的工具和能力劃分為以下幾類:
第一類,提供開發(fā)環(huán)境的基礎能力,包括Windows AI Foundry和Azure AI Foundry等。前者是微軟為本地AI開發(fā)提供的開發(fā)環(huán)境,通過Foundry Local簡化了在設備上直接運行AI模型、工具和智能體的過程。后者則是微軟提供的云端開發(fā)平臺,這次的一大更新是引進了xAI的Grok 3與Grok 3 mini。
同時,微軟通過推出Azure AI Foundry Agent Service,讓專業(yè)開發(fā)者能夠編排多個專用Agent來處理復雜任務。微軟AI Agent副總裁Ray Smith認為,試圖將一個復雜的、要求高可靠性的流程完全整合到單一Agent中,往往會面臨諸多挑戰(zhàn),將任務系統(tǒng)性地分解給多個Agent,則能顯著增強可靠性。
第二類,提升Agent的開發(fā)效率。在微軟的介紹中,已經(jīng)有1500萬開發(fā)者在使用GitHub Copilot功能,提升代碼開發(fā)效率,這個規(guī)模已經(jīng)占到GitHub總用戶數(shù)的十分之一。在最新的更新中,GitHub Copilot將能夠支持完成用戶分配的BUG修復、代碼維護等任務,并能在VS Code中使用。
微軟還推出了Microsoft 365 Copilot Tuning,支持開發(fā)者使用針對公司數(shù)據(jù)、工作流程和風格微調(diào)的模型來構(gòu)建更專屬的Agent。開發(fā)者可以通過低代碼的形式進行模型的微調(diào),這個工作之前往往需要一整個數(shù)據(jù)科學團隊耗費數(shù)周時間才能完成。
第三類,提供Agent的載體。微軟在面向C端的Agent載體上并沒有著墨太多,反而是重點介紹了對協(xié)作產(chǎn)品Teams的升級。Nadella認為,新的Teams真正將聊天、搜索、筆記、生成和Agent整合到一個直觀的框架中。這也是一個完整的AI的用戶界面,支持多人協(xié)作,并承載了Agent的流通。
第四類,提供網(wǎng)絡連接能力。一方面微軟開始全面支持MCP(Model Context Protocol)協(xié)議,這讓它想建立的Agent網(wǎng)絡具備了開放屬性和復雜的任務執(zhí)行能力。在現(xiàn)場演示中,應用開發(fā)者使用VS Code中的GitHub Copilot功能和Windows的MCP協(xié)議,依靠3句話就實現(xiàn)了特定風格網(wǎng)頁的開發(fā)。
第一句話的指令下,GitHub Copilot連接WSL (Windows Subsystem for Linux)的MCP服務器,完成了最新版本的Fedora安裝;第二句指令下,GitHub Copilot創(chuàng)建了一個網(wǎng)站項目;第三句指令下,GitHub Copilot利用MCP協(xié)議,從用戶的Figma客戶端中提取了相應的設計細節(jié),并據(jù)此對網(wǎng)頁進行了調(diào)整。
在MCP協(xié)議基礎上,微軟這次還提出了NLWeb概念。微軟CTO Kevin Scott認為,MCP協(xié)議是AI時代的HTTP,而NLWeb則是AI時代的html,能夠讓任何擁有網(wǎng)站或API的人輕松地將其變成一個Agent。「每個NLWeb端點默認都是一個MCP服務器,這意味著那些人們通過NLWeb提供的東西將可以被任何支持MCP的Agent訪問。」
微軟已經(jīng)圍繞開放代理網(wǎng)絡完成了對自身業(yè)務的基礎梳理。在這次梳理之后,微軟的產(chǎn)品體系將服務于AI時代的HTTP與html,借此來延續(xù)互聯(lián)網(wǎng)時代的榮光。
Google:用Gemini改造和連接一切
不同于微軟在Build 2025大會上呈現(xiàn)的服務企業(yè)和開發(fā)者的AI產(chǎn)品,Google在I/O大會上展示了讓更多C端用戶眼前一亮的創(chuàng)新。大模型能力的升級、搜索的AI化嘗試、Android XR的實用化展示,都加深了Google想要讓C端用戶更有效使用AI的判斷。
在模型層面,Google的模型能力進展快速,且具備了更豐富的能力。首先,Gemini 2.5 Pro的推出,扭轉(zhuǎn)了市場對Google大模型業(yè)務的看法,使其成為大模型王冠的有力競爭者。其次,本次發(fā)布的視頻模型Veo 3和生圖模型Imagen 4,在展示效果上都獲得了比較正面的評價。
模型基礎上,Google發(fā)展出了不同的基礎Agent能力。其中,Project Astra主打低延遲的多模態(tài)能力,可以通過攝像頭和麥克風觀察、理解周圍的環(huán)境,且具備長期記憶能力。Project Mariner則強調(diào)多任務處理能力,一次能處理12項任務,能夠代理用戶瀏覽和使用網(wǎng)站,完成購買動作。
在I/O大會的現(xiàn)場演示中,這些基礎Agent能力已經(jīng)被應用在了AI搜索、Chrome瀏覽器、Gemini App、智能眼鏡等C端產(chǎn)品的AI化改造中。
核心的搜索業(yè)務上,Google終于開始用AI加碼。5月20日開始,Google會向所有美國用戶推出AI 模式。用戶可以向Gemini提出幾百字的問題,也能在后續(xù)體驗到多模態(tài)問答功能和Deep Research能力。Google也會在Chrome瀏覽器加入AI助手,幫助用戶總結(jié)提煉頁面信息。
目前,Gemini App的月活躍用戶數(shù)超過4億。Gemini Live將支持攝像頭和屏幕共享,讓AI幫助用戶了解和記憶周圍的環(huán)境。并且,Gemini的Agent模式還將能夠幫助用戶找房、預約、訂票。現(xiàn)場演示中,Gemini Live可以指導用戶學習如何修理自己的自行車,并幫助其打電話訂購所需零件。
軟件端之外,基礎Agent也被應用在了硬件端。Android XR被Google視為Gemini時代走向大眾的首個Android平臺。在現(xiàn)場的演示中,我們看到了Gemini Live能力的硬件化。Google還計劃未來幾個月之內(nèi),把Gemini帶到手表、汽車儀表盤,甚至電視上。
同樣的,Google也升級了AI化的編程工具。一方面,名為Jules的編程Agent,可以像GitHub Copilot一樣實現(xiàn)異步開發(fā),可以自動重構(gòu)代碼、編寫測試。另一方面,升級之后的Gemini Code Assist支持代碼審核、長文件解析、多人協(xié)作,集成了個性化建議和團隊代碼規(guī)范工具。
從基礎模型到軟件,再到硬件和編程工具,Gemini無疑是凝聚這一切的核心。Google的策略很簡單,就是要通過不斷將Gemini的模型能力產(chǎn)品化,融入到現(xiàn)有的和未來場景中,來搭建起一個面向AI時代的系統(tǒng)雛形。
國內(nèi)巨頭還未找到真正突破口
盡管具體方向不同,但微軟和Google共同驗證了「AI走向應用」的大趨勢。
只不過,微軟是在創(chuàng)造條件,讓人們能夠更輕松地探索AI應用;Google則是要通過打造系統(tǒng),讓自己成為基礎的AI應用。這是兩個公司所具備的不同資源和稟賦決定的——微軟以提供企業(yè)服務為主,Google面向的是C端市場。
如果以這兩家公司為參照物來觀察國內(nèi)的大廠,會發(fā)現(xiàn)阿里、騰訊、字節(jié)三家雖然還沒有拎出特別清晰的主線,但在做AI應用的大趨勢下也是各有側(cè)重。
阿里在AI時代的優(yōu)勢體現(xiàn)在大模型和云服務上,to B向開發(fā)者提供支持、構(gòu)建開放Agent生態(tài)的路徑比較順暢。電商業(yè)務作為阿里在互聯(lián)網(wǎng)時代的C端優(yōu)勢,很難順暢轉(zhuǎn)換為AI時代的to C應用支點。因此,夸克的重要性得到了提升。面向未來,阿里可能需要把Agent的發(fā)展勢能注入夸克。
騰訊更接近Google,擁有相對穩(wěn)固的C端產(chǎn)品體系和流量入口,會優(yōu)先考慮如何完成面向C端的存量產(chǎn)品改造和面向未來的C端產(chǎn)品創(chuàng)新,就像最近對QQ瀏覽器進行的改造。但相比Google,騰訊的模型能力更弱,目前只能依靠DeepSeek和混元雙模型驅(qū)動。騰訊雖然有增強自身大模型能力研發(fā)的動作,但還看不到騰訊版Gemini2.5出現(xiàn)的跡象。
字節(jié)也有C端流量,但短視頻也同樣難以直接轉(zhuǎn)換為AI時代的C端入口。這也是為什么字節(jié)會重視豆包大模型的多模態(tài)能力,并在三家中最為積極地去探索AI硬件。To B業(yè)務上,字節(jié)相對欠缺生態(tài)基礎,需要找到更有效的開放方式。并且,與阿里一樣,字節(jié)也更需要一個開放的Agent生態(tài)。
到目前為止,這些側(cè)重也沒有催生出像微軟和Google一樣的戰(zhàn)略重心,看似布局全面的三家,都還沒找到自己的真正突破口。