界面新聞?dòng)浾?| 宋佳楠
北京時(shí)間5月21日,一年一度的谷歌開(kāi)發(fā)者大會(huì)(Google I/O)在美國(guó)加州山景城的海岸線圓形劇場(chǎng)舉辦。在本次大會(huì)上,谷歌展示了其在AI領(lǐng)域的最新進(jìn)展,從升級(jí)搜索引擎到生成式內(nèi)容工具的推出,以及硬件的更新,標(biāo)志著該公司正以前所未有的速度將AI技術(shù)融入其生態(tài)系統(tǒng)。
作為本次會(huì)議的重頭戲,此次谷歌發(fā)布了升級(jí)版的Gemini 2.5模型,顯著提升了多模態(tài)理解和推理能力。其中,Deep Think模式引入了增強(qiáng)型推理機(jī)制,能在回答前考慮多種可能性,改進(jìn)在數(shù)學(xué)、編程和多模態(tài)任務(wù)中的表現(xiàn)。Gemini 2.5 Flash版本也帶來(lái)了性能和效率的提升,可滿足更廣泛的應(yīng)用需求。
搜索引擎方面,谷歌引入了“AI模式”,為用戶提供更具對(duì)話性和上下文理解的搜索體驗(yàn)。該模式利用Gemini模型,能夠處理多重查詢,提供更深入、多樣化的搜索結(jié)果。此外,谷歌還在測(cè)試“深度搜索”和實(shí)時(shí)視覺(jué)數(shù)據(jù)功能,計(jì)劃將其整合到常規(guī)搜索中。
谷歌展示了Project Astra的最新進(jìn)展,該工具旨在開(kāi)發(fā)一個(gè)具備上下文理解、規(guī)劃和執(zhí)行能力的通用AI助手。其能夠通過(guò)實(shí)時(shí)攝像頭交互,理解用戶所處環(huán)境,并提供相應(yīng)的幫助。
在生成式內(nèi)容領(lǐng)域,谷歌推出了Veo 3視頻生成模型和Imagen 4圖像生成模型。Veo 3支持原生音頻生成,能夠?yàn)橐曨l添加背景音樂(lè)、音效甚至對(duì)白。Imagen 4則提升了圖像細(xì)節(jié)和文本輸出質(zhì)量,據(jù)谷歌稱,Imagen 4能夠渲染“精細(xì)細(xì)節(jié)”,如織物、水滴和動(dòng)物皮毛,以及處理照片級(jí)寫(xiě)實(shí)和抽象風(fēng)格,創(chuàng)建各種縱橫比和高達(dá)2K分辨率的圖像。
Project Mariner則是谷歌的實(shí)驗(yàn)性AI代理工具,用于瀏覽和使用網(wǎng)站。谷歌表示,其更新了Project Mariner的工作方式,允許代理一次承擔(dān)近十幾項(xiàng)任務(wù)。例如,用戶可以購(gòu)買棒球比賽門票或在線購(gòu)買雜貨,而無(wú)需訪問(wèn)第三方網(wǎng)站。
硬件上,谷歌與Xreal、Samsung、Warby Parker和Gentle Monster等品牌合作,推出了Android XR智能眼鏡。這些眼鏡集成了AI助手功能,支持實(shí)時(shí)翻譯、導(dǎo)航和信息提示,是該公司在可穿戴設(shè)備領(lǐng)域的新探索。
值得一提的是,谷歌還推出了每月249.99美元的AI Ultra訂閱計(jì)劃,提供對(duì)Gemini 2.5 Pro的Deep Think模式、Veo 3視頻生成工具、Flow視頻編輯應(yīng)用等高級(jí)AI功能的訪問(wèn)權(quán)限。此外,訂閱者還可享受更高的使用限制和額外的存儲(chǔ)空間。
Wedbush分析師Daniel Ives指出,Gemini的進(jìn)展有助于谷歌縮小與OpenAI的差距,標(biāo)志著公司進(jìn)入新的創(chuàng)新階段。而對(duì)話式搜索體驗(yàn),允許用戶進(jìn)行多輪查詢和個(gè)性化互動(dòng),被視為搜索引擎體驗(yàn)的根本性轉(zhuǎn)變。
不過(guò),盡管AI技術(shù)取得多項(xiàng)突破,仍有分析師對(duì)谷歌AI Ultra訂閱計(jì)劃的盈利能力存疑,尤其是在搜索廣告收入可能受到影響的情況下。
大會(huì)當(dāng)日,谷歌母公司Alphabet的股價(jià)下跌了約1.5%,收于每股約167.87美元,市值約為2.03萬(wàn)億美元。自2025年初以來(lái),Alphabet的股價(jià)已累計(jì)下跌約13%。