界面新聞記者 | 肖芳
界面新聞編輯 | 文姝琪
在阿里云、火山引擎等國內云計算大廠激烈爭奪AI Agent市場的同時,亞馬遜云科技也看中了這部分市場。
在亞馬遜云科技中國峰會上,亞馬遜云科技宣布將從基礎設施、數據、AI等多個維度支持企業AI Agent領域的創新。為此,亞馬遜云科技提出了“Agentic AI”的概念。在亞馬遜全球副總裁、亞馬遜云科技大中華區總裁儲瑞松看來,AI的發展已經來到了一個拐點,如今我們正處在Agentic AI爆發的前夜。
但亞馬遜云科技并不是要和國內云計算大廠進行正面競爭。儲瑞松在峰會上強調,亞馬遜云科技在中國的兩大核心業務是助力中國企業拓展全球業務,以及依托自身優勢支持本地企業及跨國企業利用亞馬遜云科技中國區域的業務增長和AI創新。
在幫助本地和跨國企業在中國市場發展上,亞馬遜云科技除了提供云基礎設施和技術、安全合規能力等方面的支持之外,還推出了中國區域客戶Agentic AI實踐指南,提供Agentic AI系統開發的參考架構和具體應用指導。
亞馬遜云科技全球技術總經理Shaown Nandi在接受界面新聞等媒體采訪時表示,從目前企業在AI Agent上的布局來看,最常見的應用場景是提升客戶體驗。尤其在客服場景中,更快理解客戶問題并做出更準確的回應、感知到客戶的情緒變化、為語言不通的客戶提供翻譯等能力被應用得越來越多。另一個應用增長很快的領域就是軟件工程,很多初創企業通過構建AI Agent的方式來提升效率。
在Shaown Nandi看來,亞馬遜云科技的優勢一方面在于Amazon Bedrock能夠為企業客戶提供更豐富的模型,同時也能夠幫助企業解決安全性、升級性等一系列和基礎設施相關的問題。企業客戶在開發Agent應用時,可靈活、便捷地進行調整。
除了這些基礎的能力之外,亞馬遜云科技也在順應市場趨勢大幅降低企業開發Agent應用的成本。但和火山引擎等國內云計算廠商直接降低模型價格的方式不同,亞馬遜云科技選擇了大幅降低GPU的價格。
據界面新聞了解,從今年6月1日起,亞馬遜云科技對EC2 NVIDIA GPU加速型實例實行最高45%的價格下調。在此之前,亞馬遜云科技還推出了以Trainium AI芯片支持的服務器,向H100 GPU硬件發起價格戰。兩款芯片的性能接近,但Trainium AI芯片的價格僅為H100的25%。
同時,亞馬遜也在通過技術優化的方式降低模型推理成本。其中一個技術是模型蒸餾,它可以讓一個模型“縮水”,更聚焦于核心業務領域,從而顯著降低推理成本,有的情況下降幅可達500%;另一個技術是自動提示語路由,早期的系統通常只能調用一個模型處理所有任務,通過提示路由,系統可以根據任務復雜程度,自動選擇不同模型進行推理和計算。
隨著Agent的發展,未來企業客戶還能應用“調度型Agent”,它們不只是按性能調用模型,還能根據成本或價格動態選擇模型,從而進一步降低整體推理成本。
Shaown Nandi表示,無論是長期投資、技術選擇還是提供解決方案,亞馬遜云科技都是為了幫助企業客戶解們長期存在的痛點。“我們會持續關注如何盡可能地為客戶降低成本。”