5月26日,紅杉中國宣布推出全新的AI基準測試xbench,并發布論文《xbench: Tracking Agents Productivity, Scaling with Profession-Aligned Real-World Evaluations》。這是首個由投資機構發起,聯合國內外十余家高校和研究機構的數十位博士研究生,采用雙軌評估體系和長青評估機制的AI基準測試。xbench將在評估和推動AI系統能力提升上限與技術邊界的同時,重點量化AI系統在真實場景的效用價值,并長期捕捉Agent產品的關鍵突破。
紅杉中國推出全新AI基準測試xbench
界面快報 · 來源:界面新聞
新天鋼
296
- 美國ITC正式對為吸收式制冷系統使用的鍋爐保護產品及其組件和下游產品啟動337調查
- 乖寶寵物:股東擬詢價轉讓公司3%股份
評論
暫無評論哦,快來評價一下吧!