av便利店,俺也去网,亚洲色精品一区二区三区

隨著我國“人工智能+”行動加速推進，大模型技術在金融領域的應用持續落地。為全面評估金融領域大模型的專業、可靠程度，近日，上海財經大學推出的國內首個金融領域大模型評估基準升級為FinEval 6.0，新增了金融嚴謹性等維度并發布首份評測報告。FinEval 6.0對國內外主流大模型的評測顯示，螞蟻集團旗下理財AI“螞小財”的模型底座在金融嚴謹性等維度表現突出排名第一，跑贏了眾多通用大模型。

公開資料顯示，上海財經大學是國內最早開展金融領域大模型測評工作的高校，并在2024年參與制定了《金融大模型應用測評指南》，這是全國首個以金融業務能力為核心的團體標準。此次，上海財經大學結合對AI企業、金融機構的調研與投資者洞察，重點完善了FinEval 6.0的嚴謹性評測樣本，從金融學術知識、金融行業理解、金融嚴謹性測試、金融安全認知、金融智能體應用等關鍵維度，全面評估大模型在復雜金融業務場景中的表現。

同時，FinEval 6.0對國內外9款有代表性的大模型進行評測，包括DeepSeek-R1、GPT- 4o等通用基礎模型，以及金融垂直領域模型。評測報告結果顯示，參評模型在金融學術知識方面的表現整體優異，但在金融嚴謹性、金融行業理解等適配復雜場景的能力上表現各異。其中，理財AI“螞小財”的模型底座、螞蟻自研Finix大模型整體表現較好，總分跑贏了通用大模型。尤其在金融嚴謹性上，行業均值為70.27分，螞小財超出均值17分顯著領先。

官方數據顯示，“螞小財”是螞蟻集團旗下的AI理財管家，連接了螞蟻財富平臺生態內200多家基金公司、券商和財經媒體的內容與服務。在通用大模型的基礎上，“螞小財”技術團隊還搭建了一套金融智能增強的技術體系，實現了金融場景內專業功能、交互體驗的全面增強。

“金融領域是國內AI技術應用的焦點場景之一，但天然也對AI的專業性、嚴謹性等能力提出更高標準。目前國內AI在金融領域的表現逐漸提升，不斷從“博聞強識”走向“專業審慎”，為下一階段大規模應用打好了基本盤。”測評團隊負責人、上海財經大學教授張立文表示，這些“AI+金融場景”的積極穩妥探索，有助于在國際AI產業競爭中保持領先身位，也將打開我國數字金融、普惠金融建設的新局面。

簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

歷史搜索全部刪除

熱門搜索

上海財大發布金融領域大模型評測榜單：理財AI“螞小財”底座模型排名第一

評論

上海財大發布金融領域大模型評測榜單：理財AI“螞小財”底座模型排名第一