界面新聞記者 | 姜菁玲
5月6日,科大訊飛正式對外發布了訊飛星火認知大模型,并公布了基于大模型的“1+N”產品路徑,“1”指通用認知智能大模型,“N”指大模型在教育、辦公、汽車、人機交互等各個領域的落地。
發布會現場,科大訊飛提取出了訊飛星火認知大模型的七大核心能力,即文本生成、語言理解,知識問答、邏輯推理、數學能力、代碼能力、多模態能力。
界面新聞記者從現場看到,訊飛大模型能夠較好地完成中英文論文、品宣文案、以及故事內容等內容形式的撰寫。

同時,該大模型能夠在中文特殊語境下表現良好,可以對俗語進行解讀,能夠有“情商”地回答情感問題。輸入一個中學水平的數學題,AI能夠迅速完成常規計算、幾何、情景應用等問題的解答。
大模型支持多模態,能夠支持對英文菜單圖片進行直接翻譯,用自然語言輸入要求,即可生成一個虛擬人實時播報的視頻段落。

值得注意的是,與其他大模型廠商不同,除了強調訊飛大模型將對開發者進行開放,訊飛著重公布和介紹了大模型在訊飛內部產品體系中的落地運用。
根據科大訊飛董事長劉慶峰的介紹,訊飛大模型將重塑訊飛辦公、教育、醫療、汽車、人機交互等業務,大大提升原有業務的實際效果。
教育業務方面,搭載大模型后,AI學習機能夠像老師一樣批改作文,像口語老師一樣實景對話。相比于傳統學習機只能針對字詞標點糾錯、識別句式修辭錯誤這些基礎批改,AI學習機能夠圍繞寫作要求、分析全篇結構和文采的深度高階批改。
辦公方面,訊飛原本的傳統業務語音轉寫,搭載大模型后,能夠實現自動會議紀要,并且將冗雜的錄音轉寫后進行語篇規整,并且根據指定的主題,一鍵生成新聞稿或其他內容類型。
并且,基于大模型,訊飛還對外展示了任務執行方面的功能,基于自然語言生成業務流程和 RPA,幫助企業員工完成大量重復性工作。現場以公司招聘事項為例,輸入指令后,系統即可自動按照事先設計的RPA腳本,操作計算機中的相應軟件,實現業務流程的自動化操作并輸出結果,還能進行數據分析。
劉慶峰在采訪中提到,整體看,訊飛在長文本生成和數理能力方面有一定優勢。在長文本生成上,大模型在國內明顯領先,在中文方面超過了ChatGPT,英文方面則還有一定差距。
科大訊飛研究院院長劉聰告訴界面新聞記者,相比于阿里以及百度等公司,科大訊飛在大模型算法上具有一定優勢,訊飛自2014年從“訊飛超腦”計劃開始在大模型上進行投入,團隊經驗相對成熟。另外,由于訊飛此前將教育、醫療等垂直行業列為根據地,因此在相關行業累積了大量數據,并且訊飛開放平臺以及重要的專業機構合作,為訊飛大模型提供了大量且專業的中文訓練語料。
不過,劉慶峰直言,當前大模型技術仍有待攻克的缺陷,比如新知識難以及時更新、事實類問答容易“張冠李戴”,史實、傳統典籍等容易“編造情節”等,但這些問題在今年會有明顯的改進。
同時,劉慶峰公布了年內大模型技術持續升級的三個關鍵里程碑節點:6月9日,將突破開放式問答、多輪對話能力明顯提升、數學能力再升級;8月15日,代碼能力升級以及多模態交互能力提升;10月24日,將實現通用模型對標ChatGPT,中文超越ChatGPT的當前版本,英文能做到相當水平,并在教育、醫療等領域做到業界領先。