界面新聞記者 | 查沁君
教育公司也“卷”入了大模型浪潮中。
7月26日,網易有道(NYSE: DAO)正式對外發布國內首個教育領域垂直大模型“子曰”,并推出基于“子曰”大模型研發的六大應用——“LLM翻譯”、“虛擬人口語教練”、“AI作文指導”、“語法精講”、“AI Box”以及“文檔問答”。
目前,AI Box和文檔問答已經在有道翻譯中上線,口語教練、作文輔導和語法精講下月初搭載在新學習硬件上線,大模型翻譯將在今年三季度上線。
大語言模型誕生于2018年,谷歌的BERT是最早模型,自去年11月ChatGPT將大模型產品化后,它開始展示巨大的革命性力量,一時間,大模型成為全新風口,國內外巨頭相繼涌入。
“每個月、每個星期都刷新行業對AI技術未來可能性的想象。”網易有道CEO周楓在發布會現場表示。過去半年,其團隊也在持續進行產品研發和迭代,并推出一系列小規模用戶實驗。
在他看來,大模型給教育領域帶來的最大機會,就是助力因材施教,包括以下三大關鍵機會:
第一,個性化分析和指導。大模型具有強大的生產能力,且能進行定制化的反饋,比如面對一道作文題,大模型在理解題目含義后,可給出寫作指導,也可以對學生的寫作進行個性化的反饋。
第二,引導式學習。通過不斷提問,讓學生培養自我學習的能力,提高批判化思維。
第三,全學科教學。通過掌握海量知識,從而實現跨學科的搜索和語言生成能力。
相比通用大模型,“子曰”大模型的定位是以“場景為先”的教育垂類大模型。作為基座模型支持諸多下游任務,向所有下游場景提供語義理解、知識表達等基礎能力。
發布會現場,有道詞典業務負責人與虛擬人口語教練Echo進行了對話,Echo能根據對話者的發言和對上下文的理解,及時反饋。對話結束后,Echo還會給出發音、語法等建議。
周楓在群訪中坦言,對這位口語教練“寄予厚望”,畢竟其背后指向的是口語陪練這個百億市場。該項目采取會員付費制,較真人口語教練花費更低。
AI口語陪練并非新事物,大模型出現以前,就已有大量相關產品,基于大模型的虛擬人口語陪練有何不同?
“以前AI口語陪練產品所給出的對話,是基于提前設定的模板,AI基于模板進行微調,給出對話內容。”網易有道首席科學家段亦濤在群訪中解釋,大模型的生成能力更強,并具有了一定的推理能力。
不僅如此,周楓還透露:“內部調研中,‘子曰’大模型的翻譯能力已經優于ChatGPT、超過了市面上所有主流翻譯引擎。”
但“子曰”大模型翻譯目前僅支持中英文互譯,尚未開發其他語種。“很重要的原因是大模型引擎的計算量大,比原有引擎貴20倍。”周楓稱。
這指向了大模型背后的一個關鍵問題,即投入產出比和商業化。
相比接入通用大模型,自研模型在數據采集和處理、訓練資源和時間、算法和模型架構、模型評估和調優上,所耗費的成本和資源是一筆不小的賬單。如果不能有效完成商業化,則很難收回成本,后續的迭代、更新、升級更是難題。
恰逢近日Meta宣布將推出開源大型語言模型Llama2,免費用于研究和商業用途。這意味著,企業和個人可以在Llama2的基礎上以較低的成本開發自己的專屬大模型。
“這也是我們內部非常關心的問題,我們非常擁抱開源?!敝軛髟谌涸L中稱,“但我們做AI的重點,永遠是盯著最后的應用落地?!敝赃x擇自研,也是因為現有模型暫時不能滿足需求,尤其是像語法、答疑等深度需求。不排除“哪一天開源項目很成熟,我們也會用”。
周楓還認為,世界上大部分的大模型都將會免費,因為其邊際成本非常低,復制模型其實不需要成本。商業公司會從多個角度推動大模型免費、開源,比如為了增強公司影響力、構建生態,或者純粹為了惠及公眾。
在這趟由大模型驅動的新一輪“AI技術快車”上,網易有道并非唯一的教育企業。
在國外,可汗學院、多鄰國(NASDAQ:DUOL)、Chegg(NYSE:CHGG)等教育機構相繼宣布推出接入GPT-4的學習輔助工具,且有一定的商業化考量。
以多鄰國推出的新產品“Duolingo Max”為例,Max訂閱服務收費30美元/月、168美元/年,目前僅限于iPhone平臺,主要面向學習西班牙語和法語的英語用戶。
在國內,和網易有道一樣,好未來(NYSE: TAL)瞄準的也是垂類大模型,并利用自身基因和資源強項,研發數學大模型MathGPT,預計于年內推出基于該自研大模型的產品級應用。
周楓也提到研發數學大模型的難點所在,“數學光喂內容沒用,因為它是原理問題,現有技術沒法做到套一下就能使用(的地步)?!毕喾?,如果是文字語言型的應用,不需要特別強的推理。
近日,美國研究人員評估了ChatGPT模型在不同時期版本的表現能力,發現GPT-3.5和GPT-4的某些性能正在變差,尤其是GPT-4求解數學問題的能力,GPT-4在3月表現出的97.6%準確率到6月降至2.4%。
科大訊飛(002230.SZ)也于近期對外展示其自研的“星火認知大模型”,明確將通用AI大模型的能力推向學習機、錄音轉寫工具“訊飛聽見”等產品,上線了中英文作文類人批改、數學類人互動輔學、英語類人口語陪練等功能。
6月初,作業幫也傳出消息,稱其研發的教育大模型在內測階段,正在進行相關評估及備案等工作。
無論是教育垂類大模型的研發,還是通用大模型在教育領域的落地,都并非易事,不僅需要強大的技術實力,還需要雄厚的資金投入。對于尚處早期的大模型來說,跑通商業模型尚需時日,這也意味著,教育企業在相當長的一段時間內還難獲得回報。