界面新聞?dòng)浾?| 肖芳
界面新聞編輯 | 文姝琪
繼上線高考志愿大模型之后,夸克AI搜索又接入了自研的健康大模型。
夸克健康大模型是以通義千問(wèn)為基礎(chǔ)訓(xùn)練出來(lái)的垂類模型。夸克健康算法負(fù)責(zé)人徐健對(duì)界面新聞表示,在訓(xùn)練過(guò)程中,技術(shù)團(tuán)隊(duì)不只是訓(xùn)練AI做簡(jiǎn)單的醫(yī)學(xué)問(wèn)答,而是希望AI學(xué)會(huì)整體的診療思維。
徐健表示,健康大模型背后的技術(shù)策略包括三個(gè)方面,第一是構(gòu)建優(yōu)質(zhì)的大規(guī)模數(shù)據(jù),這是模型知識(shí)性的底層;第二是正確性對(duì)齊及循證的技術(shù),可以系統(tǒng)解決好正確性方面的問(wèn)題;第三是醫(yī)療慢思考推理能力的建設(shè),通過(guò)它解決復(fù)雜問(wèn)題。
在垂類模型與通用模型對(duì)比中,夸克健康大模型呈現(xiàn)出在復(fù)雜問(wèn)題中表現(xiàn)更好于通用模型的趨勢(shì)。其中,在主任醫(yī)師級(jí)別的性能測(cè)試中,夸克健康大模型回答的正確率為67.7%,DeepSeek-R1和GPT-o3-mini的正確率分別為38.7%和35.5%,而在初級(jí)醫(yī)師級(jí)別測(cè)試中,夸克健康大模型和DeepSeek-R1的正確率均超過(guò)80%,GPT-o3-mini的正確率也超過(guò)了70%。
徐健告訴界面新聞,夸克健康大模型在性能測(cè)試中能夠更好地回答復(fù)雜問(wèn)題,并不是一口氣就做好的,而是經(jīng)歷了一個(gè)長(zhǎng)期迭代。這個(gè)過(guò)程中,研發(fā)團(tuán)隊(duì)主要在數(shù)據(jù)分類和評(píng)估、語(yǔ)料探查技術(shù)和時(shí)效性更新技術(shù)三方面的投入,提升數(shù)據(jù)建設(shè)能力。
由于醫(yī)療的問(wèn)題的嚴(yán)肅性,夸克在健康大模型還對(duì)用戶問(wèn)題進(jìn)行產(chǎn)品上的分層處理,對(duì)偏嚴(yán)肅醫(yī)療方面的問(wèn)題進(jìn)行明確界定。“在產(chǎn)品上線前,我們針對(duì)回答效果進(jìn)行了評(píng)價(jià),在滿意度、準(zhǔn)確度達(dá)到90%以上才會(huì)上線。”夸克健康運(yùn)營(yíng)負(fù)責(zé)人趙存忠對(duì)界面新聞表示。
接連推出高考志愿大模型和健康大模型,夸克AI業(yè)務(wù)的發(fā)展意圖不再局限于搜索,而是通過(guò)優(yōu)質(zhì)內(nèi)容吸引新用戶并獲得更好的用戶留存。夸克健康產(chǎn)品負(fù)責(zé)人姚垚向界面新聞透露,夸克每月有2000多萬(wàn)的用戶會(huì)問(wèn)健康問(wèn)題,是非常大的比例。
趙存忠對(duì)界面新聞表示,夸克健康服務(wù)目前不考核商業(yè)化指標(biāo),考核的核心是對(duì)用戶需求回應(yīng)的滿意度,包括用戶的滿意度指標(biāo)、用戶留存指標(biāo)等多個(gè)維度。“如果真正解決了用戶的需求,用戶留存肯定是有增長(zhǎng)的,過(guò)了半個(gè)月或者一個(gè)月遇到新的健康問(wèn)題,肯定還會(huì)來(lái)搜索。”
在今年高考報(bào)志愿期間,夸克推出高考服務(wù)。官方公布的數(shù)據(jù)顯示,夸克高考服務(wù)4000萬(wàn)用戶,生成超1200萬(wàn)份“志愿報(bào)告”。但高考服務(wù)的目標(biāo)用戶以及使用的周期都比較有限,相比之下,健康服務(wù)能夠服務(wù)的用戶規(guī)模和頻次都更高。
在阿里AI的新戰(zhàn)略下,夸克承載了“AI to C”的部分,也承擔(dān)了更大的用戶增長(zhǎng)壓力。但在當(dāng)下的市場(chǎng)格局下,搜索引擎不僅面臨著抖音、小紅書(shū)等內(nèi)容社區(qū)的挑戰(zhàn),也面臨著各類AI助手的分流。
夸克打出了AI搜索的牌,還需要提供更多差異化的能力,垂直模型和Agent服務(wù)是夸克重點(diǎn)的差異化探索方向。
徐健告訴界面新聞,學(xué)習(xí)和醫(yī)療是夸克的兩個(gè)重要戰(zhàn)略賽道,夸克通過(guò)垂直模型提供服務(wù)。在其他領(lǐng)域,目前夸克主要通過(guò)通用大模型來(lái)回答這些問(wèn)題。“從技術(shù)原理角度來(lái)看,做垂類模型還是希望基于非常好的通用模型,不可能只會(huì)醫(yī)療別的不會(huì)。”
從目前的用戶增長(zhǎng)來(lái)看,夸克的差異化競(jìng)爭(zhēng)路線獲得了一定的成效。AI產(chǎn)品榜的數(shù)據(jù)顯示,今年6月,夸克以1.56億月活用戶超過(guò)豆包、DeepSeek等應(yīng)用,成為國(guó)內(nèi)總榜的第一名,月活用戶環(huán)比上月增長(zhǎng)2.51%。
從長(zhǎng)期來(lái)看,夸克仍需要穩(wěn)定的服務(wù)能力讓自身保持持續(xù)的競(jìng)爭(zhēng)力。