文|娛樂資本論 James
3月初,AI公司月之暗面(Kimi)據報完成了新一輪超過10億美元的融資,投資方包括紅杉中國、小紅書、美團、阿里等。Kimi引爆了資本市場的新一波熱情,甚至出現了“Kimi概念股”。
視智未來注意到,這輪融資進行時公司估值達到25億美元,意味著創始團隊在這一輪融資中出讓了 40% 的股份。換句話說,如果基于公開報道推斷,月之暗面創始團隊手里的股份有可能已經小于 50% 了。
這次陣勢極大的新融資,一舉將Kimi從原來的第二梯隊玩家,推進了中國大模型最亮眼的獨角獸行列;同時,也似乎把人們重新帶回了10年前一度暗淡下去的,那份對于中國互聯網行業黃金時代的回憶當中,尤其是擔心創始人稀釋的風險,有時甚至會喪失對公司的控制權。這種情況之前就頻繁發生在摩拜等共享單車領域,以及去哪兒、拉手網等競爭烈度極高且資金需求極大的領域。
跟那個時候相比,現在的國內各路資金,不論是大廠還是私募,確實仍然處于“缺錢”狀態。而AI公司特別是基礎大模型公司,跟之前那些燒錢換市場的“微創新”相比,又似乎是真的需要錢。
“我覺得他們幾乎拿走了市場上的所有資金。”面對視智未來采訪,規模較小的AIGC應用層創業者這樣說。
“我們還需要大量資金,10億肯定還不夠。”在面對視智未來提問時,Kimi相關人士這樣說。
風云變幻之間,原先以為斷崖式領跑的廠家們,現在再看似乎也沒有那么遙遙領先。初期“百模大戰”的浮躁褪去,仍有玩家在退潮后幸存,進入下一輪游戲,但他們沒人敢高枕無憂。
歷史確實不會重復,但是一直在押韻。Kimi帶來的熱度,是否意味著一個新的互聯網10年周期的開啟?
01 誰是真·長文本?
200萬字(token)的長文本處理能力,是月之暗面長期主打的唯一差異化定位。
對上下文長度的規模拓展(Scaling)已經迅速成為一種趨勢。中信建投研報指出,長文本能力能將大模型應用場景拓展至長文總結、劇情創作、代碼復現等復雜任務,且可以直接基于全文理解進行問答和信息處理,從而緩解大模型“幻覺”問題。
在Kimi穩定支持200k(20萬字)之前,其它模型的文本能力如下:
GPT-4從一開始的4k、8k拓展到了GPT-4-turbo的128k。
Claude2支持200k的輸入。
百川、零一萬物首次發布的模型也接近支持200k。
去年底,Gemini 1.5 Pro一次性將文本輸入長度拉到1m,但據第三方測試,效果很差。
在月之暗面“出圈”后,其他家在支持長文本方面的升級進度,幾乎在一夜之間趕了上來:
百度文心一言:200萬-500萬字;
360智腦:500萬字;
阿里通義千問:1000萬字;
巖山科技Yan自稱“無限長度”。
就在近期,阿里發布通義開源模型1.5的32B版本時,還引入了一個叫“大海撈針”的趣味能力測試,也就是在長文本中隨機放入與主題無關的文字,并讓大模型找出。他們說,這可以證明它并不是依靠自己的知識庫或者幻覺,而是依靠用戶提供的文本作答。
不過,當視智未來問到:“您怎么看待其他模型公司在發展長文本技術?”的時候,Kimi相關人士的回答充滿了領先的自信:“我們最近發現回應這個問題挺難的。你比如說,誰在發展長文本技術?(其他家)這些其實都不是真正的長文本。他們只是用技術術語說自己能做到而已。”
該人士提到,大模型基于前文來預測下一個字,前文越豐富,預測越準確。這里的“前文”就是預測的窗口。
“我們已經將窗口擴展到200萬。我們使用的是負注意力機制,進行全面采樣,不進行降采樣。他們還停留在8000字的限制,他們的模型基于這個范圍,從資料中搜索片段,拼合進8000字中,然后提供信息。”
“他們的模型缺乏足夠的上下文來回答問題,就像是考試時準備的小抄,可能有用,也可能沒有。我們的方法則是完整閱讀并理解每個字,然后進行交流和討論。”
Kimi 的 200 萬字長文本支持需要排隊申請內測
作為參考,阿里解釋它們對qwen開源模型采用了分組查詢注意力機制,用最通俗的話就是將輸入分拆成段,再組合理解。同類技術在將模型參數規模縮小,使之更為節能或可以端側運行時經常使用。
不管怎樣,模型支持長文本的綜合效果如何,還缺乏實際場景的證明。和當下的大模型基準測試一樣,長文本能力測試也是缺乏可信標準,處在自說自話的狀態中。
對于Kimi而言,在最終可用性上大幅拋離競爭對手,當然是它們要盡力追求的目標。但實際情況并不是那么涇渭分明。
即使是爭議最少的參照對象GPT-4,也偶爾會有“季節性倦怠”、“變懶”等不盡人意的時刻。將生成結果的用戶滿意度做到80%,和做到99.99%,是完全不同的兩碼事。
02 獲客成本很高嗎?
如果各家大模型在效果上很難做鮮明的區分,用誰都不會太好或者太差,那么營銷推廣就變成了重要的命題。自從春節前后,在B站、抖音等平臺上,以及機場、電梯里,好像到處都能看到大模型廣告。
例如,視智未來經常在電梯廣告看到下面這種投放:
智譜AI截止2023年已經獲得25億美元融資,它主要在電梯、公交地鐵、機場等戶外場合投放。與之相對,Kimi的主戰場是B站。
有人說:“像B站網頁端,我滑下來 10 個廣告有 9 個都是它,而且這個情況持續很多天了。”
“其實這是一個誤會。”Kimi相關人士告訴視智未來,目前B站的廣告投放可以選擇按安裝量效果付費,加上其它投放廣告的人少,也沒有出現太典型的個性化投放。“我們只花了一點點錢,它的算法也不足以將廣告足夠分散。”
資料顯示,B站的App下載廣告計費方式有CPM曝光計費、CPC點擊計費、OCPC點擊計費等。其中確實存在只有完成下載安裝才付費的模式。
Kimi目前客戶群體很大一部分是大學生,這與B站主流用戶群重合。“所以對我們來說,B站是個好的渠道。但我們不能讓它過度曝光,以至于大家產生反感。我們需要讓用戶了解并使用它,并保持用戶粘性。這是一個良性循環。不能讓已有的用戶每天打開就看到一大堆廣告,這會造成不好的體驗。”
在大量投放和媒體宣傳的共同作用下,Kimi獲得的成果也比較顯著,iOS客戶端一度沖進App Store 免費版應用的第五名,超越微信。3月21日,Kimi的小程序、App、網頁版一度宕機,官方解釋稱已經進行了5次擴容。
有數據統計,目前Kimi模型的日活躍用戶數已達100萬人(60萬在小程序,34萬在網頁端,還有5萬在App端)。此外,在iOS和安卓主要應用市場,每月Kimi下載量大約維持在1.8萬左右。
據Similarweb統計,月之暗面官網3月的月訪問量約為1220萬次
曾有媒體根據行業通用的估算方法,測算目前Kimi投放廣告的獲客成本約在10元,如果算上拉新后用戶問答互動產生的算力成本,每個用戶的獲客成本達到12-13元。按此計算,Kimi每天的獲客成本將燒掉至少20萬元。
前述相關人士對視智未來否認了任何推測Kimi獲客成本的說法。“他們基于的是行業內的成本標準,但他們不知道實際情況。”
03 算力,算力,算力
表面上,我們看到的是大模型的宣傳陣勢極大。但如果推廣成本也沒有太高,錢要花在什么地方呢?
在冰山隱藏于水面之下的部分,可能是更多的算力和數據成本。
3月,有消息稱微軟計劃在未來幾年為 OpenAI 投資 1000 億美元建設數據中心,這比當今一些最大的數據中心的成本高出 100 倍。
1000 億美元的投資,也已經是截止2020年,自動駕駛汽車領域投資的很多倍,也可能相當于Meta在元宇宙相關技術上的總投入。而這,居然僅僅是花到一個數據中心的項目上而已。
OpenAI和Meta等巨頭一直在為百億、千億、萬億美元級別的新融資奔走,奧特曼認為對芯片企業的投資額將會高達7萬億美元。這些數字就好像隨口一提一樣,即使它們可能已經是某個省份乃至國家的全年GDP。
人工智能的發展成本如此高昂,這還沒有提到算力是不能復用的,每次運行都會重新產生成本,以及購買語料數據等同樣需要錢。一個大模型開發商需要以上所有這些成本支出,這解釋了為什么投資者如此關心大模型企業的投資回報。
AI基礎設施正取得肉眼可見的回報,因此AI部門在綜合性大廠內,早期往往和云計算部門視為同一分支。假設大廠自己運營芯片或數據中心的供給,那么哪怕它們自己的大模型沒有一炮打響,至少也可以通過把算力賣給別人獲利。
但是月之暗面目前還不是這樣。它如何證明自身產品的實用性,以及在給基礎設施提供方轉移支付以后,還能保證自己和投資人的利益,目前還不清楚。
首先,Kimi很難自有算力。在3月份Kimi爆火宕機前后,一份關于Kimi的“專家交流紀要”流傳,其中提到公司使用字節的火山引擎來支撐訓練和運營,“公司不太可能私有化一個數據中心,供應鏈資源很難開拓,而且成本很高。”
火山引擎的官網將月之暗面列為案例
其次,大模型通用的準確性問題沒有解決。作為黑盒的大模型,使得判斷問題和缺陷,進而改善效果變得很困難。人們對聊天機器人答案的準確性提出了越來越多的質疑,而這種不確定性,在大模型浪潮持續一年后,已經顯著阻礙企業和消費者對AI服務的支出。
終端用戶們有的會使用ChatGPT+Kimi等多個模型交叉驗證,有的在讓其閱讀一本書時,將結論和引文,頁碼等一同輸出。但越是加入人工核驗,就越影響AI輸出內容的性價比。對于企業需要尋求自動化方案而言,假如大模型驅動的自動回復系統出現一次問題,就可以變為一場公關災難。
第三,Kimi不能一舉終結國內基礎大模型的競爭。它目前純靠提示詞(zero-shot)的編程能力跟智譜、文心等還有差距,規劃中的多模態還沒發布,付費API定價也高。
在文心、360智腦、通義等切入長文本之前,它們普遍談到長文本處理是通過消耗算力到單位內容上來實現的,技術含量沒有想象的那么有決定性。
視智未來也問到了Kimi何時切入多模態的問題,回答是:
“我們一直在做多模態,只是還沒到一個好的發布點。我們的策略是,必須有獨特的亮點才能發布。不可能發布一樣的東西。比如我們的Kimi發布時,它支持20萬字的上下文。我們不會發布市面上已有的一樣的東西。”
04 投資=投人
既然融資好處這么多,其它AI創業公司就沒有融資的想法嗎?
“我覺得他們幾乎拿走了市場上的所有資金。Kimi一輪融資就達到了7-8億美金。”時隔一年,秘塔科技COO王益為再次接受視智未來的專訪。本次專訪于3月30日晚8點在視頻號“娛樂資本論”全網首播。
“作為一個小公司,我們的資源和預算非常有限。我們不能像大公司那樣參與重大的競爭。確實,看到Kimi和智譜,我也很羨慕。如果我們有無限的資源,我們的策略會完全不同,我們可能更擅長口口相傳。”
秘塔的寫作貓及法律AI產品,之前已經引起了一些行業關注。2023年秘塔擁有超過1200萬注冊用戶,增長速度在AI創業公司中頗為引人注目。最近,秘塔又官宣了新產品“秘塔AI搜索”,它一次搜索生成的文本可以長達3000-4000字,實際上相當于“代寫論文”。
不過,在去年一年的AIGC狂飆突進中,秘塔沒有拿到任何新的資金。王益為感覺,他們和投資人之間多少有點兒“不對付”。
“我能理解投資者的觀點。我們的項目可能看起來有些不同尋常。我們既不是純粹的技術大模型公司,也不完全是應用型公司。或者說,我們和投資人的口味不一樣。”
“我和許多VC談過,他們有一種觀點很有意思。他們說我們沒有大牌科學家,我們的運營團隊看起來不夠豪華。在這種競爭激烈的環境中,我們公司的CEO雖然非常有實力和洞察力,甚至產品思維非常出色,但這似乎還不足以讓人相信我們能帶領公司走得更遠。”
“投資就是投人”曾經本來就是風投的其中一條規律,在模型效果缺乏客觀實際評判標準的時候,現在基本躍升為一條“鐵律”。
月之暗面有著極高的人才密度,公司員工也就100多人,其中北京總部的員工不到100人。但這些人當中,有在Google Scholar上引用次數過萬的聯合創始人,又吸納了大量參與過Google Gemini等重要大模型研發的人才,這讓它成為目前最有投資價值的大模型初創公司之一。
有報道稱,在楊植麟剛開始大模型創業時,大量VC曾試圖能夠在項目早期聯系上他,但他對投資方的選擇十分謹慎。除去后續的廣告鋪路,Kimi其實從一開始就可以說是“含著金鑰匙出生”。
視智未來報道過的另一家在融資方面比較順利的初創公司,是做文生3D的VAST AI。我們的報道提到,宋亞宸的招聘思路是從一開始去找行業內最核心的論文,然后把這些論文的一作、二作、三作找到,每天和他們聊公司業務規劃和行業進展。
宋亞宸自己每天前期花80-90%的時間在招人上,而且“只要最好的人”,因為“做更難的事,需要花最大的精力找同路的人。”因為創業團隊早期沒有露出,為了招聘到最頂尖的人才,去年8月份他爭取前往圖形學頂會SIGGRAPH做了主題演講,和IBM,英偉達,索尼等的高管同臺。
相比之下,秘塔的聯合創始人們有北大校友提供的法律應用資源,但在團隊整體履歷上確實沒法跟獨角獸們比。
“那我們能做什么呢?只能一點一點證明自己。現在我們又進入搜索領域,也是要靠優質體驗打出名聲,讓投資人相信這件事,而不再質疑我們在面對百度和阿里時該怎么辦。我們能做的就是堅持。”王益為說。
05 退出的方式
隨著公司估值的提升,未來Kimi如果需要進一步融資,可能會面臨更高的估值要求,和更大的股權稀釋風險。現有投資方也擔心如何退出的問題,因為他們占有的股份這么大,要是不上市,就沒什么好辦法了。
除了極少數專注于投融資的評論者,似乎沒人意識到,Kimi這輪融資,在如此早期就出讓這么大比例的股份,從以往的案例來看是不尋常的。回想科技創投剛剛在中國興起的2010年代,如果像去哪兒一樣,投資人理論上可以隨時踢掉創始團隊選擇被并入其他巨頭;如果公司經營不佳,創始團隊也可以如拉手網的吳波般開新公司。
“關于這個事情,它在當代并不重要。”Kimi相關人士對視智未來說道,“京東等大廠創始人手持的股份可能連10%都不到。最重要的是什么呢?是要獲得資本,用來實現這個項目。這可能是更關鍵的事情。”
這也確實是以Kimi融資為代表的這一輪AIGC融資熱,跟歷史相比不同的地方。看看國外Anthropic、Mistral AI、OpenAI等AIGC獨角獸企業的股權結構,可說是一個比一個特殊。
Anthropic擁有谷歌和亞馬遜的“雙料投注”。Mistral AI在成立后的半年多時間里,接連完成了1.05億歐元種子輪融資和后續的4.15億歐元融資,微軟也對其進行了1500萬歐元的投資。
OpenAI的實體是一個為了“全人類共同利益”成立的非盈利機構(雖然咱也看不出它哪兒非盈利了),微軟持有49%的股份,其他VC各持49%,OpenAI基金控制剩余2%。之前深度參與的馬斯克似乎在一次次跟團隊的紛爭中被徹底踢出了公司,在他“起訴”OpenAI時,對方的回應是,認為他眼紅自己走后公司的發展成就,想回來分得一杯羹。
通過同股不同權、反稀釋條款等方式,這些公司都在想辦法維持控制權,同時拿到最多的錢。但是歸根結底,這里面起到最大控制作用的變量,是創始團隊本身。
OpenAI“宮斗”期間,奧特曼一度不得不戴上“訪客”工牌才能進入他的公司
實際上,相關的故事已經在AI界上演過。去年11月OpenAI經歷大震動,Sam Altman有整整一周時間“被踢出”公司。此后,我們又看到蘇萊曼的Inflection AI被微軟“吸血丟殼”,核心團隊跑去了微軟,留下投資人手里拿著“殼”和有限的補償。
Inflection AI 被微軟“雇傭式收購”,是一個意料之外,情理之中的結局。Pi.ai 雖然很獨特,但怎么看都無法獨立生存。然而,它原本的“殼”已經在此前的融資狂潮中被各種股東深度綁定,想跑可沒那么容易。放到10年前的上一次投資狂熱中,這樣騎虎難下的公司可能難以如此體面地退場。
這些在AI業界不斷上演的劇本,再次證明了現階段“投資就是投人”的鐵律。在投資環境惡劣時,資方和創業者之間缺乏互相了解,投資人急于投出錢,卻又對選擇標的畏首畏尾。
融資過程中的“主動PR”,一般來說目的有兩個:為正在進行的談判創造有利條件;吸引更多資方參與投資。而融資消息本身,也是一次好的PR機會。
通過海量投放和消息轟炸打出聲量,Kimi這樣的獨角獸新貴既可以讓自己穩穩躋身“第一梯隊”,也為之后找大客戶打下良好的認知基礎。
不管用什么方式,在它一旦可以證明自己之后,投資人“等待出手”的勢能,就會在它身上充分釋放,轉化為“害怕錯過”。