文|新火種 文子
編輯|小迪
短短12天連放三次大招,谷歌AI更新迭代之快,讓人始料未及。
當地時間2月21日,谷歌毫無預兆地發布號稱“全球性能最強大、輕量級”的新一代開源系列模型Gemma,瞬間打響AI開源戰爭。
據官方介紹,Gemma模型使用了和Gemini同源的技術,總共有20億參數和70億參數兩種規模,每個規模又分預訓練和指令微調兩個版本。
其中20億參數版本可以直接在筆記本電腦上運行,而70億參數版本在一系列語言理解、推理、數學等標準測試上擊敗了主流開源模型Llama-2和Mistral,一度登頂Hugging Face開源大模型排行榜,成為目前全球最強的開源大模型。
可見,谷歌除了將目光瞄向山姆奧特曼的GPT-5以外,也沒打算放過針對扎克伯格的Llama-2,先后推出的Gemini和Gemma都是對標產品。
而和Gemini的全家桶路線不同,Gemma這一次主打輕量級、高性能,除了筆記本電腦電腦,還可以在臺式機、物聯網設備、移動設備和云端等不同平臺運行。
除了模型本身,谷歌還提供了一整套工具幫助開發者,確保Gemma模型負責任的使用,幫助開發者用Gemma構建更安全的AI應用程序。
按照谷歌CEO 桑達爾·皮查伊的說法,Gemma即日起就將在全球范圍內開放使用,用戶可以在Kaggle、Hugging Face等平臺上進行下載和試用。據一位X平臺的用戶分享,Gemma不僅速度飛快,而且輸出很穩定。
值得注意的是,谷歌目前已與英偉達達成戰略合作,將利用英偉達TensorRT-LLM對Gemma進行優化。同時,英偉達剛剛發布的聊天機器人Chat with RTX也將很快增加對Gemma的支持。
技術報告首度曝光,31人來自亞洲
與Gemini發布時一樣,谷歌此次也同步公開了Gemma的技術報告。
報告稱,Gemma數據主要來自網絡文檔、數學和代碼的英語數據。不同于Gemini,這些模型不是多模態的,也沒有針對多語言任務進行訓練。而且谷歌保證了兼容性,它分割數字但不去除額外的空格,這可能意味著它更容易擴展到其他語言。
不過Gemma也并不是完全“開源”,雖然Gemma模型在性能、安全性和負責任開發方面實現了突飛猛進的進展,但谷歌承認“此發布是不可逆轉的”,并且開放模型造成的危害尚未明確定義。
因此谷歌仍然可制定使用該模型的條款及所有權條款,也會進一步研究并創建可靠、按預期執行的穩健、安全的模型。
此外,根據技術論文顯示,此次參與谷歌Gemma開源模型的研發人員數量高達57位。其中包括核心貢獻者14人,參與者35人,產品管理2人,項目管理1人,執行贊助人5人。
根據研發者名字進行梳理和猜測,此次參與Gemma模型研發的57人中,可能有大約一半以上的開發者來自亞洲,或與華人或具有華人血統的個人有關。
比如谷歌Gemma團隊的侯樂博士曾是谷歌FLAN-T5技術的作者。在加入谷歌之前,侯樂在紐約州立大學石溪分校攻讀博士學位,專注于高分辨率圖像的分析,涵蓋衛星圖像和醫學圖像等領域。加入谷歌后,侯樂研究主要集中于NLP方面,包括高效的語言模型訓練、指令微調和提示工程等,核心能力是通過更好的微調和提示工程來提高最先進語言模型的推理能力。
另一位華人Geng Yan同樣也是AI領域大神級人物。他畢業于浙江大學計算機科學系,隨后在美國美國卡內基梅隆大學完成計算機視覺專業的碩士學位。Geng Yan曾就職于商湯和亞馬遜,專注研究人工智能機器算法技術,在谷歌曾參與研發Google Facemesh追蹤面部的AI模型,該模型在谷歌相機自拍、手機支付等多個場景中均發揮巨大作用。
截至目前,開發者可以在Kaggle中免費使用Gemma,首次使用Google Cloud 的用戶將獲得 300美元的積分,并可申請高達50萬美元的Google Cloud積分來使用這些模型。
此外,谷歌的Google One AI Premium正在將Gemini整合到谷歌Gmail、Docs、Sheets、Slides和Meet當中,提供書寫、校對和生成圖像等 AI 增強功能。而作為賬戶付費產品,前兩個月免費使用,之后每月19.99美元。
全球四面開戰,谷歌野心暴露無遺
可以說,谷歌想要成為AI行業王者的野心已經暴露無遺。
2月9日,谷歌宣布最強大模型Gemini Ultra免費使用,向OpenAI發起強勢一擊。2月16日,谷歌放出大模型核彈Gemini 1.5,將上下文窗口長度擴展到100萬個tokens,向OpenAI還沒發布的GPT-5發起挑戰。再到2月21日,谷歌發布Gemma瘋狂狙擊Mate,一舉登上開源大模型鐵王座,為生成式AI的應用開發者帶來福音,更為閉源的代表OpenAI狠狠地上了一課。
OpenAI CEO山姆奧特曼就曾在私下表示過,與谷歌相比,OpenAI在算力上處于劣勢。無論是在算力、算法,還是數據方面,谷歌都具有很明顯的技術領先優勢。
而這一次的谷歌,也的確有拳打OpenAI,腳踢Meta的風范。尤其是近兩年來,頭部科技大廠你追我趕,廝殺異常激烈。前有閉源代表OpenAI推出的GPT-4 Turbo大模型,后有Meta大力進攻開源權重模型,留給谷歌的時間本就不多了。
按照谷歌開發者 X 副總裁兼總經理、谷歌開發者關系主管Jeanine Banks的說法,Gemma模型就像是谷歌開源AI開發技術歷史的延續,從TensorFlow等工具開始,經過PaLM2、AlphaFold的演進,最終形成了Gemma。
目前擺在Gemma面前的競爭對手有Meta的開源大型語言模型 Llama 2、Mistral AI 的7B 模型、Deci的DecilLM和Microsoft的Phi-2,以及旨在在組織自己的硬件上運行的類似小型生成式 AI 模型。可以說,憋壞了的谷歌正在四面開戰了。
接下來,就看剛剛跌落神壇的Meta會如何接招了。