文|雪豹財經社 閆學功

AI時代最開放的大模型——12月1日,阿里云CTO周靖人在發布會上對通義千問提出了這樣的期望。一個月前的云棲大會上,他也同樣將阿里云定義為“AI時代最開放的一朵云”。
這一天,阿里云開源了通義千問720億參數模型Qwen-72B,這也是目前國內大模型開源的最大參數。至此,通義千問共開源了18億、70億、140億、720億參數的4款大模型,以及視覺理解、音頻理解兩款多模態大模型——阿里云稱之為“全尺寸、全模態”開源。
今年4月發布的通義千問,從8月起正式走向開源之路。據阿里云披露,截至10月末,旗下開源社區“魔搭”已有超過2300個模型,開發者超過280萬,模型下載次數破億。
開源是阿里云大模型最重要的戰略,但這在業內并不常見。
不論國外的ChatGPT,還是國內的文心一言,都是閉源形式。在半個月前,全球知名的人工智能科學家沈向洋在一個行業論壇上談及大模型開源閉源路徑之爭。他認為,業內第一名一定是閉源,第二名他仍然躊躇不定,第三名才會是開源。
當時,周靖人就坐在臺下。
在12月1日的發布會上,周靖人正面回答了阿里云一定要做開源的原因。“阿里云的初衷不是把模型攥在自己手上去商業化,而是幫助開發者,開源的策略與阿里云的初心完全一致。”在他看來,要在當下突破和創新大模型核心技術,開源是“最佳也是唯一的途徑”。
巨頭們爭相布局的大模型,想象空間到底有多大?
10月下旬,聯想展示了AI PC(人工智能個人電腦)功能,聯想集團董事長兼CEO楊元慶暢想未來“每個人都能有個人大模型”。周靖人則描繪了更具體的圖景:“大家可以想象今后每一個電子設備、生活的環節,從你早上醒來第一聲鬧鐘開始,背后都有大模型的支持。”
他甚至表示,不遠的將來,阿里云再舉辦溝通會,他希望全程用通義千問來回答問題。
大模型未來能為行業和社會帶來什么?目前國內有200多個大模型,未來生態將更繁榮還是迅速洗牌?通義千問與ChatGPT目前差距多大 ?令人振奮的超級人工智能(AGI)時代何時能夠到來?
就上述問題,12月1日,阿里云CTO周靖人在通義千問發布會后做了一場閉門分享,雪豹財經社也受邀參與,以下是對話實錄(內容經摘編):
通義千問和ChatGPT 4.0互有勝負
Q:阿里云在三季報發布后宣布,堅持更長期的投入及優先公共云的戰略調整,大模型是否會有相應的策略調整?
A:我們從年初發布至今整個策略都沒有變化,即一方面做技術的突破,另一方面做生態,提供模型的能力。阿里CEO吳泳銘提出的戰略調整,也跟整個大模型社區的發展方向非常吻合,沒什么具體的差異。公司最近會把技術工作路線更加明確下來。
Q:很多大型廠商選擇了不開源,阿里云為什么要選擇開源模式?
A:我認為是大家站位不同。在過去10年內,整個開源社區蓬勃發展,今天我們要讓更多技術和更多人參與進來。開源社區是最佳的、也是唯一的途徑。只有真正從心底去擁抱開放的生態,去促進開發者社區的發展,才能將我們的技術融入到各行各業,最終幫助整個核心技術的突破和創新。
阿里云的初衷不是把模型攥在自己手里,或者做商業化,而是幫助開發者。我們的開源策略,跟整個阿里云的初心是完全一致的。因此,我們不光在模型方面開源,數據庫、技術等也都貢獻到開源社區。今天AI的發展,一定不是由一家公司完成的。不管誰有最強的模型,如果沒有開放的技術和經驗,是無法在各項應用場景中落地的。
Q:在大模型能力上中國企業和美國企業的差距是什么?
A:科技創新上,原則上是大家你追我趕,都在做非常中長期的一系列探索,在這個時間點或許有差距,但也許差距在縮小,甚至扭轉也有可能。這就是科技創新的魅力。
我們能看到(和ChatGPT)之間有一定差距,還有需要提升的空間,但是不能妄自菲薄。比如多模態等,國內很多產品也能做到ChatGPT的水平,甚至超越它。通義千問和ChatGPT 4.0在使用體感上,是互有勝負的。
Q:通義千問與其他閉源模型相比水平如何?
A:講到評測指標,國外的Hugging Face在全球比較有影響力,它有一系列測評標準,會展現一個客觀的評價。當然,不是所有閉源模型都會參與測評。在Hugging Face上,我們在開源14B的時候是非全模型排名第三,72B發布之后我們會繼續等待測評。我認為我們可能會登頂。
編者注:Hugging Face是全球最大的開源模型公司,它發布的各項關于AI公司的榜單在業界有一定影響力。《時代周刊》今年首次發布的全球百大AI人物中,有兩位來自Hugging Face。
Q:Open AI 最近選擇了Agent作為下一步開發方向,你們有什么思考和跟進?
A:Agent這個概念不是Open AI最近提出的,但它是一個非常重要的模型利用的領域。目前我們社區已經貢獻了很多關于Agent的開發和創新,接下來每個月都有相關進展,包括如何幫開發者搭建這樣一個Agent,也會有一些新的功能推出。
編者注:Agent可以理解為“智能業務助理”,它具有人類的思維,在大模型技術驅動下,以自然語言為交互方式,高自動化地執行和處理專業或繁復的工作任務。
AI時代:大模型將改變日常生活
Q:聯想未來將會發布與阿里云合作完成的AI PC(個人電腦),大模型會給PC帶來哪些實質性影響?
A:與聯想的合作是一個良好的開端。我們希望不單單是在復雜和昂貴的機器上使用模型的能力,而是把它帶到各種端。當我們真正進入AI時代,大模型將改變日常生活,模型服務在各個領域無所不在。今后每一個電子設備和生活環節,從早晨的鬧鐘開始,都會有模型的支持。我相信很快會進入這樣一個時代。
Q:未來是否會和更多硬件廠商進行合作?
A:目前已經有不少硬件廠商在洽談,我們的心態是非常開放的。之所以開源,就是為了不局限于某一個或某幾家廠商,而是有更多開發者和硬件廠商一起來參與、推動。
Q:怎么看待大模型在C端和B端商業變現的機會和價值?
A:我們要做是生態的方方面面,所以當前更加關注的是模型本身。在to C和to B方面應用的探索會有一些,但還沒有到井噴的狀態。模型的應用是沒有to C和to B之分的,但我們也希望模型的能力能夠滲透到日常生活和工作學習中。接下來會看到一些創新,也許今后幾個月,我們就會聊到一系列應用,以及如何幫助到to C和to B的產品。
Q:阿里云認為實現AGI還要多久?
A:AGI已經成為社會性的話題,有各種各樣的解釋。但我認為現在談AGI還太早,因為還有很多技術難題,還有很多長足的工作要做。由于ChatGPT的爆發,讓一年前不怎么關注人工智能的人現在都在關注,我作為技術工作者感到欣慰。但從整個技術發展來看還需要很多時間,請大家給予更多耐心。不要今天關注一個熱點,3個月沒爆發,大家就淡忘了。
編者注:AGI可以理解為超級人工智能,Open AI將其作為最終目標并寫在公司白皮書中。它如此定義AGI:“一個高度自治的系統,能在多數有經濟價值的工作上超越人類。”
Q:通義千問會將技術產品優化和商業化落地當成重點,還是像Open AI一樣將AGI當作愿景?
A:我們做的工作其實是沒有人指引的。通義千問首先是追求技術的卓越和極致的技術探索。如何能夠把模型的方方面面提升起來?這本身就是一個研究課題,這方面一定是我們接下來的工作重點。
但在這個時代,科研、技術、產品這幾個維度是更有機地聯合在一起的,沒辦法像以前分得那么開。光埋頭苦干做研究,不做技術產品、不做技術生態,在今天也不行。這就是為什么通義千問是一整個通義模型家族。我們不斷追求技術突破,同時也開源自己的模型,幫助整個生態繁榮。我們還做產品,包括通義千問App、網頁版產品。
200多款大模型的優勝劣汰
Q:通義千問在技術上還面臨哪些挑戰?
A:整個大模型還處在發展初期。不管誰家的大模型,都還有很多提升空間。今天的模型具備視覺、聽覺的能力,但如何像人一樣思考、去識別萬物,所有大模型都還有一定差距。通義千問產品這次推出了視覺模型能力,對圖片的理解在很多層面是超過ChatGPT 4.0的,但距離人類的認知能力還有一定差距。
如何讓這個模型有更多思維能力、像人一樣去思考,這方面才剛剛起步。我們當前有非常多要解決的技術難點,這也是為什么接下來每個月都會有一系列技術突破。整個通義千問模型的升級能力遠遠沒有結束。
Q:實現了從0到1后,是創新更重要,還是推廣產品更重要?
A:追求技術的卓越一直是阿里云的初衷。在一定程度上,所謂從0到1和從1到2沒有本質區別,都是在做突破。從0到1非常難,因為要探索一條新的道路。但繼續把產品技術打磨好,每提高一個百分點,其實也隱藏著非常多的技術難題和投入。
Q:上一次開源14B反響不錯,為什么要再去開源更高的72B?哪些場景是14B無法解決的?
A:14B是一個非常好的起點,但模型的能力還在不斷發展中,創新技術的突破一直沒有停止過,14B更往上還有很多提升的空間。這是推出72B模型的初衷,今后14B和7B也會有升級的版本出來。
在不同的企業和不同的開發環境,大家對模型的尺寸、能力及背后使用的資源有不一樣的考慮,有時會追求極致的性能。我們不應該用一個模型、一個尺寸,要求大家對接所有的場景,而是應該把選擇權留給開發者和企業。
Q:國內已經發布了200多個大模型,需要這么多嗎?合理的生態是什么樣的結構?
A:任何一項技術都有一個蓬勃發展并快速迭代的周期,最終也可能受技術、商業等各方面的約束而收斂。生態的好處,就是它自己會收斂到合適的局面。
今天我們有200多款大模型,能夠感受到科技界積極擁抱的態度。今年1月時大家還感覺很消極,覺得跟海外差距很大,到12月已經沒有這樣的感覺。我相信整個市場、整個生態也會進行優勝劣汰的選擇,也會收斂到更完整、完善的狀態,這就是生態的魅力。