妖精动漫免费登录页面漫画 ,少女动漫在线观看动漫第8集,51吃瓜今日吃瓜入口网址

文|新浪蜂鳥金煜

編輯|李固

春節黃金周期間，互聯網上涌現了一批令人贊嘆的超短視頻作品，它們以驚人的頻率在全球范圍內傳播，每日都帶來新的視覺盛宴。

這些視頻作品，無一例外，均由人工智能完全獨立生成，未經人手直接干預。

最早的視頻之一，是描繪冰河世紀猛犸象的畫面，精美程度可以秒殺侏羅紀公園或其它好萊塢CGI制作。

Sora示范視頻。“提示詞："幾頭巨大的長毛猛犸象踏著雪地草地走來，它們長長的毛發隨風輕揚，遠處是白雪覆蓋的樹木和壯觀的雪山，午后的陽光灑在飄渺的云朵上，遠處的太陽高高掛起......“

來源：OpenAI官方X賬號

另一個廣為傳播的視頻中，長鏡頭跟隨游客，掃過盛開櫻花下的東京街景。專業人士使用其它AI視頻生成平臺以相同的提示詞嘗試制作時，驚訝的發現這部新視頻在拍攝角度、畫面的精細度，以及清晰度等多個維度上，均顯著超越了以往的作品。

Sora示范視頻。提示詞： “美麗多雪的東京城熱鬧非凡。鏡頭穿過熙熙攘攘的城市街道，跟隨幾位正在享受美麗雪景和在附近攤位購物的人們。絢麗的櫻花花瓣與雪花一起隨風飛舞。”

來源：OpenAI官網

AI甚至模擬出170多年前，當攝影技術還未出現的加州淘金熱時期的場景。而且，制作這個視頻的提示詞簡單無比，顯示了AI技術在理解和創造歷史場景方面的驚人能力。

Sora示范視頻。提示詞：加州淘金熱時期的歷史影像。來源：OpenAI官網

這些具有前所未有高保真度的AI視頻畫面，徹底震驚了業內。

它們來自OpenAI新推出的視頻生成平臺Sora。

像搭積木一樣重新排列創建視頻

根據OpenAI的解釋，Sora的名字取自日語“天空”一詞，其目標是教人工智能“理解和模擬運動中的物理世界”，從而訓練模型，協助人們解決需要現實世界互動的各種問題。

通過一個簡單的提示詞，Sora自動生成的完整視頻長度長達1分鐘。

當下的情形，與兩年前人工智能靜態圖像生成出現時有些類似。

當時，OpenAI的DALL-E2和Midjourney以及Statble Diffusion幾個公司幾乎同時推出了靜態圖像模型，并且對外開放，允許數百萬用戶通過簡單的文字提示，得到AI制作的奇妙圖片。

而Sora的問世，意味著在視頻生成領域邁出的一大步，也將競爭對手遠遠拋出了腦后。

OpenAI的創始人山姆·奧特曼（Sam Altman）再一次證實了自己的地位。就在前不久，他還剛經歷了OpenAI與微軟的“辭退風波”，重返OpenAI首席執行官后，他就通過Sora的推出，向世人證明他個人在AI行業的影響力。

為什么Sora更勝一籌？OpenAI并沒有公開技術真正的內部運作，但基于一些公開技術報告，可以從中一瞥其創新秘訣。

明顯的是，Sora借鑒了ChatGPT和DALL-E的關鍵技術經驗：它將視頻分割成同等大小的“補丁”片段，類似于ChatGPT訓練模型時用的“令牌”。這些片段可以像搭積木一樣，重新排列，創建新的視頻，是視頻生成更為高效和靈活。

它還基于DALL-E-3的擴散模型，把嘈雜的、不完整的數據，通過一系列反饋循環和預測計算，轉換成清晰、連貫的視頻內容。比如，為了做出一只正在玩耍的狗，AI會將無意義，模糊的點陣圖（充滿了技術噪音）變成了看起來真實的狗（“干凈”的輸出）。

小狗玩耍視頻的AI生成過程。來源：OpenAI

Sora也和其它生成式人工智能模型一樣，使用了變形器技術（Transformer，也就是ChatGPT中最后一個字母T的意思），并使用復雜的數據分析技術來處理海量的數據，辨別最重要的和最不重要的部分，并找出不同數據塊之間的上下文和關聯。此外，Sora還會為訓練視頻幀添加高度精細的字幕，幫助進一步修正視頻。

Sora結合深度學習、自然語言處理和計算機視覺，不斷跟真實現實比較，它的訓練基礎，是數百萬個真實視頻，使得它可以從現實世界中學習并理解視頻的“語言”。

Sora的推出，很快在股市上產生了悲喜結果。圖像制作軟件巨頭Adobe的股價在Sora發布后暴跌7%。主要受益者則是為OpenAI等模型提供核心計算芯片的英偉達。

其近期發布季度財報后，股價上漲了16%，相當于市值增加了2730億美元。

傳播公司EEAGLI制作的一段英偉達與英特爾股價比較的視頻顯示，受新冠疫情導致居家辦公、游戲和疫苗研發需求高漲，英偉達股價此后開始反超英特爾，雖然隨后受通脹等原因下降，但很快又憑借OpenAI的ChatGPT熱潮再度快速高漲，成為當前科技領域名副其實的領軍者兼最佳股票。

英偉達與英特爾公司自2014至今的股價比較。來源：EEAGLI

凜冬將至的電影工業

如同當初ChatGPT一度震撼各行各業，Sora的問世同樣吸引了諸多領域的密切關注。

人們首先想到的是電影制作。好萊塢去年發生的罷工事件，已經顯示了創意產業對ChatGPT取代他們工作的深度焦慮。現在，輪到電影制片人和特效制作公司坐立不安了。

一些人已經迅速反應。好萊塢演員、制片人Tyler Perry在Sora推出后，立即宣布，暫停8億美元的工作室擴張計劃。

整體上，長片受到的直接影響可能有限。目前的Sora視頻只長至一分鐘，而每次用類似的提示詞生成視頻，AI生成結果都不盡一致，因此，是很難把60個短視頻拼成一部連貫的長電影的。

盡管如此，動畫領域可能會感到不安。此前，皮克斯公司最引以為豪的，是耗費數月和大量人力資源制作出來的精細動畫細節，如人和動物有著超復雜紋理的毛發，而現在，Sora幾秒鐘就能制作出同等精美的效果。

國際動畫電影協會好萊塢分會臨時執行主任Aubry Mintz對媒體表示，如果Sora開始用于參考動畫、概念制圖和故事板，一些專業人士有可能會失業。但他同時表示，從CGI到計算機動畫軟件，好萊塢經歷了很多次技術進步，它應該也能從人工智能創新中幸存下來。“它們（AI）無法復制人類的創造性思維，也無法做出創造性決定，這是人類藝術家們幾個世紀以來一直在做的。”

事實上，最先釋放出巨大創意潛力的，很可能是短視頻領域。根據OpenAI官方介紹，除了文字轉視頻之外，它同樣具備從靜態圖像轉化為視頻的能力，因此，今后，創意人士除了用提示詞外，還可以將自己創作的圖畫，通過AI轉化為視頻，這開啟了個人創作全新的可能性。

人工智能電影制作組Curious Refuge對媒體表示，迫不及待地想要使用這款工具了。

一旦Sora對外開放，最先開始采納的，很可能是短視頻博主和制作商，會出現一大批充滿創意的人工智能合成視頻。另一個帶來機遇的是廣告和營銷領域，ChatGPT已經成為了營銷工具的一部分，Sora也很可能會很快為廣告設計、營銷活動制作出吸引眼球的視頻內容。

教育培訓機構也很可能從中受益，相關公司可以利用Sora開發出針對特定主題和場景的教育和培訓視頻，增強學員的學習體驗---例如，想象帶孩子進入AI制作的逼真的史前世界，或戰火紛飛的二戰現場中講解古生物和歷史。

AI視頻未來還可以應用于各類動態商品演示，給電子商務、零售商、網絡帶貨等行業帶來全新的商品展示模式。比如，AI視頻可以用于虛擬試穿，讓顧客可以直觀看到新衣服穿在身上的效果，這就大大減少了網購帶來的不確定性。

《紐約時報》的起訴與備受期待的新法律框架

對視頻生成工具被濫用的擔憂從技術誕生第一天起便存在。高仿真的視頻內容，會以假亂真，傳播錯誤的，危險的信息，以“深度仿造”的形式破壞社會結構，給個人帶來災難。此前，就出現了過將名人嫁接到色情明星身上或仿造政客言論等虛假視頻，使得傳播這些視頻的社交媒體廣受批評。

現在，Sora生成視頻的逼真程度再次引發擔憂，其一旦被社會濫用，后果可能甚為不堪。因此，Sora也十分謹慎。目前尚未對公眾開放（只針對少數一些進行風險測試的人員，以及特定的視覺藝術家和電影制片人開放），OpenAI也沒有說明何時開放。

根據OpenAI的說法，要達到正式對外開放的程度，需要設置一些安全防護措施，比如無法生成極端暴力、色情、仇恨畫面或名人肖像的視頻。OpenAI也可能計劃在Sora視頻中加入源數據，表示這些視頻是人工智能生成的，從而防止視頻濫用。

對于Sora多大程度上具有革新意義，現在的各類討論也很多。很多人震驚于視頻逼真程度的同時，人工智能專家也再一次看到了AI的本質局限。《華爾街日報》邀請的AI專家表示，仔細看，Sora發布的這些逼真視頻，充斥了很多物理上，或常識上說不過去的地方。

當對象是人的時候，總有一些地方讓人憑直覺，感覺到奇異之處。比如燒意大利菜的老奶奶，她揮手的動作，就顯得很奇怪，真人不會這樣揮手。

Sora示例視頻。提示詞：祖母主持的自制土豆面疙瘩烹飪指導課程。來源：OpenAI

場景視頻也有很多細節錯誤。如模仿無人機拍攝的意大利海邊城市的視頻，波浪向外而非向岸邊推動，違反了物理常識。此外，上面的一些臺階也突然中斷，顯示AI只是把各種不同視頻中的臺階摘錄過來，但并沒有按照常識將其連接到建筑上。

Sora示例視頻。提示詞：一架無人機圍繞著阿馬爾菲海岸一座建在巖石上的歷史悠久的美麗教堂拍攝，畫面展示了歷史悠久、宏偉壯觀的建筑細節以及層層疊疊的小徑和天井，海浪拍打著下方的巖石，俯瞰著意大利阿馬爾菲海岸的海岸水域和丘陵地貌的地平線、遠處有幾個人在散步，在天井中欣賞壯麗的海景，午后溫暖的陽光為這一場景營造出一種神奇而浪漫的感覺，精美的攝影作品捕捉到的景色令人嘆為觀止。

而引發贊譽的淘金熱時期仿古膠卷，專家指出，里面并列著來自不同歷史時期的建筑，而且，視頻中人和馬順著右邊按秩序走路，完全是現代馬路的交通規則，在古時是不存在的。視頻中也存在馬走著走著就消失了的情況。而在東京街景的畫面中，也出現馬路上的汽車開著開著就消失了的情況。

OpenAI也公開承認，模型在因果關系、混淆左右、遵循軌跡等方面還存在問題，也“沒有準確模擬許多基本交互等物理過程“。

這些問題，在兩年前靜態圖像模型大紅大紫的時候，也都出現過。當時，就有人批評這些靜態圖像笨拙、呆板、缺乏人性，有的還存在明顯缺陷。有人工智能專家認為，AI無法處理“構圖性“，不知道如何組成場景元素，這反映了人工智能技術的根本缺陷。

此后，DALL-E3和Midjourney的靜態圖像生成的確得到了很大的進步，對場景元素的處理更為逼真，更少出現邏輯錯誤。因此，Sora很可能也會快速，很可能不遠的一天，至少對于大眾而言，真的會出現真假難辨的那一刻。

一個重要挑戰，是版權問題。OpenAI方面表示，訓練數據來自授權內容和公開內容，但已經有知識產權持有者在質疑，這數百萬訓練視頻中，到底有多少是“公開內容”了，模型有可能在不經意中使用的視頻侵犯了現有版權。

OpenAI本身已經因版權侵犯和知識產權問題多次遭到了起訴。去年，《紐約時報》就其數百萬篇文章被侵權用于訓練ChatGPT，而將OpenAI和微軟告上法庭，該案的最終判決結果將定義人工智能生成技術與知識產權關系的新法律框架。去年，OpenAI向英國上議院承認，如果不使用受版權保護的資料，就不可能訓練出當今領先的人工智能模型。他們在自己的博文中為自己辯護，稱紐約時報的訴訟“毫無根據”，該公司稱，如果無法獲取受版權的資料，人工智能的發展將是“不可能”的。

這一說法激怒了一些業內人士。著名的人工智能批評家Gary Marcus對此寫道：“簡略翻譯就是：你如果不讓我們盜竊，我們就不會暴富，所以請不要讓盜竊成為犯罪……當然，網飛公司可以一年支付數十億美元的許可費，但‘我們’不應該也這樣！”

在另一篇文章中，Marcus寫道：“四十年前，當我開始研究人工智能時，我根本沒有想到它最大的用途，竟然是衍生模仿，并把藝術家和其它創作者的價值轉移給巨型企業。“