簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

為什么AI視頻工具長(zhǎng)得越來(lái)越像?

掃一掃下載界面新聞APP

為什么AI視頻工具長(zhǎng)得越來(lái)越像?

可能沒(méi)有石頭可以摸了。

圖片來(lái)源:界面圖庫(kù)

文 | 硅基研究室 kiki

距離OpenAI發(fā)布Sora過(guò)去一年多,AI視頻賽道上演了一出「王座交替」的爽文故事。

在Sora發(fā)布后,AI視頻賽道玩家以對(duì)標(biāo)它為目標(biāo),流傳在社交媒體上的一張梗圖是這樣描繪的:坐在王座上的Sora看著眼前膜拜者——Runway、Pika、PixVerse等十余個(gè)競(jìng)對(duì)。

但現(xiàn)在隨著可靈、即夢(mèng)等中國(guó)玩家成為牌桌上的新玩家,總被吐槽「期貨」的Sora光芒逐漸變得黯淡,一位AI視頻從業(yè)者告訴「硅基研究室」,對(duì)標(biāo)Sora早已不是他們的目標(biāo),現(xiàn)在他們把關(guān)注點(diǎn)放在加快縮短AI視頻生產(chǎn)和消費(fèi)間的GAP。

在不少AI論壇的現(xiàn)場(chǎng),AI視頻玩家們談Sora的少了,談DeepSeek的多了,這背后是對(duì)AI視頻加速商業(yè)化和普及的一種期待。

似乎也是某種默契,進(jìn)入2025年,不到半年時(shí)間里,AI視頻玩家紛紛發(fā)布最新的視頻生成模型和產(chǎn)品更新,AI視頻的戰(zhàn)火也越燒越旺。

從著力解決視頻生成的一致性和可控性再到降低產(chǎn)品門(mén)檻,增強(qiáng)可編輯能力,融入工作流,讓產(chǎn)品更好用,行業(yè)玩家也以一個(gè)月,甚至是半月一迭代加速AI視頻落地,但新的問(wèn)題也逐漸擺在臺(tái)前。

有多位中腰部AIGC創(chuàng)業(yè)者向「硅基研究室」表達(dá)了自己的焦慮,從商用角度看,當(dāng)前AI視頻落地還存在諸多困難,商單報(bào)價(jià)在走低,抽卡不穩(wěn)定下,制作成本還是偏貴。

除此以外,就現(xiàn)有產(chǎn)品功能看,「硅基研究室」梳理發(fā)現(xiàn),多數(shù)AI視頻產(chǎn)品功能正趨于同質(zhì)化——除了創(chuàng)意特效外,大多數(shù)AI視頻產(chǎn)品都支持主體參考、音效生成、多模態(tài)編輯等,隨著功能的豐富、選擇的增多,也將賽道玩家間視頻生成的質(zhì)量、成本和交互形式等能力的競(jìng)爭(zhēng)擺在了眼前。

這也意味著,即便不提Sora,國(guó)產(chǎn)AI視頻玩家的壓力也并沒(méi)有減輕。

一、不提Sora的AI視頻玩家,在卷什么?

比起此前對(duì)生成時(shí)長(zhǎng)、模型參數(shù)的強(qiáng)調(diào),大半年來(lái),不提Sora的AI視頻玩家將這場(chǎng)「軍備競(jìng)賽」的重點(diǎn)放在了三個(gè)維度上——卷一致性、卷可用性、卷可玩性。

所謂的「一致性」指的是視頻生成過(guò)程中幀與幀之間的過(guò)渡性、動(dòng)作的連續(xù)性和場(chǎng)景的真實(shí)性等。

由于視頻畫(huà)面往往包含了人物角色、道具、環(huán)境等不同元素,如何在生成過(guò)程中實(shí)現(xiàn)這些元素的交互,在連貫視頻內(nèi)保持一致性,這也是AI視頻玩家長(zhǎng)期一直在解決的問(wèn)題。

而在卷「一致性」上,AI視頻玩家的動(dòng)作也整齊劃一。

一方面是提升圖生視頻能力,比如增加首尾幀、筆刷工具和多圖參考等,讓用戶(hù)自定義視頻的開(kāi)頭和結(jié)尾的同時(shí),筆刷支持運(yùn)動(dòng)方向控制,模型可以根據(jù)用戶(hù)上傳的參考圖像提取人物、場(chǎng)景或風(fēng)格特征,從而保證生成內(nèi)容中的一致性。

在輸入端加強(qiáng)控制力,不止是卷首幀。包括Runway在內(nèi)的AI視頻玩家還在輸入端就打出多模態(tài)融合,比如視頻轉(zhuǎn)視頻、多圖混合生成等。

去年10月,Runway就推出了Act-One功能,用戶(hù)可以直接錄制一段視頻,將素材中對(duì)象的面部表情直接轉(zhuǎn)移到AI生成的角色上。

Runway在去年10月推出Act-One功能  圖源:官方

「一致性」本質(zhì)上是為了視頻生成的質(zhì)量,這又與底層模型性能和訓(xùn)練數(shù)據(jù)的質(zhì)量相關(guān),目前走在前列的AI視頻玩家雖并未高調(diào)大打「基模牌」,但強(qiáng)大底座模型的穩(wěn)定迭代是頭部玩家的標(biāo)配。

快手自去年6月推出可靈大模型后,目前可靈大模型已迭代至2.0版本,字節(jié)低調(diào)上線(xiàn)Seaweed和PixelDance,Runway在今年4月推出Gen-4,同月生數(shù)科技也發(fā)布Vidu的Q1模型,頭部AI視頻玩家至少保持半年一次基座模型更新的節(jié)奏。

而所謂的卷「可用性」則是完善創(chuàng)作者工作流相關(guān)配套工具。

AIGC從業(yè)者可可告訴「硅基研究室」,據(jù)她觀察,在「可用性」上,創(chuàng)作者主要關(guān)注三個(gè)核心問(wèn)題:

一是動(dòng)態(tài)編輯能力,可以圍繞視頻一次性生成的結(jié)果進(jìn)行再調(diào)整;

二是鏡頭運(yùn)動(dòng)能力,包括大幅度運(yùn)動(dòng)、特色運(yùn)動(dòng)視角等等,這體現(xiàn)畫(huà)面表現(xiàn)力;

三是端到端能力,包括從分鏡、視頻生成、音效、剪輯到分發(fā)的一站式能力。

針對(duì)動(dòng)態(tài)編輯,目前可靈等玩家支持多模態(tài)編輯,給視頻替換、添加或刪減元素,比如Pika推出的Pikawaps;而在端到端能力上,標(biāo)配的「音效生成」,即夢(mèng)的「故事創(chuàng)作」模式可批量生成分鏡,Runway也上線(xiàn)了視頻編輯器。

除了一致性、可用性外,通過(guò)創(chuàng)意特效和模版卷「可玩性」則是不少玩家引流的關(guān)鍵手段。

吃到這波紅利的典型代表也有不少,比如靠著Pikaffects、Pikadditions走紅互聯(lián)網(wǎng)的Pika,靠著毒液效果走紅的PixVerse,還有承接GPT-4o吉卜力風(fēng)流量外溢的Vidu......

Pika近期推出的發(fā)型AI特效  圖源:Pika官方

「硅基研究室」梳理發(fā)現(xiàn),多數(shù)AI視頻產(chǎn)品功能正趨于同質(zhì)化,所謂的「特色功能」會(huì)很快被相互借鑒。

除了創(chuàng)意特效外,大多數(shù)AI視頻產(chǎn)品都支持主體參考、音效生成、多模態(tài)編輯等,有業(yè)內(nèi)人士表示,這是正常現(xiàn)象。“現(xiàn)在AI視頻的交互形式和產(chǎn)品形態(tài)各家都還在探索,互相抄作業(yè)和‘致敬’很正常。”

二、AI視頻難打「價(jià)格牌」

更多的工具、更豐富的功能,廠(chǎng)商打著「人人都是導(dǎo)演時(shí)代」的口號(hào),但有AI視頻創(chuàng)作者卻覺(jué)得越來(lái)越焦慮了。

2024年抱著對(duì)AI視頻的好奇,可可開(kāi)始嘗試AI視頻創(chuàng)作,就是「焦慮大軍」中的一員,從2024年下半年開(kāi)始,她明顯感覺(jué)到AI視頻玩家加速迭代模型和產(chǎn)品,甚至是以周為單位。

但快速迭代下,像可可這樣的腰部創(chuàng)作者正在經(jīng)歷陣痛——降不下去的制作成本,被逐漸壓低的報(bào)價(jià)。

「硅基研究室」了解到,AI視頻多為定制化項(xiàng)目,一般按照視頻時(shí)長(zhǎng)(每秒)或鏡頭數(shù)報(bào)價(jià),一般三分多鐘的AI短片制作周期在1-2周,但可可提到,隨著客戶(hù)對(duì)AI視頻降本需求的增加,預(yù)算也在降低。

與之對(duì)應(yīng)的則是AI視頻工具堅(jiān)挺的價(jià)格。以可靈2.0為例,目前2.0生成一條5秒鐘的視頻需要100靈感值,黃金會(huì)員月費(fèi)58元可獲得660靈感值,能抽卡6次,一次生成約為10元。

可可提到,如果對(duì)畫(huà)質(zhì)要求低,單個(gè)鏡頭(一般1-5s)需要抽卡5次左右,這意味生成一個(gè)鏡頭就需要50元,如果涉及更復(fù)雜的場(chǎng)景和效果抽卡次數(shù)可能高達(dá)數(shù)十次,她曾經(jīng)單個(gè)鏡頭抽卡次數(shù)達(dá)40次,以此計(jì)算,單個(gè)鏡頭就需要400元,一個(gè)三分鐘的AI短片在不算人力成本下保守估計(jì)就要數(shù)萬(wàn)元,和她此前的制作成本相比,是不劃算的。

較高的成本,這也是為什么有一批AIGC創(chuàng)作者并未使用新版本,而是繼續(xù)使用可靈1.6的原因所在。

有業(yè)內(nèi)人士也提到,此次可靈2.0主要針對(duì)是影視商用領(lǐng)域,并非是如可可此類(lèi)的小B用戶(hù)。

據(jù)可靈此前發(fā)布的《AI影像創(chuàng)作者手冊(cè)》,中信證券測(cè)算其單部短劇(3.5分鐘)成本測(cè)算約為8100元,即便可靈2.0很貴,但與真人短劇制作成本相比,依舊能看得見(jiàn)降本的空間,但降本幅度在縮減。

梳理主要AI視頻玩家的商業(yè)化方案,「硅基研究室」認(rèn)為,比起此前各大主流模型廠(chǎng)商掀起的「價(jià)格戰(zhàn)」,推動(dòng)行業(yè)邁入「按厘計(jì)價(jià)」時(shí)代,視頻大模型的價(jià)格下降趨勢(shì)并不明顯。

C端目前采取的階梯付費(fèi)訂閱模式,國(guó)內(nèi)對(duì)比國(guó)外玩家價(jià)格優(yōu)勢(shì)明顯,比如大打價(jià)格優(yōu)勢(shì)的Vidu甚至效仿DeepSeek上線(xiàn)了「錯(cuò)峰模式」。但在最先進(jìn)模型上,頭部廠(chǎng)商的定價(jià)并未松動(dòng),譬如可靈2.0生成一個(gè)5s視頻約為10元,而Runway Gen4則為8.6元。

反倒是在B端API上,國(guó)內(nèi)廠(chǎng)商的價(jià)格優(yōu)勢(shì)明顯高于國(guó)外廠(chǎng)商。

一位行業(yè)人士預(yù)測(cè),短期內(nèi)視頻大模型的定價(jià)不會(huì)出現(xiàn)激烈的變化。

一方面,從現(xiàn)有產(chǎn)品層看,盡管目前開(kāi)源視頻生成模型中也不乏如阿里通義萬(wàn)相Wan2.1等玩家,但取得身位領(lǐng)先的依舊是閉源大模型。阿里萬(wàn)相團(tuán)隊(duì)在技術(shù)報(bào)告中也提到,目前視頻生成賽道,盡管開(kāi)源模型與閉源商業(yè)模型間的差距在不斷縮小,但目前還存在性能不佳、能力有限、效率不足等問(wèn)題,Sand.ai創(chuàng)始人曹越也提到,在視頻生成領(lǐng)域,技術(shù)路徑還尚未收斂。

另一方面,降價(jià)本質(zhì)上也是一種定價(jià)營(yíng)銷(xiāo)策略,目的也是讓更多人將AI視頻用起來(lái),但前提是產(chǎn)品形態(tài)和交互已經(jīng)ready,但現(xiàn)階段各大廠(chǎng)商還在探索產(chǎn)品形態(tài),不斷完善AI視頻生產(chǎn)環(huán)節(jié),如前文所說(shuō),去跨越生產(chǎn)和消費(fèi)那道鴻溝。

三、「保證自己在牌桌上」

和那些熱門(mén)的垂直領(lǐng)域一樣,AI視頻早已成為巨頭和創(chuàng)業(yè)公司下一個(gè)押注的沃土,擠滿(mǎn)了躍躍欲試的玩家。

據(jù)「硅基研究室」不完全統(tǒng)計(jì),2025年開(kāi)年,就有十余家AI視頻領(lǐng)域初創(chuàng)企業(yè)斬獲融資,既包括了像Runway這樣的明星獨(dú)角獸,也不乏Sand.ai等新玩家。

從所屬領(lǐng)域來(lái)看,既有「模型+產(chǎn)品」兩步走的通用型選手,也有聚焦在企業(yè)級(jí)市場(chǎng)、視頻編輯領(lǐng)域的垂直型選手。

和曾經(jīng)熱鬧的「百模大戰(zhàn)」類(lèi)似,AI視頻領(lǐng)域當(dāng)前呈現(xiàn)出巨頭和初創(chuàng)公司共同競(jìng)逐的局面,但也有初創(chuàng)企業(yè)提前給出預(yù)判,比如Runway CEO就曾預(yù)言:「我認(rèn)為AI公司的時(shí)代已經(jīng)結(jié)束了。」

但從現(xiàn)實(shí)來(lái)看,AI視頻的競(jìng)逐還遠(yuǎn)未到終局,初創(chuàng)公司需要做的是「保證自己在牌桌上」。

牌桌上的分化也已經(jīng)開(kāi)始顯現(xiàn)。

一類(lèi)大廠(chǎng)和初創(chuàng)企業(yè)選擇的是「模型+產(chǎn)品」兩步走,這之中又可以分為兩條路線(xiàn)——「AGI派」和「平臺(tái)派」。

海外如谷歌DeepMind和OpenAI是典型的前者。可可提到,在視頻生成模型上,DeepMind的Veo系列強(qiáng)于可控性,視頻生成質(zhì)量也更高,他們的方向更偏向于構(gòu)建通往AGI的世界模型,阿里通義則以開(kāi)源加速構(gòu)建視頻模型的新生態(tài)。

而所謂的「平臺(tái)派」則是從一家AI視頻企業(yè)轉(zhuǎn)型為集合內(nèi)容和生產(chǎn)消費(fèi)為一體的平臺(tái)型公司,比如Runway、可靈、即夢(mèng)和海螺等。

另一類(lèi)則偏向于產(chǎn)品驅(qū)動(dòng),快速迭代,比如聚焦在AI特效爆款迭代的Pika,以視頻編輯生產(chǎn)力出圈的OpusClip和Capsule等。AIGC藝術(shù)家海辛在播客「十字路口」也提到,現(xiàn)階段沒(méi)有一家能攻克AI視頻所有的方向,視頻的玩法太多了,這也給創(chuàng)業(yè)公司入局帶來(lái)了機(jī)會(huì)。

而從不少創(chuàng)作者的AI視頻實(shí)際體感來(lái)看,視頻創(chuàng)作的需求是復(fù)雜的,因此多平臺(tái)多產(chǎn)品的組合使用也是常態(tài),現(xiàn)階段沒(méi)有一家能大包大攬。

比如在可控性上,可可提到Runway、可靈、PixVerse和Luma的表現(xiàn)都不錯(cuò),能實(shí)現(xiàn)較為精細(xì)化的運(yùn)鏡控制;從畫(huà)面表現(xiàn)力和視頻風(fēng)格來(lái)看,海螺、Pika、Luma強(qiáng)于二次元、動(dòng)漫效果,Vidu、可靈在寫(xiě)實(shí)風(fēng)格上輸出比較穩(wěn)定。

「我感覺(jué)大家都在摸著石頭過(guò)河」。Luma AI產(chǎn)品經(jīng)理Barkley曾在播客「十字路口」里這樣形容。多模態(tài)是上限很高,它的星辰大海也絕不止是視頻生成。從這一點(diǎn)來(lái)說(shuō),互相摸著過(guò)河的AI視頻玩家來(lái)說(shuō),2025年,依舊是繼續(xù)卷的一年。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

发布评论

您至少需输入5个字

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!
硅基研究室
界面财经号
IP属地:南京
智能时代前沿观察者

下載界面新聞

為什么AI視頻工具長(zhǎng)得越來(lái)越像?

可能沒(méi)有石頭可以摸了。

圖片來(lái)源:界面圖庫(kù)

文 | 硅基研究室 kiki

距離OpenAI發(fā)布Sora過(guò)去一年多,AI視頻賽道上演了一出「王座交替」的爽文故事。

在Sora發(fā)布后,AI視頻賽道玩家以對(duì)標(biāo)它為目標(biāo),流傳在社交媒體上的一張梗圖是這樣描繪的:坐在王座上的Sora看著眼前膜拜者——Runway、Pika、PixVerse等十余個(gè)競(jìng)對(duì)。

但現(xiàn)在隨著可靈、即夢(mèng)等中國(guó)玩家成為牌桌上的新玩家,總被吐槽「期貨」的Sora光芒逐漸變得黯淡,一位AI視頻從業(yè)者告訴「硅基研究室」,對(duì)標(biāo)Sora早已不是他們的目標(biāo),現(xiàn)在他們把關(guān)注點(diǎn)放在加快縮短AI視頻生產(chǎn)和消費(fèi)間的GAP。

在不少AI論壇的現(xiàn)場(chǎng),AI視頻玩家們談Sora的少了,談DeepSeek的多了,這背后是對(duì)AI視頻加速商業(yè)化和普及的一種期待。

似乎也是某種默契,進(jìn)入2025年,不到半年時(shí)間里,AI視頻玩家紛紛發(fā)布最新的視頻生成模型和產(chǎn)品更新,AI視頻的戰(zhàn)火也越燒越旺。

從著力解決視頻生成的一致性和可控性再到降低產(chǎn)品門(mén)檻,增強(qiáng)可編輯能力,融入工作流,讓產(chǎn)品更好用,行業(yè)玩家也以一個(gè)月,甚至是半月一迭代加速AI視頻落地,但新的問(wèn)題也逐漸擺在臺(tái)前。

有多位中腰部AIGC創(chuàng)業(yè)者向「硅基研究室」表達(dá)了自己的焦慮,從商用角度看,當(dāng)前AI視頻落地還存在諸多困難,商單報(bào)價(jià)在走低,抽卡不穩(wěn)定下,制作成本還是偏貴。

除此以外,就現(xiàn)有產(chǎn)品功能看,「硅基研究室」梳理發(fā)現(xiàn),多數(shù)AI視頻產(chǎn)品功能正趨于同質(zhì)化——除了創(chuàng)意特效外,大多數(shù)AI視頻產(chǎn)品都支持主體參考、音效生成、多模態(tài)編輯等,隨著功能的豐富、選擇的增多,也將賽道玩家間視頻生成的質(zhì)量、成本和交互形式等能力的競(jìng)爭(zhēng)擺在了眼前。

這也意味著,即便不提Sora,國(guó)產(chǎn)AI視頻玩家的壓力也并沒(méi)有減輕。

一、不提Sora的AI視頻玩家,在卷什么?

比起此前對(duì)生成時(shí)長(zhǎng)、模型參數(shù)的強(qiáng)調(diào),大半年來(lái),不提Sora的AI視頻玩家將這場(chǎng)「軍備競(jìng)賽」的重點(diǎn)放在了三個(gè)維度上——卷一致性、卷可用性、卷可玩性。

所謂的「一致性」指的是視頻生成過(guò)程中幀與幀之間的過(guò)渡性、動(dòng)作的連續(xù)性和場(chǎng)景的真實(shí)性等。

由于視頻畫(huà)面往往包含了人物角色、道具、環(huán)境等不同元素,如何在生成過(guò)程中實(shí)現(xiàn)這些元素的交互,在連貫視頻內(nèi)保持一致性,這也是AI視頻玩家長(zhǎng)期一直在解決的問(wèn)題。

而在卷「一致性」上,AI視頻玩家的動(dòng)作也整齊劃一。

一方面是提升圖生視頻能力,比如增加首尾幀、筆刷工具和多圖參考等,讓用戶(hù)自定義視頻的開(kāi)頭和結(jié)尾的同時(shí),筆刷支持運(yùn)動(dòng)方向控制,模型可以根據(jù)用戶(hù)上傳的參考圖像提取人物、場(chǎng)景或風(fēng)格特征,從而保證生成內(nèi)容中的一致性。

在輸入端加強(qiáng)控制力,不止是卷首幀。包括Runway在內(nèi)的AI視頻玩家還在輸入端就打出多模態(tài)融合,比如視頻轉(zhuǎn)視頻、多圖混合生成等。

去年10月,Runway就推出了Act-One功能,用戶(hù)可以直接錄制一段視頻,將素材中對(duì)象的面部表情直接轉(zhuǎn)移到AI生成的角色上。

Runway在去年10月推出Act-One功能  圖源:官方

「一致性」本質(zhì)上是為了視頻生成的質(zhì)量,這又與底層模型性能和訓(xùn)練數(shù)據(jù)的質(zhì)量相關(guān),目前走在前列的AI視頻玩家雖并未高調(diào)大打「基模牌」,但強(qiáng)大底座模型的穩(wěn)定迭代是頭部玩家的標(biāo)配。

快手自去年6月推出可靈大模型后,目前可靈大模型已迭代至2.0版本,字節(jié)低調(diào)上線(xiàn)Seaweed和PixelDance,Runway在今年4月推出Gen-4,同月生數(shù)科技也發(fā)布Vidu的Q1模型,頭部AI視頻玩家至少保持半年一次基座模型更新的節(jié)奏。

而所謂的卷「可用性」則是完善創(chuàng)作者工作流相關(guān)配套工具。

AIGC從業(yè)者可可告訴「硅基研究室」,據(jù)她觀察,在「可用性」上,創(chuàng)作者主要關(guān)注三個(gè)核心問(wèn)題:

一是動(dòng)態(tài)編輯能力,可以圍繞視頻一次性生成的結(jié)果進(jìn)行再調(diào)整;

二是鏡頭運(yùn)動(dòng)能力,包括大幅度運(yùn)動(dòng)、特色運(yùn)動(dòng)視角等等,這體現(xiàn)畫(huà)面表現(xiàn)力;

三是端到端能力,包括從分鏡、視頻生成、音效、剪輯到分發(fā)的一站式能力。

針對(duì)動(dòng)態(tài)編輯,目前可靈等玩家支持多模態(tài)編輯,給視頻替換、添加或刪減元素,比如Pika推出的Pikawaps;而在端到端能力上,標(biāo)配的「音效生成」,即夢(mèng)的「故事創(chuàng)作」模式可批量生成分鏡,Runway也上線(xiàn)了視頻編輯器。

除了一致性、可用性外,通過(guò)創(chuàng)意特效和模版卷「可玩性」則是不少玩家引流的關(guān)鍵手段。

吃到這波紅利的典型代表也有不少,比如靠著Pikaffects、Pikadditions走紅互聯(lián)網(wǎng)的Pika,靠著毒液效果走紅的PixVerse,還有承接GPT-4o吉卜力風(fēng)流量外溢的Vidu......

Pika近期推出的發(fā)型AI特效  圖源:Pika官方

「硅基研究室」梳理發(fā)現(xiàn),多數(shù)AI視頻產(chǎn)品功能正趨于同質(zhì)化,所謂的「特色功能」會(huì)很快被相互借鑒。

除了創(chuàng)意特效外,大多數(shù)AI視頻產(chǎn)品都支持主體參考、音效生成、多模態(tài)編輯等,有業(yè)內(nèi)人士表示,這是正常現(xiàn)象。“現(xiàn)在AI視頻的交互形式和產(chǎn)品形態(tài)各家都還在探索,互相抄作業(yè)和‘致敬’很正常。”

二、AI視頻難打「價(jià)格牌」

更多的工具、更豐富的功能,廠(chǎng)商打著「人人都是導(dǎo)演時(shí)代」的口號(hào),但有AI視頻創(chuàng)作者卻覺(jué)得越來(lái)越焦慮了。

2024年抱著對(duì)AI視頻的好奇,可可開(kāi)始嘗試AI視頻創(chuàng)作,就是「焦慮大軍」中的一員,從2024年下半年開(kāi)始,她明顯感覺(jué)到AI視頻玩家加速迭代模型和產(chǎn)品,甚至是以周為單位。

但快速迭代下,像可可這樣的腰部創(chuàng)作者正在經(jīng)歷陣痛——降不下去的制作成本,被逐漸壓低的報(bào)價(jià)。

「硅基研究室」了解到,AI視頻多為定制化項(xiàng)目,一般按照視頻時(shí)長(zhǎng)(每秒)或鏡頭數(shù)報(bào)價(jià),一般三分多鐘的AI短片制作周期在1-2周,但可可提到,隨著客戶(hù)對(duì)AI視頻降本需求的增加,預(yù)算也在降低。

與之對(duì)應(yīng)的則是AI視頻工具堅(jiān)挺的價(jià)格。以可靈2.0為例,目前2.0生成一條5秒鐘的視頻需要100靈感值,黃金會(huì)員月費(fèi)58元可獲得660靈感值,能抽卡6次,一次生成約為10元。

可可提到,如果對(duì)畫(huà)質(zhì)要求低,單個(gè)鏡頭(一般1-5s)需要抽卡5次左右,這意味生成一個(gè)鏡頭就需要50元,如果涉及更復(fù)雜的場(chǎng)景和效果抽卡次數(shù)可能高達(dá)數(shù)十次,她曾經(jīng)單個(gè)鏡頭抽卡次數(shù)達(dá)40次,以此計(jì)算,單個(gè)鏡頭就需要400元,一個(gè)三分鐘的AI短片在不算人力成本下保守估計(jì)就要數(shù)萬(wàn)元,和她此前的制作成本相比,是不劃算的。

較高的成本,這也是為什么有一批AIGC創(chuàng)作者并未使用新版本,而是繼續(xù)使用可靈1.6的原因所在。

有業(yè)內(nèi)人士也提到,此次可靈2.0主要針對(duì)是影視商用領(lǐng)域,并非是如可可此類(lèi)的小B用戶(hù)。

據(jù)可靈此前發(fā)布的《AI影像創(chuàng)作者手冊(cè)》,中信證券測(cè)算其單部短劇(3.5分鐘)成本測(cè)算約為8100元,即便可靈2.0很貴,但與真人短劇制作成本相比,依舊能看得見(jiàn)降本的空間,但降本幅度在縮減。

梳理主要AI視頻玩家的商業(yè)化方案,「硅基研究室」認(rèn)為,比起此前各大主流模型廠(chǎng)商掀起的「價(jià)格戰(zhàn)」,推動(dòng)行業(yè)邁入「按厘計(jì)價(jià)」時(shí)代,視頻大模型的價(jià)格下降趨勢(shì)并不明顯。

C端目前采取的階梯付費(fèi)訂閱模式,國(guó)內(nèi)對(duì)比國(guó)外玩家價(jià)格優(yōu)勢(shì)明顯,比如大打價(jià)格優(yōu)勢(shì)的Vidu甚至效仿DeepSeek上線(xiàn)了「錯(cuò)峰模式」。但在最先進(jìn)模型上,頭部廠(chǎng)商的定價(jià)并未松動(dòng),譬如可靈2.0生成一個(gè)5s視頻約為10元,而Runway Gen4則為8.6元。

反倒是在B端API上,國(guó)內(nèi)廠(chǎng)商的價(jià)格優(yōu)勢(shì)明顯高于國(guó)外廠(chǎng)商。

一位行業(yè)人士預(yù)測(cè),短期內(nèi)視頻大模型的定價(jià)不會(huì)出現(xiàn)激烈的變化。

一方面,從現(xiàn)有產(chǎn)品層看,盡管目前開(kāi)源視頻生成模型中也不乏如阿里通義萬(wàn)相Wan2.1等玩家,但取得身位領(lǐng)先的依舊是閉源大模型。阿里萬(wàn)相團(tuán)隊(duì)在技術(shù)報(bào)告中也提到,目前視頻生成賽道,盡管開(kāi)源模型與閉源商業(yè)模型間的差距在不斷縮小,但目前還存在性能不佳、能力有限、效率不足等問(wèn)題,Sand.ai創(chuàng)始人曹越也提到,在視頻生成領(lǐng)域,技術(shù)路徑還尚未收斂。

另一方面,降價(jià)本質(zhì)上也是一種定價(jià)營(yíng)銷(xiāo)策略,目的也是讓更多人將AI視頻用起來(lái),但前提是產(chǎn)品形態(tài)和交互已經(jīng)ready,但現(xiàn)階段各大廠(chǎng)商還在探索產(chǎn)品形態(tài),不斷完善AI視頻生產(chǎn)環(huán)節(jié),如前文所說(shuō),去跨越生產(chǎn)和消費(fèi)那道鴻溝。

三、「保證自己在牌桌上」

和那些熱門(mén)的垂直領(lǐng)域一樣,AI視頻早已成為巨頭和創(chuàng)業(yè)公司下一個(gè)押注的沃土,擠滿(mǎn)了躍躍欲試的玩家。

據(jù)「硅基研究室」不完全統(tǒng)計(jì),2025年開(kāi)年,就有十余家AI視頻領(lǐng)域初創(chuàng)企業(yè)斬獲融資,既包括了像Runway這樣的明星獨(dú)角獸,也不乏Sand.ai等新玩家。

從所屬領(lǐng)域來(lái)看,既有「模型+產(chǎn)品」兩步走的通用型選手,也有聚焦在企業(yè)級(jí)市場(chǎng)、視頻編輯領(lǐng)域的垂直型選手。

和曾經(jīng)熱鬧的「百模大戰(zhàn)」類(lèi)似,AI視頻領(lǐng)域當(dāng)前呈現(xiàn)出巨頭和初創(chuàng)公司共同競(jìng)逐的局面,但也有初創(chuàng)企業(yè)提前給出預(yù)判,比如Runway CEO就曾預(yù)言:「我認(rèn)為AI公司的時(shí)代已經(jīng)結(jié)束了。」

但從現(xiàn)實(shí)來(lái)看,AI視頻的競(jìng)逐還遠(yuǎn)未到終局,初創(chuàng)公司需要做的是「保證自己在牌桌上」。

牌桌上的分化也已經(jīng)開(kāi)始顯現(xiàn)。

一類(lèi)大廠(chǎng)和初創(chuàng)企業(yè)選擇的是「模型+產(chǎn)品」兩步走,這之中又可以分為兩條路線(xiàn)——「AGI派」和「平臺(tái)派」。

海外如谷歌DeepMind和OpenAI是典型的前者。可可提到,在視頻生成模型上,DeepMind的Veo系列強(qiáng)于可控性,視頻生成質(zhì)量也更高,他們的方向更偏向于構(gòu)建通往AGI的世界模型,阿里通義則以開(kāi)源加速構(gòu)建視頻模型的新生態(tài)。

而所謂的「平臺(tái)派」則是從一家AI視頻企業(yè)轉(zhuǎn)型為集合內(nèi)容和生產(chǎn)消費(fèi)為一體的平臺(tái)型公司,比如Runway、可靈、即夢(mèng)和海螺等。

另一類(lèi)則偏向于產(chǎn)品驅(qū)動(dòng),快速迭代,比如聚焦在AI特效爆款迭代的Pika,以視頻編輯生產(chǎn)力出圈的OpusClip和Capsule等。AIGC藝術(shù)家海辛在播客「十字路口」也提到,現(xiàn)階段沒(méi)有一家能攻克AI視頻所有的方向,視頻的玩法太多了,這也給創(chuàng)業(yè)公司入局帶來(lái)了機(jī)會(huì)。

而從不少創(chuàng)作者的AI視頻實(shí)際體感來(lái)看,視頻創(chuàng)作的需求是復(fù)雜的,因此多平臺(tái)多產(chǎn)品的組合使用也是常態(tài),現(xiàn)階段沒(méi)有一家能大包大攬。

比如在可控性上,可可提到Runway、可靈、PixVerse和Luma的表現(xiàn)都不錯(cuò),能實(shí)現(xiàn)較為精細(xì)化的運(yùn)鏡控制;從畫(huà)面表現(xiàn)力和視頻風(fēng)格來(lái)看,海螺、Pika、Luma強(qiáng)于二次元、動(dòng)漫效果,Vidu、可靈在寫(xiě)實(shí)風(fēng)格上輸出比較穩(wěn)定。

「我感覺(jué)大家都在摸著石頭過(guò)河」。Luma AI產(chǎn)品經(jīng)理Barkley曾在播客「十字路口」里這樣形容。多模態(tài)是上限很高,它的星辰大海也絕不止是視頻生成。從這一點(diǎn)來(lái)說(shuō),互相摸著過(guò)河的AI視頻玩家來(lái)說(shuō),2025年,依舊是繼續(xù)卷的一年。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。
主站蜘蛛池模板: 翁牛特旗| 马公市| 横山县| 舒城县| 如皋市| 泰来县| 库尔勒市| 邳州市| 巫山县| 平阳县| 邹城市| 阿坝| 阳新县| 永泰县| 冷水江市| 周宁县| 濮阳县| 宿州市| 六安市| 石狮市| 海南省| 襄垣县| 山丹县| 许昌市| 呼伦贝尔市| 宜都市| 诸暨市| 左权县| 阿克| 镇巴县| 洪江市| 舞钢市| 迭部县| 晴隆县| 柘城县| 额尔古纳市| 洛扎县| 高密市| 柘城县| 苗栗市| 博爱县|

下载界面新闻

微信公众号

微博