界面新聞?dòng)浾?| 肖芳
界面新聞編輯 | 文姝琪
在百度AI DAY科技開(kāi)放日上,百度移動(dòng)生態(tài)商業(yè)研發(fā)團(tuán)隊(duì)正式發(fā)布自研視頻生成模型MuseSteamer,及視頻產(chǎn)品平臺(tái)“繪想”。MuseSteamer采用DIT架構(gòu),參數(shù)和業(yè)界最大的視頻生成模型在同一個(gè)量級(jí),支持生成連續(xù)10s動(dòng)態(tài)視頻,最高可生成分辨率為1080P的高清視頻。
百度自研的視頻生成模型還是來(lái)了,但并不是來(lái)自研發(fā)文心大模型的技術(shù)中臺(tái)部門TPG。
去年10月,百度CEO李彥宏曾在內(nèi)部講話中稱百度不會(huì)做視頻生成模型,因?yàn)?/span>Sora這種視頻生成模型的投入周期太長(zhǎng)。
在媒體溝通會(huì)上,百度副總裁、移動(dòng)生態(tài)商業(yè)體系負(fù)責(zé)人陳一凡在一開(kāi)場(chǎng)就向界面新聞等媒體解釋了為何百度要做視頻生成模型的問(wèn)題。他表示,為了幫助代理商和廣告主快速地生成廣告,去年百度移動(dòng)生態(tài)商業(yè)體系推出了擎舵平臺(tái)。但有代理商和廣告主反饋說(shuō),一些偏科幻的場(chǎng)景很難拍攝,希望能通過(guò)大模型生成。移動(dòng)生態(tài)商業(yè)體系調(diào)研之后,決定自研視頻生成模型。
一位百度內(nèi)部人士也向界面新聞解釋稱,去年李彥宏在內(nèi)部講話中還提到,基于多模態(tài)的需求,可以做一些相對(duì)特定的視頻生成場(chǎng)景。百度前段時(shí)間發(fā)布的羅永浩數(shù)字人以及此次發(fā)布的視頻生成模型都是基于特定場(chǎng)景和特定需求的,這是百度內(nèi)部一直在探索的。
目前,市場(chǎng)上大多數(shù)視頻生成模型都是技術(shù)驅(qū)動(dòng)型,即通過(guò)不斷優(yōu)化算法、增加算力、豐富數(shù)據(jù)等技術(shù)手段,提升模型性能和生成視頻的質(zhì)量,以滿足用戶需求和市場(chǎng)競(jìng)爭(zhēng),但模型并沒(méi)有確定性的應(yīng)用場(chǎng)景,而是隨著模型能力的提升進(jìn)行持續(xù)探索。相比之下,百度視頻生成模型最大的不同就是商業(yè)驅(qū)動(dòng),即先有了明確的商業(yè)需求,再結(jié)合需求研發(fā)模型。
百度商業(yè)體系商業(yè)研發(fā)總經(jīng)理劉林向界面新聞透露,MuseSteamer項(xiàng)目在今年春節(jié)之后才開(kāi)始立項(xiàng),研發(fā)團(tuán)隊(duì)有幾十個(gè)人,到上線有效的研發(fā)時(shí)間只有3個(gè)月。
劉林表示,MuseSteamer之所以能夠在較短時(shí)間上線,是因?yàn)?/span>其在技術(shù)上并不是完全從零起步。擎舵平臺(tái)在多模態(tài)生成上本身就有了一定的技術(shù)積累,百度商業(yè)體系在模型訓(xùn)練框架推理、卡片調(diào)優(yōu)上也有一些積累,能夠快速的延續(xù)過(guò)來(lái)。
目前,MuseSteamer模型Turbo版已上線“繪想”平臺(tái),開(kāi)啟限時(shí)免費(fèi)公測(cè),其余版本將于8月陸續(xù)開(kāi)放。陳一凡表示,“繪想”平臺(tái)的定位是一個(gè)營(yíng)銷產(chǎn)品,目標(biāo)是服務(wù)好B端的廣告主。
根據(jù)百度官方公布的數(shù)據(jù),目前,“繪想”平臺(tái)已生成超過(guò)100個(gè)AIGC廣告在百度商業(yè)體系內(nèi)上線投放。
至于MuseSteamer模型是否會(huì)服務(wù)C端用戶,陳一凡并沒(méi)有給出明確答案。但目前,全新改版的百度搜索已接入MuseSteamer模型,后續(xù)百度很可能將其接入更多C端產(chǎn)品來(lái)面向普通用戶提供服務(wù)。
“C端的想象空間是非常大的,前提是我們把模型做好。”陳一凡表示。