編導:宋美辰 編輯:劉春 、江旭波
日前,阿里巴巴集團智能計算研究院上線了一款新的AI圖片-音頻-視頻模型技術EMO,官方稱其為“一種富有表現力的音頻驅動的肖像視頻生成框架”。據悉,用戶只需要提供一張照片和一段任意音頻文件,該框架能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻,同時可以根據輸入視頻的長度生成任何持續時間的視頻。
編導:宋美辰 編輯:劉春 、江旭波
日前,阿里巴巴集團智能計算研究院上線了一款新的AI圖片-音頻-視頻模型技術EMO,官方稱其為“一種富有表現力的音頻驅動的肖像視頻生成框架”。據悉,用戶只需要提供一張照片和一段任意音頻文件,該框架能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻,同時可以根據輸入視頻的長度生成任何持續時間的視頻。
評論