簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

“郭德綱”用英語說相聲,AI語音技術該如何監管?

掃一掃下載界面新聞APP

“郭德綱”用英語說相聲,AI語音技術該如何監管?

人們擔心人工智能“變壞”。

文|IT時報記者 沈毅斌

編輯|錢立富 孫妍

“Let's be happy and that's it,don't overthink, overthinking is pointless, it's part of being human.”郭德綱面對鏡頭,用流暢的英文回答采訪問題,從音色到口型、動作都看不出瑕疵。這就是自AI孫燕姿后,AIGC帶來的“新玩法”。

近日,郭德綱英文說相聲、泰勒中文采訪、馬保國日語配音等大量AI制作的明星語言翻譯視頻在抖音、B站等平臺爆火。與之前AI孫燕姿不同的是,這次使用的是公開視頻,不僅做到了聲音克隆,連口型、字幕、動作的配合都達到一致。

在很多人對這一“新玩法”興致盎然的同時,一些播音行業從業者卻感受到危機。“雖然不至于很快被取代,但隨著AI語音技術的發展,類似AI讀書這樣的工作可能就不需要真人了。”播音從業者小堯(化名)表示。

01 “我們可能被取代”

如今,AI語音技術已經在各大App上廣泛使用,除了喜馬拉雅、蜻蜓FM等之外,很多讀書軟件也都具備聽書功能。

《IT時報》記者打開微信讀書App,大部分書籍已具備聽書功能,用戶可以選擇AI男聲、AI女聲、AI中年男聲等多種音色。若聽一些歷史類、經濟類等不需要太多感情色彩的書籍,AI聲音和真人聲音聽起來基本沒有差別。

這也是小堯最擔憂的地方。他告訴記者,除了日常體育解說工作外,自己平時還會接一些兼職,例如廣告配音、有聲書平臺讀書等。如在廣告配音中,經驗豐富的播音員每個字能拿到0.5~1元的報酬,而新人播音員每個字只能拿到0.1元,小堯錄一分鐘200字的廣告能拿到50元左右。

有聲自媒體平臺則按照小時計算報酬,新人播音員每小時能拿到80元左右,資深播音員或與平臺達成合作的播音員,每小時可以拿到200元左右報酬。此外,平臺還會根據播音員節目的收聽率、訂閱量、推廣度等進行獎勵。

針對AI郭德綱背后運用的HeyGen工具,UP主“賽博法師”接受媒體采訪時透露,HeyGen分為年付和月付,月付最低29美元,折合人民幣200元左右,其中包含15分鐘生成時間,生成時間越長,價格越高。另一家制作AI換聲的公司的客服人員介紹,AI換聲視頻價格為每秒3元,最少30秒。若以30秒說60個字來計算,那么一個字的價格需要1.5元。

對比之下,同樣的價格人力能配音更長時間,成本也相對較低。但小堯認為,“當AI技術成本比人力成本低時,我們很可能被取代,尤其對于新人播音員。”

蜻蜓FM相關負責人接受媒體采訪時也表示,AI語音是整個行業都須順應的技術潮流,大規模應用只是時間問題。目前,業內在開發更加成熟的AI語音技術,配合其深度學習能力,加入情緒、語氣、音色等參數,更加細膩的聲音表現將會帶到演播中。

因此,解說工作成為小堯今后重點發展方向。相比配音、讀書等照著稿子讀的播音工作,解說需要根據現場情況及時做出反應。尤其是在體育解說中,賽場形勢瞬息萬變,解說員不僅要有獨家風格體現專業性,還需要調動觀眾的情緒。“這樣以情緒情感為主的播音工作是AI永遠無法取代的。”小堯說道。

“AI語音一直是我們的反面教材,我也不鼓勵學生去使用。”上海體育大學體育解說講師李人杰表示,在任何行業,AI都可能替代簡單重復的工作。在他看來,播音工作是播音員通過理解將文字稿以聲音形式呈現給聽眾,對每個字的重音、情感等細節處理就是二次創造的過程。因此,想要不被取代,就需要在配音或讀書工作中注入解說員更多的情感,體現出創造性和藝術性。

02 能檢測出70%“AI郭德綱”

除了聲音克隆外,讓網友們最為震驚的還是視頻中郭德綱說英語時,口型與字幕的完美契合。

“這是口型驅動AI合成技術,屬于AI合成技術下的一條分支,底層邏輯是一樣的。”北京瑞萊智慧科技有限公司高級產品經理張天奕告訴《IT時報》記者,口型驅動AI技術一般會用到兩種方案,一種方案相對傳統,即AI尋找語句發音中的元音字母,將口型與元音發音進行映射,最終接起來實現平滑轉換;另一種則是從深度學習角度出發,AI會通過對語音和文本來計算出各個音節所對應口型特征的關鍵點,生成每一幀的圖像后再合成視頻。

其實,口型驅動技術并不是今年的“新品”,許多外國影片引入國內時,會讓角色對應中文口型。如2015年上映的《功夫熊貓》,主創團隊就透露,影片按照中文臺詞為每個角色都制作了相應的口型。2019年,國外多個研究團隊還推出了一套算法,能捕捉人物講話時嘴部動作,并生成新視頻。

隨著AI技術越來越成熟,合成視頻越來越難辨真假,“對抗AI”的檢測工具就變得十分重要。張天奕介紹,從此前的AI換臉來看,瑞萊Deep Real檢測平臺在檢測過程中主要是對比臉部五官、發型、背景等較為直觀的特征,其中對戴眼鏡替換成不戴眼鏡的人臉檢測較為明顯。而對于口型驅動AI技術,注重的是牙齒、嘴唇運動等局部檢測,更多細節也意味著檢測面臨新挑戰。

“我們測試了一下,目前瑞萊Deep Real檢測平臺對口型驅動AI的檢測成功率大概在70%。”張天奕表示,想要攻破最后的30%還需要通過大量樣本測試,針對性地去尋找“AI郭德綱”獨特的軌道特征。

03 全球需要共治AI

11月7日,《IT時報》記者登入HeyGen時發現,網頁已經打不開了。據其他使用者介紹,免費試用的用戶可以上傳一段不超過1GB大小的視頻,但上傳視頻時已有3萬多人在排隊,想要跳過排隊就只能付費。

上海大邦律師事務所高級合伙人、知識產權律師游云庭曾發文表示,Heygen提供的是面向用戶的一對一視頻翻譯轉換服務,網站并不會向公眾發布轉換后的內容,所以Heygen的知識產權侵權風險較小。但用戶用Heygen將他人的講話視頻生成了翻譯后的內容發布到網上,就需要獲得授權。比如某人上傳了郭德綱的相聲視頻,就需要取得郭德綱的肖像權、聲音權的授權,相聲視頻的錄像制作者權和相聲文字內容版權授權,缺少任何一個都可能涉嫌侵權。

不只是侵權風險,生成式人工智能的快速發展也讓人們產生“危機感”。11月1日,在英國召開的全球首屆人工智能安全峰會更是體現出世界各國對AI治理的重視。在峰會上,全球28個國家和歐盟一致認為,AI對人類構成潛在的災難性風險,并發布全球第一份針對人工智能新興技術的國際性聲明《布萊切利宣言》,旨在關注對未來強大人工智能模型構成人類生存威脅的擔憂,以及對人工智能當前增強有害或偏見信息的擔憂。

馬斯克在這次峰會上表示:“人工智能很可能成為一股向善的力量,但它變壞的可能性并不是零。”

中國科技部副部長吳朝暉表示,發展人工智能應當積極倡導以人為本,加強技術風險管控,在相互尊重、平等互利的原則基礎上,鼓勵各方協同共治。

排版/ 季嘉穎

本文為轉載內容,授權事宜請聯系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

“郭德綱”用英語說相聲,AI語音技術該如何監管?

人們擔心人工智能“變壞”。

文|IT時報記者 沈毅斌

編輯|錢立富 孫妍

“Let's be happy and that's it,don't overthink, overthinking is pointless, it's part of being human.”郭德綱面對鏡頭,用流暢的英文回答采訪問題,從音色到口型、動作都看不出瑕疵。這就是自AI孫燕姿后,AIGC帶來的“新玩法”。

近日,郭德綱英文說相聲、泰勒中文采訪、馬保國日語配音等大量AI制作的明星語言翻譯視頻在抖音、B站等平臺爆火。與之前AI孫燕姿不同的是,這次使用的是公開視頻,不僅做到了聲音克隆,連口型、字幕、動作的配合都達到一致。

在很多人對這一“新玩法”興致盎然的同時,一些播音行業從業者卻感受到危機。“雖然不至于很快被取代,但隨著AI語音技術的發展,類似AI讀書這樣的工作可能就不需要真人了。”播音從業者小堯(化名)表示。

01 “我們可能被取代”

如今,AI語音技術已經在各大App上廣泛使用,除了喜馬拉雅、蜻蜓FM等之外,很多讀書軟件也都具備聽書功能。

《IT時報》記者打開微信讀書App,大部分書籍已具備聽書功能,用戶可以選擇AI男聲、AI女聲、AI中年男聲等多種音色。若聽一些歷史類、經濟類等不需要太多感情色彩的書籍,AI聲音和真人聲音聽起來基本沒有差別。

這也是小堯最擔憂的地方。他告訴記者,除了日常體育解說工作外,自己平時還會接一些兼職,例如廣告配音、有聲書平臺讀書等。如在廣告配音中,經驗豐富的播音員每個字能拿到0.5~1元的報酬,而新人播音員每個字只能拿到0.1元,小堯錄一分鐘200字的廣告能拿到50元左右。

有聲自媒體平臺則按照小時計算報酬,新人播音員每小時能拿到80元左右,資深播音員或與平臺達成合作的播音員,每小時可以拿到200元左右報酬。此外,平臺還會根據播音員節目的收聽率、訂閱量、推廣度等進行獎勵。

針對AI郭德綱背后運用的HeyGen工具,UP主“賽博法師”接受媒體采訪時透露,HeyGen分為年付和月付,月付最低29美元,折合人民幣200元左右,其中包含15分鐘生成時間,生成時間越長,價格越高。另一家制作AI換聲的公司的客服人員介紹,AI換聲視頻價格為每秒3元,最少30秒。若以30秒說60個字來計算,那么一個字的價格需要1.5元。

對比之下,同樣的價格人力能配音更長時間,成本也相對較低。但小堯認為,“當AI技術成本比人力成本低時,我們很可能被取代,尤其對于新人播音員。”

蜻蜓FM相關負責人接受媒體采訪時也表示,AI語音是整個行業都須順應的技術潮流,大規模應用只是時間問題。目前,業內在開發更加成熟的AI語音技術,配合其深度學習能力,加入情緒、語氣、音色等參數,更加細膩的聲音表現將會帶到演播中。

因此,解說工作成為小堯今后重點發展方向。相比配音、讀書等照著稿子讀的播音工作,解說需要根據現場情況及時做出反應。尤其是在體育解說中,賽場形勢瞬息萬變,解說員不僅要有獨家風格體現專業性,還需要調動觀眾的情緒。“這樣以情緒情感為主的播音工作是AI永遠無法取代的。”小堯說道。

“AI語音一直是我們的反面教材,我也不鼓勵學生去使用。”上海體育大學體育解說講師李人杰表示,在任何行業,AI都可能替代簡單重復的工作。在他看來,播音工作是播音員通過理解將文字稿以聲音形式呈現給聽眾,對每個字的重音、情感等細節處理就是二次創造的過程。因此,想要不被取代,就需要在配音或讀書工作中注入解說員更多的情感,體現出創造性和藝術性。

02 能檢測出70%“AI郭德綱”

除了聲音克隆外,讓網友們最為震驚的還是視頻中郭德綱說英語時,口型與字幕的完美契合。

“這是口型驅動AI合成技術,屬于AI合成技術下的一條分支,底層邏輯是一樣的。”北京瑞萊智慧科技有限公司高級產品經理張天奕告訴《IT時報》記者,口型驅動AI技術一般會用到兩種方案,一種方案相對傳統,即AI尋找語句發音中的元音字母,將口型與元音發音進行映射,最終接起來實現平滑轉換;另一種則是從深度學習角度出發,AI會通過對語音和文本來計算出各個音節所對應口型特征的關鍵點,生成每一幀的圖像后再合成視頻。

其實,口型驅動技術并不是今年的“新品”,許多外國影片引入國內時,會讓角色對應中文口型。如2015年上映的《功夫熊貓》,主創團隊就透露,影片按照中文臺詞為每個角色都制作了相應的口型。2019年,國外多個研究團隊還推出了一套算法,能捕捉人物講話時嘴部動作,并生成新視頻。

隨著AI技術越來越成熟,合成視頻越來越難辨真假,“對抗AI”的檢測工具就變得十分重要。張天奕介紹,從此前的AI換臉來看,瑞萊Deep Real檢測平臺在檢測過程中主要是對比臉部五官、發型、背景等較為直觀的特征,其中對戴眼鏡替換成不戴眼鏡的人臉檢測較為明顯。而對于口型驅動AI技術,注重的是牙齒、嘴唇運動等局部檢測,更多細節也意味著檢測面臨新挑戰。

“我們測試了一下,目前瑞萊Deep Real檢測平臺對口型驅動AI的檢測成功率大概在70%。”張天奕表示,想要攻破最后的30%還需要通過大量樣本測試,針對性地去尋找“AI郭德綱”獨特的軌道特征。

03 全球需要共治AI

11月7日,《IT時報》記者登入HeyGen時發現,網頁已經打不開了。據其他使用者介紹,免費試用的用戶可以上傳一段不超過1GB大小的視頻,但上傳視頻時已有3萬多人在排隊,想要跳過排隊就只能付費。

上海大邦律師事務所高級合伙人、知識產權律師游云庭曾發文表示,Heygen提供的是面向用戶的一對一視頻翻譯轉換服務,網站并不會向公眾發布轉換后的內容,所以Heygen的知識產權侵權風險較小。但用戶用Heygen將他人的講話視頻生成了翻譯后的內容發布到網上,就需要獲得授權。比如某人上傳了郭德綱的相聲視頻,就需要取得郭德綱的肖像權、聲音權的授權,相聲視頻的錄像制作者權和相聲文字內容版權授權,缺少任何一個都可能涉嫌侵權。

不只是侵權風險,生成式人工智能的快速發展也讓人們產生“危機感”。11月1日,在英國召開的全球首屆人工智能安全峰會更是體現出世界各國對AI治理的重視。在峰會上,全球28個國家和歐盟一致認為,AI對人類構成潛在的災難性風險,并發布全球第一份針對人工智能新興技術的國際性聲明《布萊切利宣言》,旨在關注對未來強大人工智能模型構成人類生存威脅的擔憂,以及對人工智能當前增強有害或偏見信息的擔憂。

馬斯克在這次峰會上表示:“人工智能很可能成為一股向善的力量,但它變壞的可能性并不是零。”

中國科技部副部長吳朝暉表示,發展人工智能應當積極倡導以人為本,加強技術風險管控,在相互尊重、平等互利的原則基礎上,鼓勵各方協同共治。

排版/ 季嘉穎

本文為轉載內容,授權事宜請聯系原著作權人。
主站蜘蛛池模板: 云和县| 大悟县| 盐池县| 方正县| 财经| 水城县| 锡林郭勒盟| 孝感市| 峡江县| 阜新| 化德县| 白玉县| 晋城| 甘孜县| 万全县| 宿松县| 旬阳县| 绩溪县| 隆安县| 丘北县| 灵武市| 建平县| 永康市| 田林县| 新龙县| 饶平县| 隆昌县| 兴仁县| 涪陵区| 政和县| 嘉鱼县| 沂水县| 白城市| 广西| 博湖县| 永宁县| 贵定县| 邹城市| 油尖旺区| 东城区| 扎囊县|