簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

真假難辨,谷歌發(fā)布最強文生圖大模型 Imagen 2

掃一掃下載界面新聞APP

真假難辨,谷歌發(fā)布最強文生圖大模型 Imagen 2

可提供與用戶提示詞緊密結(jié)合且一致的高質(zhì)量、逼真的圖像輸出。

文|AI新智界

谷歌剛剛發(fā)布了其最強大的文生圖大模型 Imagen 2,可提供與用戶提示詞緊密結(jié)合且一致的高質(zhì)量、逼真的圖像輸出。它可以通過使用訓練數(shù)據(jù)的自然分布來生成更逼真的圖像,而不是采用預先編程的風格。

谷歌的增強模型 Imagen 2 是利用谷歌旗艦人工智能實驗室 Google DeepMind 的技術(shù)開發(fā)的,該模型在 5 月份的科技巨頭 I/O 大會上悄悄推出了預覽版。谷歌聲稱,與第一代 Imagen 相比,它在圖像質(zhì)量方面“顯著”提高,并引入了新功能,包括渲染文本和 Logo 的能力。

谷歌云首席執(zhí)行官托馬斯·庫里安(Thomas Kurian)在周二的新聞發(fā)布會上表示,“如果你想創(chuàng)建帶有文本疊加的圖像——例如廣告——你可以做到?!?/p>

谷歌生成媒體產(chǎn)品主管 Vishy Tirumalasetty 表示,“Imagen 2 可以生成……徽章、字母標記和抽象徽標……[并且]能夠?qū)⑦@些徽標覆蓋到產(chǎn)品、服裝、名片和其他表面上?!?/p>

得益于“新穎的訓練和建模技術(shù)”,Imagen 2 還可以理解更具描述性的長格式提示,并對有關(guān)圖像中元素的問題提供“詳細答案”。谷歌表示,這些技術(shù)還增強了 Imagen 2 的多語言理解能力——允許模型將一種語言的提示翻譯成另一種語言的輸出(例如 Logo)。

Imagen 2 利用 SynthID(DeepMind 開發(fā)的一種方法)將隱形水印應用到其創(chuàng)建的圖像上。當然,檢測這些水?。ü雀杪暦Q這些水印能夠適應圖像編輯,包括壓縮、濾鏡和顏色調(diào)整)需要谷歌提供的工具,而第三方無法使用該工具。

目前開發(fā)人員和谷歌云客戶已經(jīng)可以體驗 Imagen 2 的強大:

https://cloud.google.com/blog/products/ai-machine-learning/imagen-2-on-vertex-ai-is-now-generally-available

圖像逼真程度達到新高度

看下圖,你能一眼猜到是 AI 生成的嗎?

提示詞:一張 32 歲女性在叢林中的照片,她是一位嶄露頭角的自然資源保護主義者;運動型短卷發(fā),笑容溫暖

提示詞:深藍色背景上的水母

提示詞:一幅小畫布油畫,顯示案板上的橘子。光線穿過橙色部分,在切菜板的一部分上投射出橙色光。背景中有一塊藍色和白色的布。焦散、反射光、富有表現(xiàn)力的筆觸

對圖像提示詞的理解達到新的高度

文生圖模型學習根據(jù)訓練數(shù)據(jù)集的圖像和文字說明中的詳細信息生成與用戶提示相匹配的圖像。但對于每個圖像和蚊子說明,這些配對的細節(jié)質(zhì)量和準確性可能會有很大差異。

為了幫助創(chuàng)建更高質(zhì)量、更準確的圖像,更好地符合用戶的提示,谷歌在 Imagen 2 訓練數(shù)據(jù)集中的圖像說明文字中添加了進一步的描述,幫助 Imagen 2 學習不同的文字說明樣式并進行概括,以更好地理解廣泛的用戶提示。

這些增強的圖像-文字說明配對有助于 Imagen 2 更好地理解圖像和文字之間的關(guān)系,從而增強對上下文和細微差別的理解。

以下是 Imagen 2 快速理解的示例:

1. AI 生成油畫圖像

提示詞:“溪水輕柔地流淌,鳥兒重新唱出它們的音符,它們混合的音樂在空中飄蕩?!?(菲利斯·惠特利的《晚間贊美詩》)

2. 人工智能生成水下場景彩繪圖像

提示詞:“考慮大海的微妙;其中最可怕的生物如何在水下滑行,大部分時間是不可見的,并且危險地隱藏在最美麗的蔚藍色調(diào)下?!保ê諣柭っ窢柧S爾的《白鯨》)

3. 人工智能生成逼真的歌唱知更鳥圖像

提示詞:“知更鳥從搖曳的常春藤叢中飛到了墻頂上,張開喙,唱起了響亮、可愛的顫音,只是為了炫耀。世界上沒有什么比知更鳥炫耀時更可愛了——而且它們幾乎總是這樣做?!保ǜダ饰魉埂せ羝嫔げ畠?nèi)特的《秘密花園》)

更真實的圖像生成

Imagen 2 的數(shù)據(jù)集和模型進步在文本轉(zhuǎn)圖像工具經(jīng)常難以解決的許多領(lǐng)域提供了改進,包括渲染逼真的手和人臉以及保持圖像免受分散注意力的視覺偽影。

Imagen 2 生成逼真的手和人臉的示例

谷歌根據(jù)人類對良好照明、取景、曝光、清晰度等品質(zhì)的偏好,訓練了專門的圖像美學模型。每張圖像都會獲得一個美觀評分,這有助于調(diào)節(jié) Imagen 2,使其訓練數(shù)據(jù)集中的圖像具有更多權(quán)重,以符合人類喜歡的品質(zhì)。該技術(shù)提高了 Imagen 2 生成更高質(zhì)量圖像的能力。

AI 使用提示“花”生成的圖像,美學分數(shù)較低(左)到較高分數(shù)(右)

流體式調(diào)理

Imagen 2 基于擴散的技術(shù)提供了高度的靈活性,使得控制和調(diào)整圖像的風格變得更加容易。通過提供參考風格圖像與文本提示相結(jié)合,我們可以調(diào)節(jié) Imagen 2 以生成遵循相同風格的新圖像。

可視化顯示 Imagen 2 如何通過在文本提示旁邊使用參考圖像來更輕松地控制輸出樣式。

高級修圖功能

Imagen 2 還支持“inpainting”和“outpainting”等圖像編輯功能。通過提供參考圖像和圖像蒙版,用戶可以使用稱為修復的技術(shù)直接在原始圖像中生成新內(nèi)容,或者通過修復將原始圖像擴展到其邊界之外。這項技術(shù)計劃在新的一年用于谷歌云的 Vertex AI。

Imagen 2 可以通過 inpainting 擴圖功能直接在原始圖像中生成新內(nèi)容。

Imagen 2 可以通過 outpainting 將原始圖像擴展到其邊界之外。

參考資料:

https://deepmind.google/technologies/imagen-2/

https://techcrunch.com/2023/12/13/google-debuts-imagen-2-with-text-and-logo-generation/

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

谷歌

6.4k
  • 谷歌跌幅擴大至2%
  • 美國得州州長簽署法律,對蘋果和谷歌應用商店實施年齡驗證

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

真假難辨,谷歌發(fā)布最強文生圖大模型 Imagen 2

可提供與用戶提示詞緊密結(jié)合且一致的高質(zhì)量、逼真的圖像輸出。

文|AI新智界

谷歌剛剛發(fā)布了其最強大的文生圖大模型 Imagen 2,可提供與用戶提示詞緊密結(jié)合且一致的高質(zhì)量、逼真的圖像輸出。它可以通過使用訓練數(shù)據(jù)的自然分布來生成更逼真的圖像,而不是采用預先編程的風格。

谷歌的增強模型 Imagen 2 是利用谷歌旗艦人工智能實驗室 Google DeepMind 的技術(shù)開發(fā)的,該模型在 5 月份的科技巨頭 I/O 大會上悄悄推出了預覽版。谷歌聲稱,與第一代 Imagen 相比,它在圖像質(zhì)量方面“顯著”提高,并引入了新功能,包括渲染文本和 Logo 的能力。

谷歌云首席執(zhí)行官托馬斯·庫里安(Thomas Kurian)在周二的新聞發(fā)布會上表示,“如果你想創(chuàng)建帶有文本疊加的圖像——例如廣告——你可以做到?!?/p>

谷歌生成媒體產(chǎn)品主管 Vishy Tirumalasetty 表示,“Imagen 2 可以生成……徽章、字母標記和抽象徽標……[并且]能夠?qū)⑦@些徽標覆蓋到產(chǎn)品、服裝、名片和其他表面上?!?/p>

得益于“新穎的訓練和建模技術(shù)”,Imagen 2 還可以理解更具描述性的長格式提示,并對有關(guān)圖像中元素的問題提供“詳細答案”。谷歌表示,這些技術(shù)還增強了 Imagen 2 的多語言理解能力——允許模型將一種語言的提示翻譯成另一種語言的輸出(例如 Logo)。

Imagen 2 利用 SynthID(DeepMind 開發(fā)的一種方法)將隱形水印應用到其創(chuàng)建的圖像上。當然,檢測這些水?。ü雀杪暦Q這些水印能夠適應圖像編輯,包括壓縮、濾鏡和顏色調(diào)整)需要谷歌提供的工具,而第三方無法使用該工具。

目前開發(fā)人員和谷歌云客戶已經(jīng)可以體驗 Imagen 2 的強大:

https://cloud.google.com/blog/products/ai-machine-learning/imagen-2-on-vertex-ai-is-now-generally-available

圖像逼真程度達到新高度

看下圖,你能一眼猜到是 AI 生成的嗎?

提示詞:一張 32 歲女性在叢林中的照片,她是一位嶄露頭角的自然資源保護主義者;運動型短卷發(fā),笑容溫暖

提示詞:深藍色背景上的水母

提示詞:一幅小畫布油畫,顯示案板上的橘子。光線穿過橙色部分,在切菜板的一部分上投射出橙色光。背景中有一塊藍色和白色的布。焦散、反射光、富有表現(xiàn)力的筆觸

對圖像提示詞的理解達到新的高度

文生圖模型學習根據(jù)訓練數(shù)據(jù)集的圖像和文字說明中的詳細信息生成與用戶提示相匹配的圖像。但對于每個圖像和蚊子說明,這些配對的細節(jié)質(zhì)量和準確性可能會有很大差異。

為了幫助創(chuàng)建更高質(zhì)量、更準確的圖像,更好地符合用戶的提示,谷歌在 Imagen 2 訓練數(shù)據(jù)集中的圖像說明文字中添加了進一步的描述,幫助 Imagen 2 學習不同的文字說明樣式并進行概括,以更好地理解廣泛的用戶提示。

這些增強的圖像-文字說明配對有助于 Imagen 2 更好地理解圖像和文字之間的關(guān)系,從而增強對上下文和細微差別的理解。

以下是 Imagen 2 快速理解的示例:

1. AI 生成油畫圖像

提示詞:“溪水輕柔地流淌,鳥兒重新唱出它們的音符,它們混合的音樂在空中飄蕩。” (菲利斯·惠特利的《晚間贊美詩》)

2. 人工智能生成水下場景彩繪圖像

提示詞:“考慮大海的微妙;其中最可怕的生物如何在水下滑行,大部分時間是不可見的,并且危險地隱藏在最美麗的蔚藍色調(diào)下?!保ê諣柭っ窢柧S爾的《白鯨》)

3. 人工智能生成逼真的歌唱知更鳥圖像

提示詞:“知更鳥從搖曳的常春藤叢中飛到了墻頂上,張開喙,唱起了響亮、可愛的顫音,只是為了炫耀。世界上沒有什么比知更鳥炫耀時更可愛了——而且它們幾乎總是這樣做?!保ǜダ饰魉埂せ羝嫔げ畠?nèi)特的《秘密花園》)

更真實的圖像生成

Imagen 2 的數(shù)據(jù)集和模型進步在文本轉(zhuǎn)圖像工具經(jīng)常難以解決的許多領(lǐng)域提供了改進,包括渲染逼真的手和人臉以及保持圖像免受分散注意力的視覺偽影。

Imagen 2 生成逼真的手和人臉的示例

谷歌根據(jù)人類對良好照明、取景、曝光、清晰度等品質(zhì)的偏好,訓練了專門的圖像美學模型。每張圖像都會獲得一個美觀評分,這有助于調(diào)節(jié) Imagen 2,使其訓練數(shù)據(jù)集中的圖像具有更多權(quán)重,以符合人類喜歡的品質(zhì)。該技術(shù)提高了 Imagen 2 生成更高質(zhì)量圖像的能力。

AI 使用提示“花”生成的圖像,美學分數(shù)較低(左)到較高分數(shù)(右)

流體式調(diào)理

Imagen 2 基于擴散的技術(shù)提供了高度的靈活性,使得控制和調(diào)整圖像的風格變得更加容易。通過提供參考風格圖像與文本提示相結(jié)合,我們可以調(diào)節(jié) Imagen 2 以生成遵循相同風格的新圖像。

可視化顯示 Imagen 2 如何通過在文本提示旁邊使用參考圖像來更輕松地控制輸出樣式。

高級修圖功能

Imagen 2 還支持“inpainting”和“outpainting”等圖像編輯功能。通過提供參考圖像和圖像蒙版,用戶可以使用稱為修復的技術(shù)直接在原始圖像中生成新內(nèi)容,或者通過修復將原始圖像擴展到其邊界之外。這項技術(shù)計劃在新的一年用于谷歌云的 Vertex AI。

Imagen 2 可以通過 inpainting 擴圖功能直接在原始圖像中生成新內(nèi)容。

Imagen 2 可以通過 outpainting 將原始圖像擴展到其邊界之外。

參考資料:

https://deepmind.google/technologies/imagen-2/

https://techcrunch.com/2023/12/13/google-debuts-imagen-2-with-text-and-logo-generation/

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。
主站蜘蛛池模板: 肥城市| 惠东县| 麻阳| 商城县| 武宣县| 宁安市| 玉树县| 青田县| 凯里市| 钦州市| 波密县| 巫溪县| 大悟县| 五河县| 鄂尔多斯市| 高雄县| 罗平县| 札达县| 凤凰县| 沭阳县| 凉山| 昆明市| 鲁山县| 阿鲁科尔沁旗| 清丰县| 商南县| 柘城县| 宕昌县| 高唐县| 东城区| 连平县| 彰武县| 平武县| 齐齐哈尔市| 巴马| 常州市| 比如县| 宿松县| 阳山县| 皋兰县| 邯郸县|