簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

一文看盡谷歌年度AI盛會:首用AI生成超分辨率視頻,公布1000種語言計劃

掃一掃下載界面新聞APP

一文看盡谷歌年度AI盛會:首用AI生成超分辨率視頻,公布1000種語言計劃

從高效生成到預防災害,AI正帶來越來越多積極的影響。

文|智東西 ZeR0

編輯|漠影

智東西11月3日報道,昨晚,谷歌舉辦人工智能(AI)年度活動,并公布多項AI研究進展,包括用AI生成具有難以置信的真實性的視頻、文字、圖像、音頻,以及用AI預防洪水、野火等自然災害,解決社會面臨的重大挑戰。

同時,谷歌宣布推出“一千種語言計劃”,其語言模型將支持全球1000種最常用語言的模型,讓更多語種受益于AI。

01.AI準確理解文字描述,生成超分辨率視頻

生成式AI已經成為高效生成文本、代碼、音頻、圖像和視頻的強大工具。

今夏早些時候,谷歌介紹了兩種AI生成圖像模型Imagen和Parti,它們都能從文本提示生成圖像。隨后谷歌又公布兩種互補的研究方法Phenaki和Imagen Video,能根據文本生成短視頻。

其中,Phenaki可以隨著文本描述(prompts)的時間變化,生成長達數分鐘的連貫視頻;Imagen Video是應用于視頻序列的擴散模型,在文本理解方面建立在大型Transformer語言模型之上,在高保真圖像生成方面依賴于擴散模型,因此兼具高逼真度和極強的語言理解能力。

谷歌Imagen Video和Phenaki團隊一直在合作制作AI生成的超級分辨率視頻,將Imagen Video和Phenaki模型結合起來時,能得到兩全其美的結果:在幀級的超級分辨率和時間上的一致性。

02.寫小說、3D合成、音頻生成,AI樣樣在行

除了從文本生成視頻外,谷歌也分享了其用于協作的可控文本生成項目LaMDA Wordcraft,可幫助產生一些新的想法或重寫句子,來為作家提供協作靈感。

為了測試LaMDA Wordcraft的能力,谷歌與專業作家合作組成研討會,讓他們使用探索寫作的文本生成項目Wordcraft編輯器來創作一卷短篇小說,來試驗AI文本生成的能力。

在從文本到3D合成方面,谷歌研發了一個預訓練的2D文本到圖像的擴散模型DreamFusion。給定一個描述生成,DreamFusion就能生成具有高保真外觀、深度和法線且能夠在不同光照條件下進行渲染的3D模型。

在音頻生成方面,谷歌有一個全新的音頻生成框架AudioLM。這是一個純音頻模型,在沒有任何文字或音樂符號表示的情況下進行訓練,可以只根據簡短的音頻樣本學習生成逼真的、高質量的語音和音樂。

谷歌還宣布推出第二代AI Test Kitchen,為人們提供一個了解、體驗和反饋其新興生成性AI技術的途徑。第二代AI Test Kitchen將通過兩個演示來進一步展示從文本到圖像的生成。

第一個演示是“城市夢想家”(City Dreamer),它使用谷歌對話引擎LaMDA和谷歌的圖像模型組合,使用戶能快速構建個性化的城市景觀;第二個演示叫“Wobble”,使用谷歌的圖像模型LaMDA和谷歌最新的2D-3D休閑動畫技術,可以創造能移動、跳舞的友好怪物。

這些體驗將在AI Test Kitchen中陸續登陸,用戶可從Play Store或App Store獲得該應用,并開始使用LaMDA。

03.推出“一千種語言計劃”讓AI助攻全球語言

語言是人們互相交流和理解周圍世界的核心介質。2017年,谷歌開發了Transformer語言模型,它被視作所有現代語言模型的“鼻祖”,此后谷歌一直專注于具有突破性的語言模型研究,諸如谷歌翻譯等應用已經支持幾百種語言,谷歌還宣布新增對24種語言的支持。

但這些仍然遠遠不夠。世界上有超過7000種語言,而目前互聯網只能很好地支持其中一小部分。

為了向全球更廣泛的地區提供基于AI的語言技術,谷歌推出“一千種語言計劃”,以支持全球1000種最常用語言的模型。谷歌將這比作“登月行動”,希望以此為世界各地邊緣化群體的數十億人帶去更大的包容性。

這個計劃覆蓋了谷歌長期在多模態、與更多語言群體合作等方面的努力。當前谷歌在研究更先進的模型,能直接處理基于語言的信息,跨越圖像、視頻和語音等多種模態。

例如,谷歌已經開發了一個通用語言模型(Universal Speech Model),它支持400多種語言,是迄今覆蓋語種最多的語言模型。

谷歌正與世界各地的語言群體合作,以獲得語言數據,最近宣布在Gboard上支持另外9種非洲語言的語音輸入,并在南亞積極收集所有方言和語言的代表性音頻樣本。

與此同時,谷歌計劃在YouTube、GBoard、Translate等產品中改進語言支持,方便人們基于不同語種使用這些技術,并找到相關內容。

04.AI預警洪水,能精確大約100米的范圍

洪水每年在世界各地奪走數以萬計的生命,造成數十億美元的損失。而可靠的早期預警系統已被證明可減少43%的死亡、35-50%的經濟損失。

谷歌早在2017年就啟動洪水預測項目,通過引入AI技術,為人們提供準確而詳細的警報,以抵御每年洪水帶來的災難性損失。谷歌洪水預測系統能告訴人們哪些地區將受到影響,以及每個點位的水深是多少,可精確到大約100米的范圍,即大概精確到一個村莊或一個社區。

人們能直接在谷歌地圖(Google Maps)上看到這些信息,及時做出響應。

此前該系統主要用在印度和孟加拉國。去年,谷歌向印度和孟加拉國的2300萬人發送了1.15億條有關洪水的通知,并引導他們關注Google Search和Maps上的洪水預警。在谷歌的支持下,耶魯大學經濟增長研究中心進行的初步研究表明,其通知使收到洪水預警的人數增加了2倍,采取保護行動的人數也增加了3倍。

借助遷移學習AI技術,谷歌宣布該系統將擴展到18個新的國家,包括巴西、哥倫比亞、斯里蘭卡、布基納法索、喀麥隆、乍得、剛果民主共和國、象牙海岸、加納、幾內亞、馬拉維、尼日利亞、塞拉利昂、安哥拉、南蘇丹、納米比亞、利比里亞、南非等。

此外,谷歌還在全球范圍內推出新的模型Google FloodHub,該平臺可以顯示洪水可能發生的時間和地點。

05.實時火災追蹤,及時撲救野火

因氣候變化,野火近年來持續惡化。每年,野火造成的損失高達26億美元,并產生約2千兆噸的二氧化碳排放。

谷歌野火團隊使用衛星圖像來訓練機器學習模型,使其能從空間和時間的維度去識別野火,并及時告知其用戶野火發生的地點。其野火追蹤項目已在澳大利亞、美國、加拿大和墨西哥上線。

目前谷歌正在研究的3個模型:

1、實時火災追蹤:其模型可實時識別現有火災的范圍。該模型自2021年11月在澳大利亞的Google SOS警報上推出,2022年7月在美國、加拿大和墨西哥的Google SOS警報上推廣。

2、火災蔓延預測:該模型旨在預測現有的火災將如何演變,以便為正在進行野火撲救的小組提供如蔓延方向預測等的業務信息。

3、早期野火探測:此模型能在火災出現后不久就發現火災,以便在火勢失控前通知有關部門。

06.為產婦和視網膜疾病篩查帶來福音

面向醫療健康,谷歌正通過引入AI技術,幫助呵護產婦健康和加強糖尿病視網膜病變等眼部疾病問題的篩查。

上個月,谷歌在國際學術頂刊Nature的子刊Nature Communications Medicine上發表了一篇論文,展示了AI如何幫助讀取和分析低成本超聲設備的數據。這可以向準父母提供他們所需的信息,以便其在孕期更早地發現問題。

此外,谷歌還與美國西北大學醫學院合作開發AI,協助護士和助產士輕松地收集和解釋超聲圖像。該工具有能力確定胎兒的位置和胎齡,而且可以在沒有網絡連接的設備上運行,對醫護人員在懷孕早期發現問題很有幫助。

與此同時,谷歌也在加強眼科篩查計劃,利用其自動視網膜疾病評估工具(ARDA)開展了大量工作,已經成功篩查了超15萬名患者,其中有超過一半的篩查是今年完成的。

谷歌還在開發用手機監測呼吸和心率的技術。

07.結語:致力于研發負責任的AI

推進AI研究的旅程中,在幫助人們解決重要現實問題的同時,谷歌一向對道德約束和社會影響非常謹慎。

在本次年度AI活動上,谷歌也再度重申了對負責任的AI的重視,強調如果在沒有任何原則或道德指導的情況下開發生成式AI技術,這可能帶來很大風險,比如被惡意行為者利用去做壞事。

因此,谷歌研究團隊正積極地將谷歌AI原則(Google AI Principles)融入其中,尤其注重3個關鍵方面:

1、“可控”:確保制造的工具有益于人類,模型和項目需要適當的人為控制,以確保用戶安全,例如文本生成圖像模型使用了保障數據集來防止生成有害的圖像。

2、制造能夠檢測生成式AI的工具:谷歌在AudioLM項目中訓練了一個分類器,能以近99%的準確率檢測合成語音。

3、與世界各地的社區積極合作:開源對于谷歌來說是很重要的一部分,谷歌計劃制定一套開源政策,以適應其AI原則。谷歌還在積極與藝術家和創作者等合作。

本文為轉載內容,授權事宜請聯系原著作權人。

谷歌

6.2k
  • OpenAI有意買下谷歌Chrome瀏覽器
  • 美國法院裁定谷歌濫用廣告主導地位,谷歌表示將上訴

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

一文看盡谷歌年度AI盛會:首用AI生成超分辨率視頻,公布1000種語言計劃

從高效生成到預防災害,AI正帶來越來越多積極的影響。

文|智東西 ZeR0

編輯|漠影

智東西11月3日報道,昨晚,谷歌舉辦人工智能(AI)年度活動,并公布多項AI研究進展,包括用AI生成具有難以置信的真實性的視頻、文字、圖像、音頻,以及用AI預防洪水、野火等自然災害,解決社會面臨的重大挑戰。

同時,谷歌宣布推出“一千種語言計劃”,其語言模型將支持全球1000種最常用語言的模型,讓更多語種受益于AI。

01.AI準確理解文字描述,生成超分辨率視頻

生成式AI已經成為高效生成文本、代碼、音頻、圖像和視頻的強大工具。

今夏早些時候,谷歌介紹了兩種AI生成圖像模型Imagen和Parti,它們都能從文本提示生成圖像。隨后谷歌又公布兩種互補的研究方法Phenaki和Imagen Video,能根據文本生成短視頻。

其中,Phenaki可以隨著文本描述(prompts)的時間變化,生成長達數分鐘的連貫視頻;Imagen Video是應用于視頻序列的擴散模型,在文本理解方面建立在大型Transformer語言模型之上,在高保真圖像生成方面依賴于擴散模型,因此兼具高逼真度和極強的語言理解能力。

谷歌Imagen Video和Phenaki團隊一直在合作制作AI生成的超級分辨率視頻,將Imagen Video和Phenaki模型結合起來時,能得到兩全其美的結果:在幀級的超級分辨率和時間上的一致性。

02.寫小說、3D合成、音頻生成,AI樣樣在行

除了從文本生成視頻外,谷歌也分享了其用于協作的可控文本生成項目LaMDA Wordcraft,可幫助產生一些新的想法或重寫句子,來為作家提供協作靈感。

為了測試LaMDA Wordcraft的能力,谷歌與專業作家合作組成研討會,讓他們使用探索寫作的文本生成項目Wordcraft編輯器來創作一卷短篇小說,來試驗AI文本生成的能力。

在從文本到3D合成方面,谷歌研發了一個預訓練的2D文本到圖像的擴散模型DreamFusion。給定一個描述生成,DreamFusion就能生成具有高保真外觀、深度和法線且能夠在不同光照條件下進行渲染的3D模型。

在音頻生成方面,谷歌有一個全新的音頻生成框架AudioLM。這是一個純音頻模型,在沒有任何文字或音樂符號表示的情況下進行訓練,可以只根據簡短的音頻樣本學習生成逼真的、高質量的語音和音樂。

谷歌還宣布推出第二代AI Test Kitchen,為人們提供一個了解、體驗和反饋其新興生成性AI技術的途徑。第二代AI Test Kitchen將通過兩個演示來進一步展示從文本到圖像的生成。

第一個演示是“城市夢想家”(City Dreamer),它使用谷歌對話引擎LaMDA和谷歌的圖像模型組合,使用戶能快速構建個性化的城市景觀;第二個演示叫“Wobble”,使用谷歌的圖像模型LaMDA和谷歌最新的2D-3D休閑動畫技術,可以創造能移動、跳舞的友好怪物。

這些體驗將在AI Test Kitchen中陸續登陸,用戶可從Play Store或App Store獲得該應用,并開始使用LaMDA。

03.推出“一千種語言計劃”讓AI助攻全球語言

語言是人們互相交流和理解周圍世界的核心介質。2017年,谷歌開發了Transformer語言模型,它被視作所有現代語言模型的“鼻祖”,此后谷歌一直專注于具有突破性的語言模型研究,諸如谷歌翻譯等應用已經支持幾百種語言,谷歌還宣布新增對24種語言的支持。

但這些仍然遠遠不夠。世界上有超過7000種語言,而目前互聯網只能很好地支持其中一小部分。

為了向全球更廣泛的地區提供基于AI的語言技術,谷歌推出“一千種語言計劃”,以支持全球1000種最常用語言的模型。谷歌將這比作“登月行動”,希望以此為世界各地邊緣化群體的數十億人帶去更大的包容性。

這個計劃覆蓋了谷歌長期在多模態、與更多語言群體合作等方面的努力。當前谷歌在研究更先進的模型,能直接處理基于語言的信息,跨越圖像、視頻和語音等多種模態。

例如,谷歌已經開發了一個通用語言模型(Universal Speech Model),它支持400多種語言,是迄今覆蓋語種最多的語言模型。

谷歌正與世界各地的語言群體合作,以獲得語言數據,最近宣布在Gboard上支持另外9種非洲語言的語音輸入,并在南亞積極收集所有方言和語言的代表性音頻樣本。

與此同時,谷歌計劃在YouTube、GBoard、Translate等產品中改進語言支持,方便人們基于不同語種使用這些技術,并找到相關內容。

04.AI預警洪水,能精確大約100米的范圍

洪水每年在世界各地奪走數以萬計的生命,造成數十億美元的損失。而可靠的早期預警系統已被證明可減少43%的死亡、35-50%的經濟損失。

谷歌早在2017年就啟動洪水預測項目,通過引入AI技術,為人們提供準確而詳細的警報,以抵御每年洪水帶來的災難性損失。谷歌洪水預測系統能告訴人們哪些地區將受到影響,以及每個點位的水深是多少,可精確到大約100米的范圍,即大概精確到一個村莊或一個社區。

人們能直接在谷歌地圖(Google Maps)上看到這些信息,及時做出響應。

此前該系統主要用在印度和孟加拉國。去年,谷歌向印度和孟加拉國的2300萬人發送了1.15億條有關洪水的通知,并引導他們關注Google Search和Maps上的洪水預警。在谷歌的支持下,耶魯大學經濟增長研究中心進行的初步研究表明,其通知使收到洪水預警的人數增加了2倍,采取保護行動的人數也增加了3倍。

借助遷移學習AI技術,谷歌宣布該系統將擴展到18個新的國家,包括巴西、哥倫比亞、斯里蘭卡、布基納法索、喀麥隆、乍得、剛果民主共和國、象牙海岸、加納、幾內亞、馬拉維、尼日利亞、塞拉利昂、安哥拉、南蘇丹、納米比亞、利比里亞、南非等。

此外,谷歌還在全球范圍內推出新的模型Google FloodHub,該平臺可以顯示洪水可能發生的時間和地點。

05.實時火災追蹤,及時撲救野火

因氣候變化,野火近年來持續惡化。每年,野火造成的損失高達26億美元,并產生約2千兆噸的二氧化碳排放。

谷歌野火團隊使用衛星圖像來訓練機器學習模型,使其能從空間和時間的維度去識別野火,并及時告知其用戶野火發生的地點。其野火追蹤項目已在澳大利亞、美國、加拿大和墨西哥上線。

目前谷歌正在研究的3個模型:

1、實時火災追蹤:其模型可實時識別現有火災的范圍。該模型自2021年11月在澳大利亞的Google SOS警報上推出,2022年7月在美國、加拿大和墨西哥的Google SOS警報上推廣。

2、火災蔓延預測:該模型旨在預測現有的火災將如何演變,以便為正在進行野火撲救的小組提供如蔓延方向預測等的業務信息。

3、早期野火探測:此模型能在火災出現后不久就發現火災,以便在火勢失控前通知有關部門。

06.為產婦和視網膜疾病篩查帶來福音

面向醫療健康,谷歌正通過引入AI技術,幫助呵護產婦健康和加強糖尿病視網膜病變等眼部疾病問題的篩查。

上個月,谷歌在國際學術頂刊Nature的子刊Nature Communications Medicine上發表了一篇論文,展示了AI如何幫助讀取和分析低成本超聲設備的數據。這可以向準父母提供他們所需的信息,以便其在孕期更早地發現問題。

此外,谷歌還與美國西北大學醫學院合作開發AI,協助護士和助產士輕松地收集和解釋超聲圖像。該工具有能力確定胎兒的位置和胎齡,而且可以在沒有網絡連接的設備上運行,對醫護人員在懷孕早期發現問題很有幫助。

與此同時,谷歌也在加強眼科篩查計劃,利用其自動視網膜疾病評估工具(ARDA)開展了大量工作,已經成功篩查了超15萬名患者,其中有超過一半的篩查是今年完成的。

谷歌還在開發用手機監測呼吸和心率的技術。

07.結語:致力于研發負責任的AI

推進AI研究的旅程中,在幫助人們解決重要現實問題的同時,谷歌一向對道德約束和社會影響非常謹慎。

在本次年度AI活動上,谷歌也再度重申了對負責任的AI的重視,強調如果在沒有任何原則或道德指導的情況下開發生成式AI技術,這可能帶來很大風險,比如被惡意行為者利用去做壞事。

因此,谷歌研究團隊正積極地將谷歌AI原則(Google AI Principles)融入其中,尤其注重3個關鍵方面:

1、“可控”:確保制造的工具有益于人類,模型和項目需要適當的人為控制,以確保用戶安全,例如文本生成圖像模型使用了保障數據集來防止生成有害的圖像。

2、制造能夠檢測生成式AI的工具:谷歌在AudioLM項目中訓練了一個分類器,能以近99%的準確率檢測合成語音。

3、與世界各地的社區積極合作:開源對于谷歌來說是很重要的一部分,谷歌計劃制定一套開源政策,以適應其AI原則。谷歌還在積極與藝術家和創作者等合作。

本文為轉載內容,授權事宜請聯系原著作權人。
主站蜘蛛池模板: 承德县| 米林县| 株洲市| 勃利县| 府谷县| 中山市| 莲花县| 洪雅县| 游戏| 依安县| 大田县| 阳东县| 安平县| 如东县| 黑河市| 定安县| 永顺县| 三台县| 金堂县| 汉川市| 孟津县| 阜阳市| 烟台市| 绍兴市| 博野县| 民丰县| 旬邑县| 南川市| 茌平县| 兴安盟| 游戏| 清涧县| 漳州市| 宝坻区| 米易县| 大庆市| 镇坪县| 荆门市| 满洲里市| 五家渠市| 应城市|