簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

為了給大模型找語料,有人開始進行“互聯網考古”

掃一掃下載界面新聞APP

為了給大模型找語料,有人開始進行“互聯網考古”

圍繞構建更強大的AI大模型,科技巨頭、AI獨角獸更是展開了一輪又一輪的廝殺。

文|三易生活

過去一年,AI大模型無疑是科技行業中最亮眼的主角,從FAAMG到BAT、再到一眾初創企業,無數優秀的大腦、海量的資源都投入到了這個有望解放人類生產力的賽道中。

圍繞構建更強大的AI大模型,科技巨頭、AI獨角獸更是展開了一輪又一輪的廝殺,對于算法、數據、算力的爭奪如今也已達到了白熱化狀態,其中特別是數據資源更是成為了重中之重,畢竟沒有它來作為燃料,不光無法訓練更強的大模型、現有的大模型也可能會“熄火”。

為了收集更多的數據、或者說是語料來澆灌大模型,“買買買”就成為了一眾AI廠商的解決方案,例如谷歌每年花6000萬美元從Reddit手中買數據,OpenAI更是付費購買了施普林格出版集團旗下出版物的內容。眼見財大氣粗的AI廠商揮舞鈔票,越來越多的人也開始意識到了語料的價值。

日前照片分享社區EyeEm突然變更了服務條款,宣布將默認使用平臺上的照片來訓練AI大模型。

據悉,EyeEm方面通過郵件通知用戶,該公司在其條款和條件中添加了一項新的條款,授予其"復制、分發、公開展示、轉換、改編、制作衍生作品、向公眾傳播和/或推廣"用戶內容的權利,包括用于培訓、開發和改進軟件、算法和機器學習模型,用戶有30天的時間可選擇退出,否則就默認為同意這一用途,未來用戶想要從EyeEm及其合作伙伴平臺上刪除內容可能需要長達180天。

一石激起千層浪,EyeEm此舉幾乎是將覬覦用戶照片的想法擺在了臺面上。要知道,在當下這個用戶普遍重視個人隱私的時代,用突然更改用戶協議的方式來表示自己準備將收集的用戶數據作為AI訓練的語料,就等于是直接與用戶交惡。

那么問題就來了,為什么EyeEm會搞出這種幾乎屬于自絕于用戶的操作呢?當然是因為身不由已。

成立于2010年的EyeEm,曾被視為全球知名圖片社交平臺Instagram在歐洲市場的競爭對手,前者在最鼎盛時期曾擁有超過2000萬名活躍的優秀視覺創作者。并且與Instagram不同的是,EyeEm非常受攝影師的青睞,因為其推出了極具商業價值的Mission功能,可以讓品牌向EyeEm社區眾包照片,幫助平臺上的攝影師賺到錢。

然而遺憾的是,EyeEm這樣一個將商業化與社區建設恰如其分融合到一起的廠商,最終還是被Instagram碾壓了。在Instagram被Meta收購后,前者借助Meta的社交網絡成功席卷全球,但與之相對應的是,2018年之后EyeEm就開始走下坡路,到了2021年,這家公司被瑞士社交網站Talenthouse以4000萬美元的價格收購。只可惜在Talenthouse手中的EyeEm也沒能起死回生,因為普通用戶并不需要兩個圖片分享社區。

到了2022年年中,EyeEm已經無法按時向攝影師支付報酬。隨后在2023年4月,EyeEm正式申請破產保護。同年10月,這家僅剩3名員工的公司,被西班牙在線平面設計資源網站Freepik收購。

顯而易見,在申請破產保護之后,EyeEm就已經只是一個空殼了,用戶規模也萎縮至15萬人。對于一個非技術導向、或者說產品導向的互聯網公司來說,從2000萬用戶衰退到15萬,也就意味著EyeEm已經無法說服用戶繼續使用他們的產品了。

Freepik之所以收購EyeEm,就是為了后者所擁有的1.6億張圖像資源。Freepik已然成為一個數據掮客,為了向AI大模型廠商出售語料資源,而買下了已經失去經營價值的EyeEm。從某種意義上來說,Freepik也算是獨具慧眼,發現了EyeEm這樣一家注定玩完的互聯網公司的剩余價值。

要知道自從進入新世紀以來,嘗試在互聯網行業進行創業的團隊不知幾凡,但畢竟Meta、X、Reddit這樣的成功者只是少數,更多的初創公司最終都成為了“炮灰”。只不過在這一眾失敗者里,有不少是曾經煊赫一時的存在,但他們最終因為種種原因陷入了沉寂。而在AI大模型爆發以前,類似EyeEm這樣的失敗者其實是毫無價值的,因為它們的商業模式失敗了,競爭對手脫穎而出。

然而當下最火熱的AI大模型需要海量的數據來澆灌,在同等條件下,預訓練時投喂的數據越多,AI大模型的性能就越強,這已經是業界的共識。只是優質數據總歸是稀缺資源,根據人工智能研究機構epoch的預測,語言數據可能在2030至2040年耗盡,其中能訓練出更優性能的高質量語言數據甚至可能在2026年就被耗盡。在這種情況下,EyeEm這類沉淀了數據資源的失敗者,突然就變得有了價值。

因此有了Freepik的珠玉在前,未來可能會有越來越多公司去嘗試從互聯網創業的失敗者身上挖掘可能存在的數據資源,進而讓互聯網考古不再是部分網民的興趣,更有可能真正變成一門生意。

本文為轉載內容,授權事宜請聯系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

為了給大模型找語料,有人開始進行“互聯網考古”

圍繞構建更強大的AI大模型,科技巨頭、AI獨角獸更是展開了一輪又一輪的廝殺。

文|三易生活

過去一年,AI大模型無疑是科技行業中最亮眼的主角,從FAAMG到BAT、再到一眾初創企業,無數優秀的大腦、海量的資源都投入到了這個有望解放人類生產力的賽道中。

圍繞構建更強大的AI大模型,科技巨頭、AI獨角獸更是展開了一輪又一輪的廝殺,對于算法、數據、算力的爭奪如今也已達到了白熱化狀態,其中特別是數據資源更是成為了重中之重,畢竟沒有它來作為燃料,不光無法訓練更強的大模型、現有的大模型也可能會“熄火”。

為了收集更多的數據、或者說是語料來澆灌大模型,“買買買”就成為了一眾AI廠商的解決方案,例如谷歌每年花6000萬美元從Reddit手中買數據,OpenAI更是付費購買了施普林格出版集團旗下出版物的內容。眼見財大氣粗的AI廠商揮舞鈔票,越來越多的人也開始意識到了語料的價值。

日前照片分享社區EyeEm突然變更了服務條款,宣布將默認使用平臺上的照片來訓練AI大模型。

據悉,EyeEm方面通過郵件通知用戶,該公司在其條款和條件中添加了一項新的條款,授予其"復制、分發、公開展示、轉換、改編、制作衍生作品、向公眾傳播和/或推廣"用戶內容的權利,包括用于培訓、開發和改進軟件、算法和機器學習模型,用戶有30天的時間可選擇退出,否則就默認為同意這一用途,未來用戶想要從EyeEm及其合作伙伴平臺上刪除內容可能需要長達180天。

一石激起千層浪,EyeEm此舉幾乎是將覬覦用戶照片的想法擺在了臺面上。要知道,在當下這個用戶普遍重視個人隱私的時代,用突然更改用戶協議的方式來表示自己準備將收集的用戶數據作為AI訓練的語料,就等于是直接與用戶交惡。

那么問題就來了,為什么EyeEm會搞出這種幾乎屬于自絕于用戶的操作呢?當然是因為身不由已。

成立于2010年的EyeEm,曾被視為全球知名圖片社交平臺Instagram在歐洲市場的競爭對手,前者在最鼎盛時期曾擁有超過2000萬名活躍的優秀視覺創作者。并且與Instagram不同的是,EyeEm非常受攝影師的青睞,因為其推出了極具商業價值的Mission功能,可以讓品牌向EyeEm社區眾包照片,幫助平臺上的攝影師賺到錢。

然而遺憾的是,EyeEm這樣一個將商業化與社區建設恰如其分融合到一起的廠商,最終還是被Instagram碾壓了。在Instagram被Meta收購后,前者借助Meta的社交網絡成功席卷全球,但與之相對應的是,2018年之后EyeEm就開始走下坡路,到了2021年,這家公司被瑞士社交網站Talenthouse以4000萬美元的價格收購。只可惜在Talenthouse手中的EyeEm也沒能起死回生,因為普通用戶并不需要兩個圖片分享社區。

到了2022年年中,EyeEm已經無法按時向攝影師支付報酬。隨后在2023年4月,EyeEm正式申請破產保護。同年10月,這家僅剩3名員工的公司,被西班牙在線平面設計資源網站Freepik收購。

顯而易見,在申請破產保護之后,EyeEm就已經只是一個空殼了,用戶規模也萎縮至15萬人。對于一個非技術導向、或者說產品導向的互聯網公司來說,從2000萬用戶衰退到15萬,也就意味著EyeEm已經無法說服用戶繼續使用他們的產品了。

Freepik之所以收購EyeEm,就是為了后者所擁有的1.6億張圖像資源。Freepik已然成為一個數據掮客,為了向AI大模型廠商出售語料資源,而買下了已經失去經營價值的EyeEm。從某種意義上來說,Freepik也算是獨具慧眼,發現了EyeEm這樣一家注定玩完的互聯網公司的剩余價值。

要知道自從進入新世紀以來,嘗試在互聯網行業進行創業的團隊不知幾凡,但畢竟Meta、X、Reddit這樣的成功者只是少數,更多的初創公司最終都成為了“炮灰”。只不過在這一眾失敗者里,有不少是曾經煊赫一時的存在,但他們最終因為種種原因陷入了沉寂。而在AI大模型爆發以前,類似EyeEm這樣的失敗者其實是毫無價值的,因為它們的商業模式失敗了,競爭對手脫穎而出。

然而當下最火熱的AI大模型需要海量的數據來澆灌,在同等條件下,預訓練時投喂的數據越多,AI大模型的性能就越強,這已經是業界的共識。只是優質數據總歸是稀缺資源,根據人工智能研究機構epoch的預測,語言數據可能在2030至2040年耗盡,其中能訓練出更優性能的高質量語言數據甚至可能在2026年就被耗盡。在這種情況下,EyeEm這類沉淀了數據資源的失敗者,突然就變得有了價值。

因此有了Freepik的珠玉在前,未來可能會有越來越多公司去嘗試從互聯網創業的失敗者身上挖掘可能存在的數據資源,進而讓互聯網考古不再是部分網民的興趣,更有可能真正變成一門生意。

本文為轉載內容,授權事宜請聯系原著作權人。
主站蜘蛛池模板: 朝阳市| 新邵县| 关岭| 梁河县| 萨迦县| 奉贤区| 六安市| 正镶白旗| 洪泽县| 宕昌县| 株洲县| 时尚| 胶州市| 南乐县| 龙里县| 称多县| 沛县| 黄龙县| 吕梁市| 霍山县| 多伦县| 饶河县| 东乡县| 东安县| 临洮县| 宁明县| 横山县| 墨竹工卡县| 大荔县| 景洪市| 百色市| 红安县| 桂东县| 潜山县| 双城市| 长子县| 固安县| 尉犁县| 拉萨市| 沙坪坝区| 黄梅县|