文|適道
編輯|獅刀
6月11日,蘋果召開WWDC 2024,并在90分鐘的發布會中劃出了40分鐘留給AI。
此前很長一段時間內,庫克都是用ML代替AI,現在直接偷梁換柱,用Apple Intelligence指代AI,而非公認的 Artificial Intelligence,旨在預示蘋果將重新定義一個AI時代。
營銷很炸裂,效果耐人尋味。
華爾街是來了個欲揚先抑,先是一舉將蘋果的股價干跌了近 2%。
然后截至周二收盤,蘋果股價又漲了7.26%,收于 207.15 美元。
股價創歷史新高,市值一夜大增 2142 億美元,市值達 3.176 萬億美元,拿下消費電子巨頭今年的第一個歷史新高。
這是因為投資者和公眾經過一天的消化,發現蘋果新發布的Apple Intelligence還不錯,至少是從系統層面入手,而不是在應用層面蜻蜓點水。
雖然長達一年多以來,華爾街分析師一直對蘋果在人工智能領域“悶聲發大財”的策略表示擔憂。但很明顯,蘋果也的確一直在蓄勢待發。
那么,此次秀成績的情況如何?
01 好功能,但不夠炸裂
如果給蘋果的AI功能打分,可以大致劃為:T1哇哦,T2不錯,T3基操。
至于為啥沒有T0,這.......還用問嗎?
T1哇哦——新Siri,新腦子&新眼睛&新皮膚
Siri不僅不會死,而且重生歸來了!
根據蘋果官方數據,Siri一天內能收到高達15億次的調用需求,意味著平均每人每天都會跟Siri 說上一兩句話。注意,這還是大家都在吐槽的前提下。
舊Siri之所以廢,是因為它“笨”——只會在關鍵詞庫中玩你問我猜,聽不懂就扔給你一個網頁,但你一點也不想點開。
新Siri之所以強,是因為它長出了“新腦子”和“新眼睛”。
新Siri能夠“看懂”屏幕界面,聽懂你的提問,記住你提到的內容,理解上下文,處理復雜問題。
等等,這不就是蘋果今年4月發布的論文嘛!
論文提到了一個名為Ferret-UI的多模態模型,能夠“看懂”手機屏幕,并將自然語言翻譯為界面操作點來執行各項任務。經測試,Ferret-UI在所有基本UI任務中均超過GPT-4V(OpenAI),在高級UI任務中超過Fuyu(Adept)和CogAgent(智譜AI)。
雖然不知道新Siri是不是得益于Ferret-UI,但它確實變得心明眼亮。
當你想找身份證圖片時,不用再一張張地扒相冊,新Siri可以迅速幫你找到,并貼心地添加到備忘錄中;
當你想分享小貓“嬰咪”時期的照片,新Siri不僅可以自己找,還能一鍵修圖,理論上也可以發送給指定朋友;
當你的leader發來線上會議地址,新Siri可以自己打開App,幫你預定會議,并在會議開始前提醒加入;
當你想獲知近期私人信息,新Siri可以自動搜索郵件、短信、圖片,整合后做出回答,而且能夠根據重要程度,分出優先級。
哦,對!新Siri還換了一身新皮膚,它終于不再是那個氣泡了!而且,它終于可以支持文字輸入了,簡直是i人福音。
根據WWDC的“賣家秀”,Siri(高智商版)已經實現,并像一個真正AI Agent,絲滑地穿梭在各個APP之間。
不過,最完整的“買家秀”可能還要再等等,至于有沒有延時,夠不夠聰明,還有待驗證,因此我們將新Siri定級為T1,痛失T0。
T2不錯——“套殼”ChatGPT&隱私安全
如果你問到Siri知識范圍之外的問題,它還會甩過來一個網頁鏈接嗎?
現在不會了,因為有“最強大腦”ChatGPT幫忙。
雖然每款手機都可以通過App使用ChatGPT,但蘋果與OpenAI合作,是將更多“ChatGPT能力”接入iPhone中,并給Siri裝上了“外掛腦”。
比如,Siri可以隨時調用GPT-4o。當你想“吃瓜”時,Siri能夠根據你日常八卦的“領域”,通過GPT總結今天的小瓜、大瓜、驚天瓜,還能捋出一條完整的吃瓜時間線,不放過瓜藤上的每一顆瓜。
又比如,ChatGPT被內置在寫作工具中。當你失眠時,Siri可以通過GPT-4o編個睡前故事,并用迷人的聲線講出來,給你一個真正的Samantha。
最關鍵的是,GPT-4o是免費的,你無需創建賬戶,用戶數據也不會被記錄。
其實早些時候,蘋果也和“老對頭”谷歌就使用Gemini進行商談。雖然這次沒有合作,但預計和蘋果“貼貼”的大模型廠商應該不會只有OpenAI一家。
在隱私保護方面,馬斯克是用這張圖炮轟蘋果,并稱“如果蘋果在系統上整合進 OpenAI,那么蘋果設備將會在我的公司被禁用”。
實際上,蘋果在隱私保護上至少看起來相當可靠。
遇到問題時,首先看能不能用端側大模型解決。
在這個環節,蘋果只在端內收集信息而不傳送到云端,而且大多數AI功能都可以完成。
一方面是因為蘋果自研芯片足夠強悍,另一方面也和蘋果的“暗度陳倉”有關。
去年年底,蘋果默默地甩出一篇“王炸”論文。
其中寫道,蘋果通過Flash-LLM技術,成功地在內存有限的iPhone和其他蘋果設備上部署了LLM。數據顯示,設備能夠支持運行的模型大小達到了自身DRAM(處理器)的2倍;LLM的推理速度在Apple M1 Max CPU上提高了4-5倍,在GPU上提高了20-25倍。此成果直接打破了手機的“內存墻”,實現將大模型塞進了iPhone里。
如果用戶提出的問題過于“刁鉆”,一定要上云才能解決。那么,ChatGPT也不會不經你同意,就存儲信息。
為了防止奧特曼不講武德,蘋果還專門加了一道“密碼鎖”,即為云端大模型開發了一套私有云( Private Cloud Compute ),并沿用了iPhone的隱私策略,保證硬件、軟件甚至編程語言都足夠安全。
蘋果軟件工程高級副總裁Craig Fedrighi表示,“這些上傳到云端的數據絕對不會被儲存,就連蘋果都無法訪問,數據只用來執行請求。”
說實話,無論是外接OpenAI,還是隱私保護,雖然遠遠甩下現有選手,但都因為存在一絲裂痕,沒有超越以往的蘋果,也就沒有滿足外界的期待。
T3基操——圖文生成
這部分就是一些“老熟人”功能。
在文字寫作方面, 可以幫你檢查錯別字,重寫消息、郵件、文檔,也可以一鍵總結文字,甚至把文字做成表格。
在圖片方面,使用Image Playground 可以幾秒內文生圖,也可以將手寫草圖轉化為精美圖片,說實話也沒有那么精美。
對了,你還能用自然語言制作Emoji。蘋果,你看我長得像缺表情包的人嗎?
02 蘋果正走在正確的道路
一直以來,關于蘋果掉隊AI競賽的說法甚囂塵上,包括在WWDC 2024發布后,蘋果被冠以“追趕者”的稱號。
但有沒有一種可能,蘋果是一個主打硬件的公司,而不是一家大模型廠商。
還有沒有一種可能,現在露臉的AI硬件實在不夠AI,蘋果壓根沒想跟它們跑比賽。
目前,蘋果在全球擁有22億臺活躍設備,僅iPhone 就約13-14億臺。而蘋果所擁有互聯互通的設備生態,更是為人工智能提供了一片沃土。
也就是說,蘋果的終極目標不是造出ChatGPT這類“地表最強”大模型,而是建立一個基于蘋果生態的AI Agent(硬件版)。
為何蘋果此前低調做人?
一方面,所謂AI硬件都是“蝦兵蟹將”。
我們眼看一個接一個的AI硬件在“撲街”的路上前仆后繼——前有“出道即巔峰”的AI Pin,后有“延時數十秒”的Rabbit R1。它們號稱“AI Agent”,實則是“套殼”ChatGPT。
AI手機更是“瓶裝水”,有品牌裝載70億參數大模型,只能干點實時翻譯、圖像美化,會議記錄.....無非是更智能的有道翻譯、訊飛聽見和美圖秀秀。而且因為沒有自研芯片,端側大模型參數的天花板要看高通的天花板。
另一方面,按照蘋果以往的節奏,沒有足夠驚艷的革新就不會亮相。
在新技術上,蘋果向來都是集大成者而非開創者——提煉現有理念,來提供最佳的用戶體驗,然后“炸裂開場”,引導電子消費革命,如iPod、iPhone,也包括AVP。
正如蘋果對于產品的核心原則:足夠強大,在最要緊的事上都能幫到用戶;直觀易用;深度整合到產品的使用體驗中;它必須足夠“懂你”,以你的個人情境為基礎;而且,還要注重保護隱私。
而在理想情況下,蘋果想要占據絕對優勢:需要一款強大的芯片,能夠支持端側大模型,不被英偉達“卡脖子”;一款世界模型,不被微軟、谷歌“卡脖子”;一批AI原生應用,不被安卓們“搶用戶”。
顯然,這“三面樹敵”難到了蘋果。
即,蘋果看似行動遲緩,實則無論是更新的自研芯片,一篇篇論文成果,以及巨額經費,都表示它不僅不太可能掉隊,還在偷偷“領先”。
而這次WWDC 2024“不夠炸裂”的原因在于蘋果打亂了自己一貫的節奏。
因為遇冷的iPhone銷量,擠牙膏式的創新實在讓人沒有換手機的欲望。
Counterpoint預計,到2027年,AI智能手機將占全球智能手機出貨量43%,使用的設備將達到10億部。
千載難逢的機遇之下,谷歌早于去年10月份就公布了第一代AI手機Pixel 8和其對應的AI系統Android 14。
另有數據顯示,2024年安卓智能手機的銷售額將同比增長4.8%,而蘋果僅為0.7%。
如果蘋果再低調下去,雖然不至于被“蝦兵蟹將”威脅,但也會降低用戶忠誠度。
IDC分析師Nabila Popal指出:如果蘋果想要一改頹勢并加速增長,要在未來幾周內闡述一個清晰的AI戰略至關重要。蘋果的挑戰是——說服消費者新AI功能非常必要,更重要的是,為什么需要在iPhone上完成,以促使用戶升級。
因此,蘋果此次秀肌肉實屬趕鴨子上架。
但無論后續“買家秀”如何,可以肯定的是蘋果這次又走對了。
正如Wedbush分析師Dan Ives寫道,蘋果正“走在正確的道路”,對于蘋果這樣一家“已經重塑了科技行業和社會的公司”來說,本次WWDC主題演講是一個“歷史性”的日子。