簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

從“Hey Siri”到“Siri”這一小步,是蘋果語音識別的一大步

掃一掃下載界面新聞APP

從“Hey Siri”到“Siri”這一小步,是蘋果語音識別的一大步

同時蘋果正在將Siri整合至第三方APP,來為用戶提供更多語境和幫助。

文|三易生活

“Hey Siri,講個笑話”,相信許多iPhone用戶都嘗試過這樣與蘋果的智能語音助手Siri對話,但在未來,大家與Siri聊天時可能就要換一個詞了。日前有消息顯示,蘋果方面計劃將智能語音助理Siri的喚醒詞從“Hey Siri”簡化為“Siri”,這一變化預計將在2023年某個時候或2024年推出,同時蘋果正在將Siri整合至第三方APP,來為用戶提供更多語境和幫助。

作為蘋果推出的智能語音助手,早在2011年就已亮相的Siri,無疑是這十余年來手機廠商在AI領域探索的代表之一。別看蘋果未來僅僅只是去掉了“Hey”這個單詞,但這一微小變化的背后卻代表著蘋果AI技術的長足進步,同時也意味著蘋果在智能語音助手領域已經追上了競爭對手亞馬遜的腳步。畢竟在很長一段時間里,盡管作為智能語音助手領域的先行者,Siri卻一直被用戶吐槽“有點蠢”、“不智能”。

從“Hey Siri”到“Siri”,反映的是蘋果在語音識別技術上有了重大的突破。就像每個人都有自己的名字一樣,智能語音助手其實也需要特定的詞匯來讓它知道用戶是在喊自己。從某種程度上來說,喚醒詞同時也是智能語音助手品牌形象的一大組成部分,通過每一次激活語音助手時說出的喚醒詞,消費者關于這個品牌的記憶就在這樣日復一日的復讀中不斷被強化。

那么為什么智能語音助手一定需求一個喚醒詞呢?這是因為智能語音助手如今還不可能24小時時刻保持在線狀態,需要保證只有在用戶需要時才進入工作狀態,其他時間則保持休眠。相比于按專屬按鍵喚醒、點擊圖標喚醒這類觸摸喚醒機制,使用特定的喚醒詞來激活智能語音助手,也更契合這一產品的特質。

語音喚醒被稱之為keyword spotting(下文簡稱為KWS),即在連續語流中實時檢測出說話人的特定片段,而這個特定片段就是喚醒詞。通常來說,如果不是手動禁用語音助手,后者作為系統級服務會長時間駐留在后臺,然而智能語音助手作為一個需要大量AI算力支撐的功能,在工作狀態下需要不低的性能開銷,同時也會相應的提升功耗。

面對這一問題,開發者想出的辦法是通過專用于語音喚醒的低功耗協處理器來實時監聽麥克風,一旦監聽到類似“Hey Siri”、“小愛同學”、“Hey Google”這類關鍵喚醒詞時,就會將語音助手從休眠狀態轉換到工作狀態。這個策略的好處除了降低對設備的續航壓力外,也會避免一直處于工作狀態的語音助手,處理并不是發送給自己的音頻信息。

其實語音喚醒的難點,主要就是低功耗與用戶臨時需求之間的矛盾,一個既能有效喚醒語音助手,又不至于讓系統誤判的喚醒詞也是整個KWS機制的核心。大家想必已經發現,目前國內市場的智能語音助手喚醒詞往往是4個字,比如“天貓精靈”、“小愛同學”、“小度小度”。這是由于漢語發音與音節的關系,大家可以簡單的把字數理解為音節。

為什么喚醒詞普遍是4音節,而不是中國人更習慣的3音節或2音節?這是因為音節越短,誤喚醒的問題就會越嚴重,可如果音節再長,就從短語變成了句子,會降低用戶的交流體驗。同理,“Hey”作為一個英文語氣詞,就像在中文語境中使用“你好”一樣,是為了增加喚醒詞的音節,讓系統能更準確的判斷監聽到的聲音到底是對誰說的。

反過來說,省略掉“Hey”就意味著蘋果的KWS技術有了巨大的進步,已經能夠實現只需要一個單詞即可判斷用戶意圖的水平。之所以能夠實現這一效果,技術原理其實并不復雜,蘋果方面大概率是利用聲紋識別技術實現定向人聲分離,再通過卷積神經網絡搭配聲紋識別編碼器,在復雜的聲學環境下準確捕捉到目標用戶的聲音。

到目前為止,谷歌相關設備依然需要通過“OK Google”與“Hey Google”來喚醒Google Assistant,其中一個很重要的原因,就是“Google”一詞本身由于谷歌已經深入到了用戶的日常生活中,所以并不算冷門,只有這個詞作為喚醒Google Assistant的“鑰匙”,會不可避免的導致頻繁誤喚醒。作為對比,Siri這個被生造出來的詞匯適用范圍就很窄了,iPhone只需監聽到契合“Siri”發音的聲紋,即可判斷用戶有使用智能語音助手的需求。

并且值得一提的是,據悉蘋果還計劃允許Siri與第三方應用結合,而這對于Siri的易用性將有著極大的促進作用。要知道,此前曾有前Siri團隊的成員表示,領導力的缺乏和管理層的不斷變化拖累了Siri前進的腳步,其中最關鍵的原因,就是蘋果方面一直以來堅持的封閉模式并沒有對Siri破例,也未能讓第三方開發者有更多機會創造更多有用的Siri應用。

在Siri還沒有被登錄iPhone或被收購前,其創始團隊的預想其實是希望能夠擁有一個第三方的開發生態,而這一點也被后來的一眾智能語音助手陸續實現。比如說,最初Siri被希望實現的預約餐飲功能,是包含著日期、地點、菜品等多方位要素,而非簡單地搜索一個餐廳的訂餐電話。

未來Siri能夠接入第三方應用,也就意味著蘋果的智能語音助手可以借助第三方的力量,來為自己賦予更多的功能、完成更多的任務。如果這一消息屬實,也就意味著在被忽視了多年后,Siri或許將要雄起了。

本文為轉載內容,授權事宜請聯系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

從“Hey Siri”到“Siri”這一小步,是蘋果語音識別的一大步

同時蘋果正在將Siri整合至第三方APP,來為用戶提供更多語境和幫助。

文|三易生活

“Hey Siri,講個笑話”,相信許多iPhone用戶都嘗試過這樣與蘋果的智能語音助手Siri對話,但在未來,大家與Siri聊天時可能就要換一個詞了。日前有消息顯示,蘋果方面計劃將智能語音助理Siri的喚醒詞從“Hey Siri”簡化為“Siri”,這一變化預計將在2023年某個時候或2024年推出,同時蘋果正在將Siri整合至第三方APP,來為用戶提供更多語境和幫助。

作為蘋果推出的智能語音助手,早在2011年就已亮相的Siri,無疑是這十余年來手機廠商在AI領域探索的代表之一。別看蘋果未來僅僅只是去掉了“Hey”這個單詞,但這一微小變化的背后卻代表著蘋果AI技術的長足進步,同時也意味著蘋果在智能語音助手領域已經追上了競爭對手亞馬遜的腳步。畢竟在很長一段時間里,盡管作為智能語音助手領域的先行者,Siri卻一直被用戶吐槽“有點蠢”、“不智能”。

從“Hey Siri”到“Siri”,反映的是蘋果在語音識別技術上有了重大的突破。就像每個人都有自己的名字一樣,智能語音助手其實也需要特定的詞匯來讓它知道用戶是在喊自己。從某種程度上來說,喚醒詞同時也是智能語音助手品牌形象的一大組成部分,通過每一次激活語音助手時說出的喚醒詞,消費者關于這個品牌的記憶就在這樣日復一日的復讀中不斷被強化。

那么為什么智能語音助手一定需求一個喚醒詞呢?這是因為智能語音助手如今還不可能24小時時刻保持在線狀態,需要保證只有在用戶需要時才進入工作狀態,其他時間則保持休眠。相比于按專屬按鍵喚醒、點擊圖標喚醒這類觸摸喚醒機制,使用特定的喚醒詞來激活智能語音助手,也更契合這一產品的特質。

語音喚醒被稱之為keyword spotting(下文簡稱為KWS),即在連續語流中實時檢測出說話人的特定片段,而這個特定片段就是喚醒詞。通常來說,如果不是手動禁用語音助手,后者作為系統級服務會長時間駐留在后臺,然而智能語音助手作為一個需要大量AI算力支撐的功能,在工作狀態下需要不低的性能開銷,同時也會相應的提升功耗。

面對這一問題,開發者想出的辦法是通過專用于語音喚醒的低功耗協處理器來實時監聽麥克風,一旦監聽到類似“Hey Siri”、“小愛同學”、“Hey Google”這類關鍵喚醒詞時,就會將語音助手從休眠狀態轉換到工作狀態。這個策略的好處除了降低對設備的續航壓力外,也會避免一直處于工作狀態的語音助手,處理并不是發送給自己的音頻信息。

其實語音喚醒的難點,主要就是低功耗與用戶臨時需求之間的矛盾,一個既能有效喚醒語音助手,又不至于讓系統誤判的喚醒詞也是整個KWS機制的核心。大家想必已經發現,目前國內市場的智能語音助手喚醒詞往往是4個字,比如“天貓精靈”、“小愛同學”、“小度小度”。這是由于漢語發音與音節的關系,大家可以簡單的把字數理解為音節。

為什么喚醒詞普遍是4音節,而不是中國人更習慣的3音節或2音節?這是因為音節越短,誤喚醒的問題就會越嚴重,可如果音節再長,就從短語變成了句子,會降低用戶的交流體驗。同理,“Hey”作為一個英文語氣詞,就像在中文語境中使用“你好”一樣,是為了增加喚醒詞的音節,讓系統能更準確的判斷監聽到的聲音到底是對誰說的。

反過來說,省略掉“Hey”就意味著蘋果的KWS技術有了巨大的進步,已經能夠實現只需要一個單詞即可判斷用戶意圖的水平。之所以能夠實現這一效果,技術原理其實并不復雜,蘋果方面大概率是利用聲紋識別技術實現定向人聲分離,再通過卷積神經網絡搭配聲紋識別編碼器,在復雜的聲學環境下準確捕捉到目標用戶的聲音。

到目前為止,谷歌相關設備依然需要通過“OK Google”與“Hey Google”來喚醒Google Assistant,其中一個很重要的原因,就是“Google”一詞本身由于谷歌已經深入到了用戶的日常生活中,所以并不算冷門,只有這個詞作為喚醒Google Assistant的“鑰匙”,會不可避免的導致頻繁誤喚醒。作為對比,Siri這個被生造出來的詞匯適用范圍就很窄了,iPhone只需監聽到契合“Siri”發音的聲紋,即可判斷用戶有使用智能語音助手的需求。

并且值得一提的是,據悉蘋果還計劃允許Siri與第三方應用結合,而這對于Siri的易用性將有著極大的促進作用。要知道,此前曾有前Siri團隊的成員表示,領導力的缺乏和管理層的不斷變化拖累了Siri前進的腳步,其中最關鍵的原因,就是蘋果方面一直以來堅持的封閉模式并沒有對Siri破例,也未能讓第三方開發者有更多機會創造更多有用的Siri應用。

在Siri還沒有被登錄iPhone或被收購前,其創始團隊的預想其實是希望能夠擁有一個第三方的開發生態,而這一點也被后來的一眾智能語音助手陸續實現。比如說,最初Siri被希望實現的預約餐飲功能,是包含著日期、地點、菜品等多方位要素,而非簡單地搜索一個餐廳的訂餐電話。

未來Siri能夠接入第三方應用,也就意味著蘋果的智能語音助手可以借助第三方的力量,來為自己賦予更多的功能、完成更多的任務。如果這一消息屬實,也就意味著在被忽視了多年后,Siri或許將要雄起了。

本文為轉載內容,授權事宜請聯系原著作權人。
主站蜘蛛池模板: 滦南县| 镇平县| 南城县| 田阳县| 济宁市| 织金县| 阆中市| 德化县| 商水县| 安泽县| 扶余县| 辉南县| 太仆寺旗| 泸溪县| 墨玉县| 海伦市| 和龙市| 巴林左旗| 饶河县| 友谊县| 彰武县| 桂林市| 恩平市| 晋江市| 如皋市| 锦屏县| 江北区| 平湖市| 定兴县| 工布江达县| 水富县| 贺州市| 沧源| 邛崃市| 蒙阴县| 清徐县| 宜宾县| 抚宁县| 垦利县| 收藏| 上思县|