未來每個智能家居硬件都能與用戶對話
發布時間:2015/12/5 10:12:24 訪問次數:484
從目前智能家居的發展史,我們可以將智能家居分成三個階段:第一個階段是互聯網階段,一些行業巨頭通過玩的概念的方式來進入智能家居;第二個階段是移動互聯網時代通過手機的觸摸進行交互,再通過wifi、藍牙等通訊方式,讓智能手機、云服務、智能家居設備相結合,進行控制,那個階段的智能家居開始有了些苗頭,但真正的智能家居整個生態的構建逐漸清晰還是在最近兩年——物聯網時代。整個物聯網時代,大家都在分享技術的成熟,包括人機交互成熟,以及整個供應鏈、垂直產業鏈各個環節的成熟。
- 51電子網公益庫存:
- BTA204X-800E
- NCP1011AP065G
- NCP1011ST130T3G
- LNK362GN
- LNK364GN
- LNK304PN
- LNK306P
- TNY278GN-TL
- TOP257PN
- LNK364PN
- LNK304GN-TL
- TNY280GN
回頭看智能家居這三個階段,對應著人機交互發生了怎樣的變化?在早期的互聯網時代,還是按鍵的物理操作,移動互聯網時代,改成了手機的觸摸交互,手機可以用來控制智能家居中一臺或多臺設備,包括通過手機來享受后端各類服務,生活也開始方便起來。但是用手機控制起來還不是最自然的交互方式,物聯網時代的語音交互讓事情得到大大改變,當然智能家居其實是需要語音為主的多模態交互,從技術服務上,以及相關wifi/藍牙、硬件云服務商能夠協同起來,讓語音識別,結合包括人臉識別、虹膜識別、圖象識別等等交互技術,使得人機的交互越來越方便。一些調研數據顯示,近年來語音交互在智能硬件中所占比重越來越大,接近50%。未來智能家居的交互一定是多模態,我個人覺得自然語言的交互一定是核心的交互軸,結合多模態的交互。
當前智能硬件大多面臨著交互的難題,用戶在家里躺在沙發上跟智能電器溝通、交互,很多是遠場距離,也往往中間會有些噪音。還有回聲的問題,我們在設備進行語音溝通的時候,往往設備自身正在進行講話、發聲、播節目,這導致了很多智能硬件的語音交互控制非常難。思必馳則在解決回聲對消、噪聲環境等問題下了很多功夫。
語音交互能夠幫智能家居硬件打造怎樣好的體驗?為什么需要語音交互?我個人覺得,智能家居需要去中心化。很多巨頭因為他們的優勢在手機端,包括他們圍繞手機生態構建的服務優勢,因此他們希望通過手機為中心來控制智能家居的平臺和生態。但是在智能家居這個生態里面,應是以用戶還為核心,去中心化才能讓用戶操控起來更加方便、更具智能化。
目前市面上的智能硬件很多都采用了人機交互,思必馳在為眾多合作伙伴提供語音交互解決方案的過程中,發現目前語音交互分為三種應用:一是實現控制交互,即實現簡單的智能設備控制、查詢,比如說搜歌等等;再一個是目前逐步與一些合作伙伴在做的,他們要求實現一些安全性的交互,比如說收音識別,鑒定說話人的身份,鑒定說話人身份才能打開設備等等。還有一個是趣味性需求,當然趣味性需求也有一定功能性成分,比如說語音喚醒設備,用戶可以將智能設備更改為小孩的名字、小狗的名字等等。另外,思必馳還做了語音的個性化聲音合成。
但是智能家居不僅僅是需要一個操控,或者簡單的查詢、簡單的有趣,而是幫助用戶完成任務。用戶想要聽音樂,還可以基于場景,基于心情,多維度查詢,通過音響、電視可以實現定餐,因為是多重服務,比較復雜的服務,在智能硬件交互或者自然語言交互,一定會從簡單的控制走向完成任務,從簡單的ui走向ai,智能設備真的能懂你,能夠跟你交流,能夠理解上下問,他聽不懂可以問,他知道怎么問會問,最終幫你完成任務。
思必馳在人機對話層面上算是做的比較早的,我們在劍橋大學做了第一個人機對話系統原形。另外,上文說到的個性化語音合成,思必馳跟上海交大合作有一個專門的實驗室,用來研發個人的語音合成,未來用戶都可以把家人朋友等你想要的聲音上傳一段,馬上就可以下載一個合成的模型。還有歌曲合成,比如用戶上傳了一段聲音,選擇了鄧紫棋的歌,就可以變成上傳自定義聲音演唱鄧紫棋的歌。
再一點是情感交互,情感交互讓我們的設備有溫度、感情,富有個性化的背景。再往后是思想交互,當然情感交互里面涉及到不單是語音技術,通過語音情緒識別,如果我們不面對面,你不知道你隔壁跟你交流的是一個智能硬件,還是一個真人。http://zlc08.51dzw.com/
智能家居的硬件使用語音交互核心需求的強度不同,如電視的核心是語音的搜索,一些小的家電、燈泡、空調等的語音需求就相對比較弱,他們更多還需要云+端,特別是端的語音技術的需求,包括原廠識別。像音響、機器人,他們的需求則更為多一些。
思必馳專注人性化的智能語音交互技術,主要面向家居、車載、機器人、穿戴以及手機和平板,提供語音識別、合成等語音交互解決方案。 思必馳希望能為智能硬件合作伙伴提供更好的、極致的體驗,能夠加快產業化的落地。
從目前智能家居的發展史,我們可以將智能家居分成三個階段:第一個階段是互聯網階段,一些行業巨頭通過玩的概念的方式來進入智能家居;第二個階段是移動互聯網時代通過手機的觸摸進行交互,再通過wifi、藍牙等通訊方式,讓智能手機、云服務、智能家居設備相結合,進行控制,那個階段的智能家居開始有了些苗頭,但真正的智能家居整個生態的構建逐漸清晰還是在最近兩年——物聯網時代。整個物聯網時代,大家都在分享技術的成熟,包括人機交互成熟,以及整個供應鏈、垂直產業鏈各個環節的成熟。
- 51電子網公益庫存:
- BTA204X-800E
- NCP1011AP065G
- NCP1011ST130T3G
- LNK362GN
- LNK364GN
- LNK304PN
- LNK306P
- TNY278GN-TL
- TOP257PN
- LNK364PN
- LNK304GN-TL
- TNY280GN
回頭看智能家居這三個階段,對應著人機交互發生了怎樣的變化?在早期的互聯網時代,還是按鍵的物理操作,移動互聯網時代,改成了手機的觸摸交互,手機可以用來控制智能家居中一臺或多臺設備,包括通過手機來享受后端各類服務,生活也開始方便起來。但是用手機控制起來還不是最自然的交互方式,物聯網時代的語音交互讓事情得到大大改變,當然智能家居其實是需要語音為主的多模態交互,從技術服務上,以及相關wifi/藍牙、硬件云服務商能夠協同起來,讓語音識別,結合包括人臉識別、虹膜識別、圖象識別等等交互技術,使得人機的交互越來越方便。一些調研數據顯示,近年來語音交互在智能硬件中所占比重越來越大,接近50%。未來智能家居的交互一定是多模態,我個人覺得自然語言的交互一定是核心的交互軸,結合多模態的交互。
當前智能硬件大多面臨著交互的難題,用戶在家里躺在沙發上跟智能電器溝通、交互,很多是遠場距離,也往往中間會有些噪音。還有回聲的問題,我們在設備進行語音溝通的時候,往往設備自身正在進行講話、發聲、播節目,這導致了很多智能硬件的語音交互控制非常難。思必馳則在解決回聲對消、噪聲環境等問題下了很多功夫。
語音交互能夠幫智能家居硬件打造怎樣好的體驗?為什么需要語音交互?我個人覺得,智能家居需要去中心化。很多巨頭因為他們的優勢在手機端,包括他們圍繞手機生態構建的服務優勢,因此他們希望通過手機為中心來控制智能家居的平臺和生態。但是在智能家居這個生態里面,應是以用戶還為核心,去中心化才能讓用戶操控起來更加方便、更具智能化。
目前市面上的智能硬件很多都采用了人機交互,思必馳在為眾多合作伙伴提供語音交互解決方案的過程中,發現目前語音交互分為三種應用:一是實現控制交互,即實現簡單的智能設備控制、查詢,比如說搜歌等等;再一個是目前逐步與一些合作伙伴在做的,他們要求實現一些安全性的交互,比如說收音識別,鑒定說話人的身份,鑒定說話人身份才能打開設備等等。還有一個是趣味性需求,當然趣味性需求也有一定功能性成分,比如說語音喚醒設備,用戶可以將智能設備更改為小孩的名字、小狗的名字等等。另外,思必馳還做了語音的個性化聲音合成。
但是智能家居不僅僅是需要一個操控,或者簡單的查詢、簡單的有趣,而是幫助用戶完成任務。用戶想要聽音樂,還可以基于場景,基于心情,多維度查詢,通過音響、電視可以實現定餐,因為是多重服務,比較復雜的服務,在智能硬件交互或者自然語言交互,一定會從簡單的控制走向完成任務,從簡單的ui走向ai,智能設備真的能懂你,能夠跟你交流,能夠理解上下問,他聽不懂可以問,他知道怎么問會問,最終幫你完成任務。
思必馳在人機對話層面上算是做的比較早的,我們在劍橋大學做了第一個人機對話系統原形。另外,上文說到的個性化語音合成,思必馳跟上海交大合作有一個專門的實驗室,用來研發個人的語音合成,未來用戶都可以把家人朋友等你想要的聲音上傳一段,馬上就可以下載一個合成的模型。還有歌曲合成,比如用戶上傳了一段聲音,選擇了鄧紫棋的歌,就可以變成上傳自定義聲音演唱鄧紫棋的歌。
再一點是情感交互,情感交互讓我們的設備有溫度、感情,富有個性化的背景。再往后是思想交互,當然情感交互里面涉及到不單是語音技術,通過語音情緒識別,如果我們不面對面,你不知道你隔壁跟你交流的是一個智能硬件,還是一個真人。http://zlc08.51dzw.com/
智能家居的硬件使用語音交互核心需求的強度不同,如電視的核心是語音的搜索,一些小的家電、燈泡、空調等的語音需求就相對比較弱,他們更多還需要云+端,特別是端的語音技術的需求,包括原廠識別。像音響、機器人,他們的需求則更為多一些。
思必馳專注人性化的智能語音交互技術,主要面向家居、車載、機器人、穿戴以及手機和平板,提供語音識別、合成等語音交互解決方案。 思必馳希望能為智能硬件合作伙伴提供更好的、極致的體驗,能夠加快產業化的落地。