安全防護層層加碼誊锭,新一代耐用戰(zhàn)神 OPPO A5 Pro 正式開售
從藍牙語音到大屏交互吧享,剖析百度在對話式 AI 上的創(chuàng)新 | WARE 2019
藍牙設備可以像 WiFi 設備一樣具備語音交互的能力此熬,這是非常有意義的事情庭呜。
2017 年犀忱,伴隨人工智能音箱行業(yè)的火熱募谎,基于 AI 的語音交互也正逐漸改變?nèi)藱C交互的方式。同時阴汇,集語音技術以及內(nèi)容数冬、服務生態(tài)的語音平臺應運而生,這些語音平臺大多背靠互聯(lián)網(wǎng)巨頭搀庶、AI 公司拐纱,試圖發(fā)展成為「AI 時代的安卓」铜异。
對于這些的公司而言,除了 AI 技術和內(nèi)容閉環(huán)服務打通秸架,他們更注重將技術揍庄、應用落地到產(chǎn)品,帶給用戶價值东抹,這樣才能反過來促進技術的進步蚂子,繁榮生態(tài)。
作為國內(nèi)最繁榮的語音 AI 生態(tài)缭黔,百度 DuerOS 在產(chǎn)品落地方面有不少領先的成果缆镣。在最近由深圳灣主辦的「ON THE GO:隨行 AI 場景的產(chǎn)品創(chuàng)新」峰會上,來自百度智能生活事業(yè)群組的劉悅發(fā)表了主題為《百度在對話式人工智能上的創(chuàng)新探索》试浙。
以下為演講實錄,內(nèi)容經(jīng)深圳灣整理和編輯寞蚌。
人機交互發(fā)展:從人理解機器到機器理解人
每一次人機交互的迭代都在推動著時代和產(chǎn)品的發(fā)展田巴。
我們簡單回顧一下人機交互發(fā)展經(jīng)歷的三個階段:第一階段的 PC 時代,以鼠標和鍵盤的交互方式促進了 PC 設備發(fā)展挟秤,相關軟件也應運而生壹哺。第二階段的觸屏時代,從過去的鼠標艘刚、鍵盤到觸控手機管宵,使得硬件的使用成本極大的降低。第三階段攀甚,也就是目前箩朴,語音對話的人機交互方式的發(fā)展,使得我們理解機器成本進一步降低秋度。
從人理解機器到機器理解人的交互方式的改變炸庞,催生了智能音箱、智能大屏設備荚斯、智能可穿戴設備埠居、智能車載等設備的發(fā)展。
基于語音對話的人工智能產(chǎn)業(yè)已經(jīng)全面爆發(fā)
從國外的市場來看事期,亞馬遜 滥壕、Google、蘋果兽泣、微軟以及許多創(chuàng)業(yè)型的公司加入到這場智能化的變革當中绎橘,他們的競爭已經(jīng)進入白熱化階段,并推動整個市場和產(chǎn)業(yè)的發(fā)展撞叨。
回過頭來看金踪,國內(nèi)的市場情況也跟國外非常像浊洞。我們預測,2020 年胡岔,對話式人工智能在各個場景上的滲透將大幅度增加:智能家居(上升 27%)法希、智能車載(上升 51%)、智能可穿戴(上升 68%)靶瘸。
中國市場的潛力非常巨大苫亦,我們發(fā)現(xiàn),目前有非常多的音箱怨咪、大屏設備屋剑、穿戴設備、耳機等設備都在變成一個可人機自然對話的智能設備诗眨,基于語音對話的人工智能產(chǎn)業(yè)已經(jīng)全面爆發(fā)唉匾。
小度自誕生以來取得的成績
百度在 2015 年的時候發(fā)布了第一款小度產(chǎn)品,從那時候我們開始嘗試和探索如何做一款這樣的產(chǎn)品匠楚。至今巍膘,小度助手已經(jīng)成為中國市場最繁榮的語音 AI 生態(tài)。
在 2016芋簿、2017 年峡懈,我們更多的持「生態(tài)賦能」的思路,不斷跟業(yè)界的其他硬件公司合作与斤,包括音箱企業(yè)肪康、電視企業(yè)(TCL、創(chuàng)維等)撩穿、汽車企業(yè)磷支、手表企業(yè)、耳機企業(yè)冗锁、手機企業(yè)等齐唆。我們把 AI 能力賦予不同場景下不同的硬件,讓這些硬件成為可語音交互的設備冻河。
2018 年箍邮,我們統(tǒng)計了搭載小度助手設備的激活數(shù):從年初的 5000 萬漲到 2018 年年底的 2 億,至今這個數(shù)字還在不斷提升叨叙。當然锭弊,激活數(shù)據(jù)并不能代表這個生態(tài)已經(jīng)達到繁榮,只能從一個側面反映了搭載的能力擂错。而這樣的能力是否真正被用戶使用味滞,以及用戶是否接受我們給他的新交互方式?
實際上,我們也會非常興奮地看到剑鞍,從語音交互次數(shù)來看昨凡,用戶的接受程度也在不斷提升。從 2018 年 3 月到 2018 年年底蚁署,我們通過月語音交互次數(shù)的指標來反映用戶交互頻率便脊,從最開始的 2 億次到達去年年底的 16 億次,這個數(shù)字至今還在持續(xù)上升光戈,并且速度非常迅速哪痰。
從這兩方面看來,小度已經(jīng)變成了中國最繁榮的對話式人工智能平臺久妆。
這里面有另外兩個指標晌杰,我也想分享給大家,一個是語音技能數(shù)量筷弦,目前小度已經(jīng)有上千個各式各樣的語音技能肋演,我們自己只能做一些頭部的技能,更多長尾的技能需要開發(fā)者不斷提供烂琴,這些技能絕大部分都來自于我們社區(qū)當中對這方面感興趣的開發(fā)者惋啃,使得生態(tài)變得更加健康和更加活躍。
另外监右,根據(jù) Strategy Analytics 的統(tǒng)計,2018 年第四季度异希,小度系列智能設備的出貨量提升到中國第二健盒,增長率達到了全球第一,增勢非常迅猛称簿。從現(xiàn)在來看扣癣,小度逐漸進入千家萬戶,成為用戶貼心可靠的助手憨降,這也是百度在做對話式人工智能方面的理念和終極目標父虑。
小度的產(chǎn)品發(fā)展經(jīng)歷
回顧一下小度的發(fā)展歷程。在 2015 年的百度世界大會上授药,度秘發(fā)布士嚎;2017 年推出的 DuerOS 人工智能的對話系統(tǒng),到后來發(fā)展到了 DuerOS 2.0悔叽、3.0莱衩,期間還發(fā)布了帶屏的小度在家。2019 年 2 月娇澎,百度發(fā)布了小度電視伴侶以及小度在家 1S 這兩個產(chǎn)品笨蚁。
我們經(jīng)歷了從開始發(fā)布產(chǎn)品,到后面不斷給第三方賦能,一直到后面自研硬件括细,一路走下來的過程伪很。
百度對話式人工智能的創(chuàng)新一:藍牙語音解決方案
接下來講一講百度在對話式人工智能所做的創(chuàng)新。除了大家熟悉的無屏音箱奋单、帶屏智能音箱锉试,我們還在其他方向做了探索,今天借這個機會給大家來簡單分享辱匿。
第一個是藍牙設備键痛。面對各種各樣的藍牙設備(藍牙耳機和手環(huán)等),我們萌生出了給這些藍牙設備賦能的想法——使得藍牙設備可以像 WiFi 設備一樣具備語音交互的能力匾七,這是非常有意義的事情絮短。
我們首先來看一下藍牙設備的趨勢:根據(jù) SIG 的調(diào)查,截止到 2022 年昨忆,整個藍牙設備全球鋪貨量達到 8.8 億臺丁频。這意味著有很多藍牙設備等待著我們?nèi)ド墸瑢υ捠?AI 技術將對傳統(tǒng)的藍牙市場帶來新的機遇邑贴。
從場景上來看席里,藍牙設備也存在許多痛點。我們主要總結了三個場景拢驾,一個是家中奖磁,一個是路上,一個是在車內(nèi)繁疤。在家中咖为,智能音箱既支持 WiFi 又支持藍牙,可進行語音交互稠腊。在路上有穿戴設備和智能耳機躁染,蘋果前不久發(fā)布第二代 AirPods 支持了 Siri 語音喚醒。第三個場景是車內(nèi)架忌,人在開車的時候雙手被限制在方向盤上吞彤,這時候語音交互就會變成非常自然的交互方式。
基于這三個場景叹放,我們怎么幫助用戶提升他的體驗饰恕,怎么幫助設備商更好地提升產(chǎn)品呢?這就是我們之前半年到一年時間探索當中希望解決的問題井仰。
小度藍牙解決方案
在 2018 年 7 月的百度開發(fā)者大會上懂盐,百度在國內(nèi)率先提出了藍牙設備的語音解決方案——DMA 藍牙解決方案。在 11 月的百度世界大會上糕档,我們發(fā)布了第一款基于 DMA 藍牙協(xié)議的車載支架莉恼,這也是我們在車載場景上基于藍牙解決方案做的實踐產(chǎn)品拌喉。這個產(chǎn)品并不希望攪亂市場,我們更多是想告訴其他相關的廠商俐银,這樣的一個方案是 work 的尿背、是被用戶買賬的。
同時田藐,因為精力有限,我們也不希望完全自己來做所有語音藍牙設備吱七,而是希望把藍牙合作方案輸出給更多合作伙伴汽久,讓大家打造出具備智能對話能力的藍牙設備。
而做這件事情的時候踊餐,會給廠商帶來一系列的問題景醇,比如:
用戶是否有需求?對這樣的產(chǎn)品感興趣嗎吝岭?
是否會增加很大的生產(chǎn)成本三痰?
AI 技術接入門檻高嗎?是否需要投入很多人力和周期窜管?
有成型的方案幫助我們落地嗎散劫?
語音能力、NLP 打包在方案中嗎幕帆?
可以給用戶提供哪些內(nèi)容資源获搏?是否收費?
實際中失乾,我們對這些問題也進行了研究和探討:
小度的裝機量颜凯、活躍度,以及小度車載支架的熱賣仗扬,從市場角度印證了,用戶對這個產(chǎn)品有非常大的剛需蕾额。
產(chǎn)品的功能方面早芭,我們在小度藍牙方案上基于不同的場景做深度的打磨,比如車載支架相應的車載場景诅蝶,剛需的內(nèi)容就包括娛樂退个、導航、接打電話调炬,針對這些場景深度打磨的產(chǎn)品都會在小度 APP 上得以體現(xiàn)语盈。
針對技術門檻,我們也做了很多優(yōu)化缰泡,提供 SDK 的開發(fā)套件刀荒,把研發(fā)的門檻降到非常低。
DMA 整套方案是免費的一體化解決方案,包括語音技術缠借、背后的內(nèi)容資源和開放生態(tài)干毅,以及第三方技能。
關于小度藍牙的解決方案
接下來是具體的方案介紹泼返,小度藍牙的解決方案主要包含兩部分硝逢,一個是小度 APP,第二個是 DMA 協(xié)議绅喉。DMA 協(xié)議的主要作用是幫助藍牙硬件和手機上的 APP 之間進行對話式交互通訊渠鸽。
通過我們提供的 DMA SDK,可以快速把 AI 移植到藍牙設備柴罐,讓數(shù)以千萬的藍牙設備瞬間變成可以對話的人工智能設備徽缚。
當這些藍牙設備有了語音交互的能力,就能夠讓用戶通過語音交互獲取小度云端的內(nèi)容丽蝎,包括聽音樂猎拨、有聲節(jié)目、導航屠阻、控制家居等等红省。
小度的 DMA 語音解決方案有效解決了經(jīng)典藍牙協(xié)議的以下痛點:觸碰和按鍵觸發(fā)、語音輸入延時明顯国觉、APP 之間的串擾和搶占等吧恃。
DMA 解決方案的語音交互不需要觸發(fā)按鈕,并針對遠場的語音交互做了非常多的優(yōu)化麻诀,在車內(nèi)復雜的環(huán)境下痕寓,喚醒率達到了 97% 以上;DMA 解決方案的 BLE/RFCOMM 通道和 A2DP 可以同時使用蝇闭,延時從 500ms-2000ms 下降到 200ms-300ms呻率,不影響占用錄音通道的 App。
百度對話式人工智能的創(chuàng)新二:大屏交互
今天還會跟大家分享我們另外一個在做的創(chuàng)新探索呻引,即大屏體驗礼仗。
「讓用戶放下遙控器」是我們做大屏探索時給自己設定的一個目標。針對找不到遙控器逻悠、找片很費勁元践、音質(zhì)不理想的幾大痛點,我們做了小度電視伴侶這樣一個設備童谒,它有很好的 Hi-Fi 音質(zhì)单旁,全語音遠場交互,和全天候人工智能助手饥伊,這個產(chǎn)品最終的銷量也遠高于我們的預期象浑。
在小度電視伴侶蔫饰,我們專門設計的小度智能電視 UI 可以告訴用戶,放下遙控器融柬、試著通過語音來跟這個設備進行交互死嗦;
我們還創(chuàng)造了「大屏信息流」的概念,把好的內(nèi)容通過信息流呈現(xiàn)粒氧,并通過語音交互做定制化的推送越除;
同時,這一設備的整套系統(tǒng)全面接入了小度語音助手外盯,使得語音無處不在摘盆,它開機時就是智能電視,關上之后就變成智能音箱饱苟,語音交互一直在線……
針對電視上 APP 應用安裝麻煩的痛點孩擂,小度電視伴侶搭載了 DuerOS 的語音技能,不需要安裝箱熬,只需一句話就可以調(diào)用类垦。
我們希望在后續(xù)中不斷探索人機交互,以及人工智能如何賦能不同場景的智能硬件城须,希望對話式硬件被更多人使用蚤认。