渡鴉發(fā)布 1699 元智能音箱:百度「自家」是如何打造 AI 硬件的?
賦能你的手機占遥、你的家、你的車输瓜,DuerOS 喚醒萬物的盤子可能比你想象還要大
我們期待著 DuerOS 能為整個語音智能行業(yè)帶來的勃勃生機瓦胎。
4 個月前负芋,當景鯤喊出這一句口號時,許多人覺得這只是巨頭自信心過剩的大話嗜愈。然而短短 4 個月里旧蛾,DuerOS 新增 130 余家合作伙伴、落地硬件解決方案超過 20 個蠕嫁、每月有 5 款以上搭載 DuerOS 的設備推出……DuerOS 迭代平臺锨天、整合生態(tài)、將對話式 AI 能力進行產品化落地的速度拌阴,讓懷疑的聲音很快安靜下來绍绘。
11 月 16 日召開的「百度世界大會 2017 」上,DuerOS 發(fā)布了全面升級的 DuerOS 2.0 對話式 AI 操作系統(tǒng)迟赃,并相繼推出了一系列推進產業(yè)鏈變革和產學研聯動的措施陪拘。
對話核心系統(tǒng):讓設備更智能,用戶體驗更好
在智能音箱這個新興的消費產品市場纤壁,許多人工智能產品被詬病為「人工智障」左刽,究其原因還是人機交互設計和智能化程度的不成熟。DuerOS 要賦能萬物酌媒,成為世界級 AI 系統(tǒng)的標桿欠痴,必須提升自身交互體驗的能力,拔高全行業(yè)最高水平秒咨,同時推高行業(yè)平均水平喇辽。
這一版升級的 DuerOS 2.0 系統(tǒng)陡厘,在核心技術能力層面抽米,提升了準確快速的語音喚醒能力、流暢自然的語音識別能力糙置、生動鮮活的合成語音云茸、以及更加豐富的 AI 能力。
在語音喚醒能力方面谤饭,實現了一句聯控标捺、任意打斷、波束成形揉抵、噪聲抑制宜岛、混響抑制、陣列增益功舀、回聲抵消萍倡。其中,無間斷喚醒辟汰、清唱識曲列敲,這兩項用戶使用頻率較高的設備能力,在這一版有了較好的表現帖汞。
在語音識別能力方面戴而,百度的上億級近場數據,為遠場設備做了調優(yōu)鋪墊翩蘸,識別準確率有了大幅度的提升所意。高頻詞做了全面優(yōu)化,中英文、多種說話方式和口音的一體化建模扶踊,大大降低了設備的誤識別率泄鹏。在語音語義一體化識別上,也更加流暢秧耗。
在合成語音能力方面备籽,DuerOS 基于深度學習的情感拼接合成,全新定制的高度擬人化的合成音分井,「小度」的聲音將更加生動鮮活车猬。
除此之外,新版 DuerOS 還集成了包括人臉識別尺锚、圖形識別珠闰、音頻旋律匹配與檢測技術、大數據控制與分析技術等更加豐富的 AI 能力瘫辩,為智能設備的功能擴展預留空間伏嗜。
用戶體驗是對話式人工智能生態(tài)系統(tǒng)的核心。DuerOS 希望達到的效果杭朱,是能讓用戶在不同的場景下阅仔,能夠自然的使用設備、并且習慣一直使用這個設備弧械,并讓用戶越來越習慣智能化的生活八酒。
智能設備開放平臺:加快賦能硬件設備
在過去的幾個月里,DuerOS 不停歇地推動著搭載 DuerOS 能力的硬件設備陸續(xù)落地刃唐。一方面羞迷,我們看到了包括中信國安廣視、小魚在家画饥、海爾衔瓮、美的、聯想抖甘、哈曼热鞍、TCL、極米衔彻、小天才等眾多知名企業(yè)與 DuerOS 的品牌聯合薇宠;另一方面,DuerOS 也在將對話能力應用到手機艰额、電視澄港、音箱等智能家居、智能穿戴和車載場景中柄沮。
為了更快的推進各行各業(yè)的賦能回梧,DuerOS 在解決方案方面也進行了全面升級废岂,包括更好的遠場語音交互開發(fā)套件、全新的語音交互 App 解決方案狱意、全新的 DuerOS for Apollo 解決方案湖苞、以及全新的跨場景跨設備解決方案。
李彥宏在百度世界大會上通過手機百度髓涯,在語音播報新聞信息流內容時袒啼,用自然語言交互進行播報控制及深度信息挖掘的體驗展示哈扮,正是基于 DuerOS 2.0 提供的語音交互 App 解決方案纬纪。
除此之外,DuerOS 還對平臺體系進行了升級滑肉,包括新增的物聯網設備云包各、智能設備質量認證支持,平臺體系更加豐富靶庙。
技能開放平臺:讓設備擁有更豐富的內容、服務六荒、和特定場景的對話能力
4 個月前护姆,我們在做語音技能的深度報道時,還需要通過 App 開發(fā)做類比掏击,以闡述技能的概念卵皂,并渲染在 AI 時代,語音技能開發(fā)的未來前景砚亭。然而不到半年的時間灯变,國內廠商陸續(xù)發(fā)布了各自的語音技能平臺。人們對于技能關注的目光捅膘,也逐漸從「是什么」添祸、「為什么」,轉向「怎么做」寻仗。
百度自己評價對話式 AI 產品體驗的核心指標是聽清刃泌、聽懂與滿足能力,其中的滿足就體現在內容及服務生態(tài)的豐富度上署尤。DuerOS 已經可以提供 10 大類耙替、超過 100 項原生技能給用戶,讓用戶體可以體驗包括影音娛樂沐寺、信息查詢林艘、出行路況、聊天休閑混坞、生活服務等技能狐援。
為了讓用戶享受到豐富多彩的技能钢坦,DuerOS 不僅大幅提升了原生技能的豐富度與用戶體驗,還發(fā)布了小度技能開放平臺啥酱,兼容了 UNIT爹凹、ChatFlow、STOR/AOR镶殷、ruyi 等多種技能開發(fā)工具禾酱,讓開發(fā)者借助平臺,真正實現「一站式」绘趋、「零門檻」的語音技能開發(fā)颤陶。
目前,DuerOS 的技能生態(tài)已擁有超過 100 個原生技能和 100 個第三方技能陷遮。未來滓走,將會有更多諸如成語接龍、星座運勢帽馋、飲食百科的語音技能上線 DuerOS 技能商店搅方。
推動對話式人工智能在產、學绽族、研三方面全面發(fā)展
要成為世界級人機交互的標桿姨涡,更好的推動行業(yè)發(fā)展和更優(yōu)秀的產品體驗,DuerOS 可以做的更多吧慢。
對話式 AI 技術正在重新定義人機交互的方式涛漂。為引領和定義最好的人機交互,DuerOS 成立了百度人工智能交互設計院娄蔼,未來將以報告輸出怖喻、產品測評等形式,幫助 DuerOS 的合作伙伴和全球 AI 產品在交互設計上不斷提升優(yōu)化岁诉。
同時锚沸,為了進一步提高對話式 AI 領域的技術領先優(yōu)勢,DuerOS 最新的普羅米修斯計劃正式起航涕癣,這個計劃包含開放超大規(guī)模對話式 AI 數據集哗蜈、跨學科合作等多種計劃,以及一個 100 萬美元的基金用以鼓勵和培養(yǎng)對話式 AI 領域的優(yōu)秀項目和人才坠韩。
DuerOS 將推動對話式人工智能在產距潘、學、研三方面全面發(fā)展只搁。喚醒萬物音比、全面領跑語音智能行業(yè)的 DuerOS 將最有能力成為那個為智能創(chuàng)造更多可能的平臺。
展望
過去的 4 個月氢惋,是整個語音智能行業(yè)特別突飛猛進的 4 個月洞翩。國外稽犁,Google 推出了智能音箱全家桶,亞馬遜發(fā)布了二代 Echo 并推進 Alexa 技能付費政策骚亿,蘋果供應商爆料 HomePod 將搭載 Face ID已亥,Sony 等廠商也相繼推出帶屏幕的智能音箱。這些都是特別好的信號来屠,巨頭推動產業(yè)變革的速度虑椎,總能超出人們的想象。
國內俱笛,一個雙 11 將百箱大戰(zhàn)推到了一個新高度捆姜。產品公司積極的向普通消費者普及智能音箱,在家里嫂粟、在車上娇未、在酒店墨缘,場景化的對話式人機交互已經無處不在星虹。另一方面,平臺公司則面向開發(fā)者镊讼,相繼開放了自己的語音智能平臺能力宽涌,開發(fā)者申請開發(fā)板和參與技術沙龍的熱情高漲。整個行業(yè)保持的這種熱情蝶棋,推動著人機交互的變革走進每一個家庭卸亮,讓對話式 AI 成為一個生活必需品。
這是一個最好的時代玩裙。要成為時代的領跑者兼贸,不僅要成為披荊斬棘的創(chuàng)新者和開拓者,更需要成為縱橫捭闔的整合者吃溅。百度是國內最早進入溶诞、最大投入、最完整布局的 AI 公司决侈。作為百度 AI 能力和資源集大成者的一個縮影螺垢,以及對話式人工智能的一個縮影,DuerOS 充分發(fā)揮了可以貫穿技術赖歌、產品枉圃、平臺、生態(tài)的垂直整合能力庐冯。
我們期待著 DuerOS 能為整個語音智能行業(yè)帶來的勃勃生機孽亲。