比阿里早兩年入場的京東叮咚穷缤,在國產(chǎn)智能音箱之路上都收獲了什么 | WARE 2017 人物專訪
推出首款聲紋購物 AI 音箱叹阔,阿里瞄準(zhǔn)的依然是你的錢袋
購物 AI 場景化后,剁手黨該改名叫封口黨了传睹。
站在媒體圈看智能語音界的各路朋友,今天議論的熱點都聚焦在了百度與阿里欧啤。兩家巨頭睛藻,兩場迥然不同的發(fā)布會風(fēng)格:一個火力全開,一個卻如蜻蜓點水邢隧。
今天上午店印,近 4000 人參與了百度在北京舉辦的 AI 開發(fā)者大會,這是百度有史以來規(guī)格最高的一次人工智能大會倒慧。會上總裁兼 COO 陸奇發(fā)表了激情澎湃的演講按摘,公布了有關(guān) DuerOS 語音交互平臺 包券、Apollo 自動駕駛平臺,以及百度大腦+智能云的幾項重磅進(jìn)展院峡。講臺上的陸奇讓人印象深刻兴使,多次以「最」字冠名百度的 AI 技術(shù),不斷重申百度在 AI 界的地位照激。
與百度火力全開的發(fā)布會風(fēng)格相比发魄,阿里巴巴人工智能實驗室在北京時間博物館召開的一個小場發(fā)布會,則顯得靜水流深許多俩垃。發(fā)布會全程交由阿里巴巴人工智能實驗室負(fù)責(zé)人淺雪(陳麗娟)主持励幼,正式發(fā)布了國內(nèi)首款 AI 購物智能音箱——天貓精靈 X1。
下面深圳灣分三個角度來解讀這場發(fā)布會:
一看定位:阿里的首款 AI 消費(fèi)級音箱口柳,也是國內(nèi)首款購物音箱苹粟,背靠電商,瞄準(zhǔn)的依然是你的錢袋
準(zhǔn)確來說跃闹,亞馬遜 Echo 才是業(yè)內(nèi)首款可購物智能音箱嵌削,只是可惜 ,Echo 還不會講中文望艺,國人也不習(xí)慣上亞馬遜購物苛秕。
而國內(nèi)最有望率先實現(xiàn)這個功能的,便是京東與阿里找默。京東旗下的靈隆科技艇劫,已經(jīng)于兩年前布局了智能音箱。如今阿里率先實現(xiàn)了語音購物惩激,對于同是電商的京東來說店煞,實現(xiàn)語音購物功能也不過是個時間問題。
發(fā)布會現(xiàn)場 直播測試了天貓精靈的購物功能风钻。根據(jù)現(xiàn)場演示顷蟀,僅需一句喚醒詞,再加上告訴它商品名稱魄咕,天貓精靈就能夠自動根據(jù)銷量衩椒、售價等參數(shù)推薦排名靠前的商品;然后經(jīng)過聲紋識別身份驗證哮兰,就可實現(xiàn)支付寶自動扣款毛萌,而后續(xù)的物流信息也可通過語音查詢。
天貓精靈產(chǎn)品經(jīng)理釋空介紹說:「由于淘寶商品品類豐富喝滞,名詞繁雜阁将,因此技術(shù)團(tuán)隊對所有商品信息進(jìn)行了標(biāo)簽化整理,使得天貓精靈在向用戶介紹商品信息時更加口語化右遭。精準(zhǔn)的聲紋識別則保證了支付環(huán)節(jié)的安全性做盅,也方便對商品售后服務(wù)的跟蹤查詢缤削。」
當(dāng)然,作為一款定位于家居環(huán)境使用的智能音箱吹榴,天貓精靈也集成了生活信息查詢亭敢、健身助手、兒童陪伴等智能音箱的標(biāo)配功能图筹。不過帅刀,其中也有兩項便捷功能讓人頗為印象深刻。
第一是家用電器控制远剩。根據(jù)釋空的介紹扣溺,這款音箱能同時實現(xiàn)終端設(shè)備一對一、一對多的家用電器控制瓜晤,還支持多種場景模式的選擇锥余。例如下班回家,喚醒天貓精靈后會自動切入回家模式痢掠,則設(shè)置好的必用電器驱犹,例如點燈、排風(fēng)扇足画、電視着绷、空調(diào)等會同步打開,此謂一對多锌云;而如果覺得空調(diào)溫度太低,或者燈光太暗吁脱,則可語音告訴音箱單獨(dú)提升溫度桑涎、燈光,此謂一對一兼贡。根據(jù)王自如現(xiàn)場的演示攻冷,利用天貓精靈來點播音頻,或是操控電視點播視頻節(jié)目遍希,電器的反應(yīng)速度也十分快速等曼。
第二,則是尋找手機(jī)功能凿蒜。大家或許都曾有過在上班時卻發(fā)現(xiàn)手機(jī)不見了的窘迫時刻禁谦,而這時告訴天貓精靈尋找手機(jī),它就會自動撥打手機(jī)號碼废封,使用者再根據(jù)鈴聲或是亮光尋找手機(jī)州泊。有人會想將來這款音箱會不會替代手機(jī)進(jìn)行家人間的多方通信呢,這就得問其背后的阿里通信了漂洋。
二看技術(shù):業(yè)內(nèi)首款實現(xiàn)商用的聲紋購物系統(tǒng)遥皂,無需 App 也可操作
整場發(fā)布會以產(chǎn)品應(yīng)用為重點力喷,在產(chǎn)品語音技術(shù)與硬件設(shè)計方面并沒有深入挖掘。不過我們依然能了解到天貓精靈的一些產(chǎn)品技術(shù)與設(shè)計細(xì)節(jié):
天貓精靈 X1 采用了圓柱形的設(shè)計演训,有黑白兩種配色弟孟,高 126 mm, 直徑 83 毫米样悟,現(xiàn)場淺雪還專門將其與亞馬遜 Echo 和 蘋果 HomePod 作了對比拂募,以顯示其設(shè)計的小巧。
在 X1 頂部中央乌奇,配有一枚靜音鍵没讲。當(dāng)用戶觸發(fā)此鍵時,X1 會立刻停止聲音播放礁苗,并停止識音功能爬凑,以有效保證用戶隱私。
在配置方面试伙,X1 采用了業(yè)內(nèi)首顆 SmartAudio專業(yè)處理芯片嘁信,相比此前市面上的主流芯片,處理效率提升 25% 疏叨,功耗降低 32% 潘靖。
X1搭載了 6 麥克風(fēng)環(huán)形陣列,能夠在家庭環(huán)境下實現(xiàn) 5 米范圍語音識別蚤蔓。并經(jīng)過專業(yè)音效調(diào)節(jié)的獨(dú)立功放芯片卦溢,使得 X1 同時也具有優(yōu)秀的外放效果。
X1 底部設(shè)計了一圈隱藏指示燈秀又,會通過聲音來判斷用戶方位单寂,亮起燈光以示提醒,燈光還會根據(jù)不同使用功能和場景配合進(jìn)行提示吐辙。
軟件方面宣决,天貓精靈則采用的是阿里自家團(tuán)隊研發(fā)的 AliGenie 語音交互系統(tǒng),目前阿里人工智能實驗室正在對聲紋識別昏苏、聲紋購 尊沸、NLP 中文對話引擎等核心技術(shù)申請專利,就在不久前贤惯,阿里的 NLP 技術(shù)團(tuán)隊還發(fā)表過一篇自然語言處理相關(guān)的論文洼专。
既然是要實現(xiàn)語音購物,基于安全性的考慮救巷,聲紋識別功能就顯得十分重要壶熏。阿里推出的聲紋購是業(yè)內(nèi)首個實現(xiàn)商用的聲紋購物系統(tǒng),當(dāng)用戶發(fā)起購物浦译、充值等行為時棒假,只需要說出聲紋密碼溯职,識別系統(tǒng)將會自動進(jìn)行身份校驗,確認(rèn)是本人后才會完成交易帽哑,否則將拒絕請求谜酒。
多輪對話技術(shù)方面,阿里技術(shù)團(tuán)隊則在自然語言理解的基礎(chǔ)上妻枕,加入了「決策引擎」的機(jī)制僻族,使得機(jī)器能更好理解上下文語境,并判斷響應(yīng)的模塊進(jìn)行決策屡谐。
通過深度機(jī)器學(xué)習(xí)述么,天貓精靈 X1 已兼容 20 個領(lǐng)域的自然語義理解。阿里人工智能實驗室研發(fā)的中文語義理解引擎針對常用的定時愕掏,提醒度秘,天氣,娛樂內(nèi)容饵撑,家居控制剑梳,助手,以及購物等領(lǐng)域進(jìn)行了特別優(yōu)化滑潘,僅天氣預(yù)報就能夠理解 786 種中文問法垢乙。
值得一提的是,天貓精靈可以安裝天貓精靈 App 綁定賬號對硬件進(jìn)行設(shè)置语卤,也可以通過「手機(jī)淘寶」中「我的設(shè)備」中進(jìn)入操作界面追逮,無需單獨(dú)下載 App。
天貓精靈X1售價 499 元粹舵,將于 8 月 8 日正式登陸天貓開售羊壹。
三看團(tuán)隊:神秘的阿里人工智能實驗室,可能還憋著很多大招
本以為阿里會借這次發(fā)布會齐婴,會順便秀一下阿里人工智能實驗室的肌肉,向外界展現(xiàn)其背后積淀的技術(shù)實力稠茂。遺憾的是柠偶,或許是為了避開百度的鋒芒,又或許是未到最佳時機(jī)睬关,整場發(fā)布會完美的避開了對阿里人工智能實驗室這一角色的深度挖掘诱担。
據(jù)了解,阿里巴巴人工智能實驗室去年成立于杭州电爹,辦公地點就在阿里巴巴總部所在地西溪園區(qū)蔫仙,隸屬于阿里平臺技術(shù)事業(yè)群,直接向 CTO 張劍鋒(花名行癲)匯報丐箩。最近阿里另一個人工智能相關(guān)的部門 iDST 從亞馬遜 Amazon Go 挖來了首席科學(xué)家任小楓打造無人商店摇邦,阿里 AI Labs 的初步發(fā)力則選擇了智能音箱恤煞。不過與名號已經(jīng)打響的 iDST 不同,在成立后施籍,阿里巴巴人工智能實驗室?guī)缀跷丛诠娨曇爸新睹妗?/p>
阿里人工智能實驗室的負(fù)責(zé)人陳麗娟花名「淺雪」居扒,曾是淘寶網(wǎng)第一代產(chǎn)品經(jīng)理,歷任一淘網(wǎng)運(yùn)營總監(jiān)丑慎、阿里智能云總監(jiān)等職務(wù)喜喂。另一位重要人物——阿里巴巴人工智能實驗室首席科學(xué)家王剛,曾在新加坡南洋理工大學(xué)任教竿裂,主攻研究方向為計算機(jī)視覺中的圖像識別玉吁,于今年三月才加入阿里。
這個神秘的實驗室的英文名為 A.I.Labs腻异,復(fù)數(shù)形式不由得引人猜想进副,阿里的人工智能實驗室應(yīng)該不止一個,而是一個集群捂掰。阿里人工智能實驗室主要負(fù)責(zé)阿里旗下消費(fèi)級 AI 產(chǎn)品的研發(fā)敢会,而此次的天貓精靈X1,是該機(jī)構(gòu)發(fā)布的首款實體 AI 產(chǎn)品这嚣,后續(xù)涉及的產(chǎn)品范圍可能會更廣鸥昏。
四看開放平臺:已接入 100 多個品牌,未來將實現(xiàn)多場景覆蓋
除了音箱姐帚,阿里還將開放 AliGenie 開發(fā)者平臺給應(yīng)用開發(fā)者吏垮、智能家居廠商、硬件生產(chǎn)商等罐旗,無需從頭搭建 AI 語音系統(tǒng)膳汪,能節(jié)省研發(fā)上的巨額投入。下面是本次發(fā)布會采訪環(huán)節(jié)關(guān)于 AliGenie 開發(fā)者平臺的信息:
Q:AliGenie 目前所涵蓋的功能包括九秀?
A:目前有以下功能遗嗽,隨著更多功能的開發(fā)和第三方開發(fā)者的加入,功能將不斷擴(kuò)展
1. 音樂音頻:海量曲庫和內(nèi)容庫
2. 家居控制:語音控制智能家電設(shè)備
3. 購物充值:聲紋實現(xiàn)購物全流程
4. 兒童教育:精選兒童音頻內(nèi)容鼓蜒,寓教于樂
5. 技能市場:匯聚各種服務(wù)和內(nèi)容痹换,不斷擴(kuò)展功能
Q:AliGenie 未來還會進(jìn)入哪些生活及商業(yè)場景?
A:目前已經(jīng)或正在拓展的行業(yè)解決方案有
1都弹、 兒童領(lǐng)域
2娇豫、 酒店領(lǐng)域
3、 家庭場景下
4畅厢、 TO B 其他商業(yè)場景
5冯痢、 線下零售場景
6、 與其他顯示設(shè)備結(jié)合的場景
Q:AliGenie 可接入的智能家電范圍包括?
A:目前支持 100 多個品牌浦楣,包括接入阿里智能聯(lián)盟袖肥、涂鴉科技 、broadlink 等智能家居方案的產(chǎn)品椒振,更多智能家電正在接入中昭伸。
Q:AliGenie 開發(fā)者平臺會開放哪些能力?
A:AliGenie 開發(fā)者平臺主要面向四種類型的開發(fā)者澎迎,包括內(nèi)容開發(fā)者庐杨、應(yīng)用開發(fā)者、智能家居開發(fā)商和硬件生產(chǎn)商夹供。開發(fā)者既可以創(chuàng)建技能灵份,為更多的語音用戶提供服務(wù),也可以將自己的設(shè)備接入云端服務(wù)哮洽,獲取語音交互能力填渠。
依托強(qiáng)大的底層技術(shù)、智能的算法引擎鸟辅、完善的云端服務(wù)和成熟的軟硬件標(biāo)準(zhǔn)系統(tǒng) 氛什,AliGenie 會持續(xù)不斷地將全面、易用的核心技術(shù)能力進(jìn)行輸出匪凉,為開發(fā)者帶去更多可能枪眉。通過 AliGenie 開發(fā)者平臺,開發(fā)者可以鏈接到阿里生態(tài)體系中的數(shù)億消費(fèi)者和海量的生活和商業(yè)場景再层。
Q:AliGenie 開發(fā)者平臺有哪些核心技術(shù)開放贸铜?
A: 1、 深度學(xué)習(xí)
我們研發(fā)了國際領(lǐng)先的深度學(xué)習(xí)技術(shù)來作為 AliGenie 的大腦聂受,這些技術(shù)成果被發(fā)表在頂尖國際會議例如 KDD 和 CVPR 上蒿秦。我們自主研發(fā)的深度學(xué)習(xí)能快速高效的從海量數(shù)據(jù)中進(jìn)行學(xué)習(xí),并能在廣泛的應(yīng)用場景中使用蛋济。
2棍鳖、 自然語言處理
基于我們積累的海量的自然語言數(shù)據(jù),和自主研發(fā)的國際領(lǐng)先的深度學(xué)習(xí)技術(shù)碗旅,我們實現(xiàn)了高效準(zhǔn)確穩(wěn)定的自然語言理解鹊杖。
3、 搜索/推薦算法
通過阿里積累的用戶畫像扛芽,為用戶個性化地提供用戶所需要的信息和內(nèi)容服務(wù)。
4积瞒、 知識表示及推理問答系統(tǒng)
我們構(gòu)建了一個海量的知識庫川尖,實現(xiàn)對萬事萬物的結(jié)構(gòu)化的描述,這個知識庫不僅幫助我們更好的理解語言,更重要的是可以通過推理回答各種知識類問題叮喳。
上述能力我們將免費(fèi)開放給開發(fā)者和硬件廠商被芳,無需從頭搭建 AI 語音系統(tǒng),節(jié)省在研發(fā)上的巨量投入馍悟,使開發(fā)者能夠更好的為用戶提供服務(wù)畔濒。
Q:如何成為 AliGenie 平臺上的開發(fā)者?
A:通過我們的開發(fā)者平臺锣咒,即可申請成為開發(fā)者侵状,只需要簡單認(rèn)證,就可以使用我們的深度學(xué)習(xí)訓(xùn)練平臺毅整。
1趣兄、 通過官網(wǎng)進(jìn)行注冊,填寫資料申請邀請碼
2悼嫉、 一周內(nèi)發(fā)放邀請碼艇潭,開放相關(guān)工具和平臺
3、 可以利用平臺進(jìn)行相關(guān)的開發(fā)和應(yīng)用戏蔑,然后提交測試評審蹋凝,通過后可以在應(yīng)用商店上線
Q:硬件廠商如何將 AliGenie 集成到自己的產(chǎn)品中?
A:我們會推出全套的硬件參考設(shè)計方案总棵,給予合作伙伴足夠的支持鳍寂。
1、 廠商通過官網(wǎng)申請合作文檔和技術(shù)參考文檔彻舰。
2伐割、 我們將對申請進(jìn)行評估,并與合作伙伴討論準(zhǔn)備相關(guān)硬件的設(shè)計方案刃唤、接入方案及商業(yè)策略隔心。
3、 雙方進(jìn)行聯(lián)合開發(fā)和測試尚胞,整個過程約 1.5 個月左右完成硬霍。
Q:什么樣的智能硬件可以與 AliGenie 連接?硬件廠商如何加入笼裳?
A:目前阿里智能聯(lián)盟的上千萬智能家居設(shè)備已經(jīng)能夠與天貓精靈X1進(jìn)行連接唯卖。
硬件設(shè)備廠商可以通過兩種方式接入 AliGenie:
1.通過 SDK 接入
提供常用平臺(如嵌入式Linux、Android)的 SDK 給到設(shè)備廠商 躬柬,SDK 中包含了如長連接通訊拜轨、設(shè)備用戶綁定、音頻播控允青、狀態(tài)管理等功能模塊橄碾,封裝其中的實現(xiàn)細(xì)節(jié),開發(fā)者可以方便的進(jìn)行接入。
2.通過協(xié)議接入
提供基于 Websocket 的一套標(biāo)準(zhǔn)化協(xié)議法牲,由廠商自行進(jìn)行對接史汗,直接調(diào)用 AliGenie 的各項能力。
Q:開發(fā)者如何分成拒垃?
A:開發(fā)者可以獲得全部收益停撞,平臺在推廣期間不參與分成。我們還會推出相關(guān)的阿里 AI 創(chuàng)新開發(fā)者計劃悼瓮。
進(jìn)一步詳細(xì)的開放信息將在今年 10 月的阿里云論壇上進(jìn)一步公開戈毒。