Uploads%2farticles%2f11950%2fp1953211411
|
2017-12-05

在和「小愛同學(xué)」相處數(shù)日后二驰,我發(fā)現(xiàn)語音智能把 IoT 盤活了

語音交互第一次突破了人機(jī)交互距離的限制。

上周二唬复,小米在北京召開了首屆小米 IoT 開發(fā)者大會(huì),雷軍宣布敞咧,在接入 8500 萬設(shè)備之后棘捣,小米 IoT 平臺(tái)迎來全面開放,包含模塊和硬件開放準(zhǔn)入乍恐、米家 APP 開放接入评疗、新零售渠道開放、智能設(shè)備互聯(lián)互通開放控制和 AI 云壤巷、大數(shù)據(jù)的開放共享邑彪。

四個(gè)月前瞧毙,小米的智能音箱「小愛同學(xué)」發(fā)布時(shí)寄症,小米在 IoT 領(lǐng)域的積累為 AI 產(chǎn)品帶來的助力就已經(jīng)顯露出來。

作為「小愛同學(xué)」的第一批用戶有巧,順為資本投資經(jīng)理段譽(yù)在自己的公眾號(hào)上,撰文講述了自己和「小愛同學(xué)」的相處時(shí)光篮迎,以及他對(duì)語音智能的一些行業(yè)洞見男图。

本文系段譽(yù)的投稿甜橱,深圳灣(公眾號(hào) ID:shenzhenware)在保留原文內(nèi)容基礎(chǔ)上逊笆,對(duì)文字進(jìn)行了部分優(yōu)化。

段譽(yù)难裆,2013 年初加入順為資本,主要負(fù)責(zé)考察移動(dòng)互聯(lián)網(wǎng)和智能硬件領(lǐng)域的投資機(jī)會(huì)镊掖,曾參與了華米科技、Yeelink亩进、Ninebot症虑、馭光科技等公司的投資归薛。段譽(yù)畢業(yè)于北京大學(xué)經(jīng)濟(jì)學(xué)院,擁有經(jīng)濟(jì)學(xué)學(xué)士和碩士學(xué)位苟翻。業(yè)余時(shí)間韵卤,他喜歡健身和越野跑崇猫,曾完成了北京 TNF 21KM沈条,寧海 50KM 越野挑戰(zhàn)賽等賽事。

故事的開始

前兩天朋友跑來問我蜡歹,如何在自己的豪宅布置智能家居屋厘。交流了各種協(xié)議走線問題后,我問他控制中心怎么做汗洒,這位壕哥提出,打算用美帝的 Control4 的觸控面板做中控父款。

美帝的 Control4 的觸控面板

屌絲終于在此刻找到了自豪感,我淡淡地告訴他憨攒,自從用了粗糧家的「小愛同學(xué)」世杀,家里的無線開關(guān)已經(jīng)開始積灰了肝集,更不用提智能家庭 App 了。

我在「小愛同學(xué)」身邊發(fā)現(xiàn)了語音交互的妙不可言

雖然無法精確度量杏瞻,但喜歡窩在沙發(fā)上看國劇的我所刀,本能地發(fā)現(xiàn)說一句「小愛同學(xué)捞挥,關(guān)閉客廳的燈」浮创,要比伸手去找遙控器(或者遙控器替代品)要省時(shí)树肃、省力蒸矛、耗能少胸嘴。

某聲學(xué)項(xiàng)目的 FA 曾嚴(yán)謹(jǐn)?shù)乇容^過不同交互方式的優(yōu)劣,當(dāng)然他們的結(jié)論是 Voice First(語音交互優(yōu)先)劣像。而我的理解是:對(duì)于不同的指令任務(wù)乡话,有不同的最佳交互路徑耳奕。

對(duì)于復(fù)雜的長時(shí)間輸入(例如寫這篇文章,或是 coding)屋群,目前仍然需要鍵盤的支持闸婴。對(duì)于多輪次復(fù)雜邏輯的交互,視覺交互的反饋更快芍躏,觸控也具有一定優(yōu)勢,例如重設(shè)一部手機(jī),或是在 App 上買機(jī)票庇楞。

但如果是單輪輕度輸入榜配,語音交互的優(yōu)勢就會(huì)很明顯吕晌,例如,讓「小愛同學(xué)」幫忙設(shè)置早上 7 點(diǎn)的鬧鐘睛驳,絕對(duì)是「Killer App」烙心。更有趣的是柏靶,在這個(gè)場景下溃论,復(fù)雜的輸入設(shè)置——早晨屎蜓、7點(diǎn)、每天重復(fù)炬转、確認(rèn)——通過語音交互可以一氣呵成,妙不可言算灸。

鍵盤、鼠標(biāo)菲驴、觸控屏荐吵、語音交互方式比較

我們更喜歡語音交互,并非因?yàn)橛姓Z音識(shí)別技術(shù)赊瞬,或是語音智能對(duì)話,而是因?yàn)檎Z音交互第一次突破了人機(jī)交互距離的限制巧涧。能夠躺在床上/沙發(fā)上隨意發(fā)號(hào)施令薯蝎,過去只能由「真人助理」來完成谤绳,現(xiàn)在可以由設(shè)備來完成了。

雖然這些年 Siri 等手機(jī)語音助手一直致力于解決同樣的問題缩筛,但單純拿起手機(jī)按下 Home 鍵再舉到嘴邊做這個(gè)發(fā)號(hào)施令的動(dòng)作消略,就已經(jīng)很令人掃興了瞎抛,更不要說因?yàn)橹形膶?duì)話不夠智能艺演,Siri 時(shí)不時(shí)的答非所問。

除了語音交互技術(shù)之外钞艇,還有通過視覺或超聲波的「隔空手勢識(shí)別與交互」的技術(shù)啄寡,但它們相對(duì)于同樣遠(yuǎn)距離的語音交互哩照,使用的復(fù)雜度和學(xué)習(xí)成本都太高了。

我在「小愛同學(xué)」身后學(xué)習(xí)了遠(yuǎn)場語音技術(shù)

遠(yuǎn)場語音交互的一系列功能是如何實(shí)現(xiàn)的呢飘弧?它和近場語音的區(qū)別在哪里识藤?

帶著這些問題次伶,我研究了相非老師的技術(shù)架構(gòu)圖:

遠(yuǎn)場語音技術(shù)架構(gòu)痴昧,點(diǎn)擊查看大圖

在進(jìn)行語音識(shí)別(包括本地和云端)之前冠王,有一系列復(fù)雜的聲學(xué)前端算法赶撰,包括:


  • 回波抵消(去除音箱自己播放的音樂)
  • 波束形成(只聽人說話的那個(gè)方向,去除其他方向的干擾)
  • 去混響(去除桌椅板凳的聲音反射)
  • 聲紋識(shí)別(區(qū)分爸爸在說還是媽媽在說)

經(jīng)過這一系列的聲學(xué)處理豪娜,相對(duì)「干凈」的語音信號(hào)才會(huì)進(jìn)入負(fù)責(zé)喚醒的模型,喚醒之后才會(huì)進(jìn)一步地進(jìn)入云端負(fù)責(zé)語音識(shí)別的模型哟楷。

這一交互涉及到了:

  • 物理硬件層(聲腔結(jié)構(gòu)設(shè)計(jì),麥克風(fēng)陣列設(shè)計(jì))
  • 信號(hào)層(上述聲學(xué)處理)
  • 后續(xù)的數(shù)據(jù)層(語音識(shí)別卖擅、NLP鸣奔、TTS 等)

這三層分別需要物理聲學(xué)惩阶、信號(hào)處理挎狸、和計(jì)算機(jī)專業(yè)三個(gè)領(lǐng)域的人才相互配合,是一個(gè)相當(dāng)復(fù)雜的系統(tǒng)工程伟叛。

以上這些知識(shí),還只是語音技術(shù)層面脐嫂。作為消費(fèi)級(jí)產(chǎn)品,智能音箱想要達(dá)到好的用戶體驗(yàn)效果账千,還涉及到產(chǎn)品層面侥蒙、以及產(chǎn)品之上應(yīng)用層面的一系列問題匀奏。

智能音箱多維度比較

我在「小愛同學(xué)」身上看到了未來已來

IoT 喊了很多年,從 20 年前的智能家居,到 2009 年無錫落地的物聯(lián)網(wǎng)產(chǎn)業(yè)園论衍,再到 2014 年火熱的智能家居創(chuàng)業(yè),乃至去年底孫正義大神提出的「鞋子比人更聰明」坯台,IoT 都處在只打雷不下雨的尷尬狀態(tài)炬丸。究其原因,我曾經(jīng)認(rèn)為是「云-網(wǎng)-端」三層中端的密度不夠蜒蕾,即設(shè)備數(shù)量還不夠多,從而數(shù)據(jù)量不夠大咪啡,和人接觸點(diǎn)也不夠多首启。

根據(jù)小米最新公布的數(shù)據(jù),MIoT 在 2016 年底大約 5000 萬入網(wǎng)設(shè)備毅桃,2017 年中達(dá)到 6000 萬臺(tái),2017 年 11 月在小米 IoT 開發(fā)者大會(huì)上愁溜,公布了 8500 萬的入網(wǎng)設(shè)備外厂。

在我看來冕象,5000 萬和 8000 萬并沒有本質(zhì)的差別汁蝶,但這些 IoT 設(shè)備一旦融入了智能語音交互后渐扮,原先的 App 指令控制掖棉、傳感器觸發(fā)墓律,就變成了遠(yuǎn)場語音控制。這樣一來耻讽,交互界面從單一的手機(jī) App(家里不方便)、傳感器觸發(fā)(冷冰冰且不豐富)帕棉,擴(kuò)展到了無處不在的語音指令(方便且有溫度)针肥。

用 App 指令控制香伴、傳感器控制、智能語音控制的典型場景即纲,以及典型設(shè)備

當(dāng)然具帮,語音交互絕不只是遠(yuǎn)距離版的遙控器而已。

獨(dú)立于智能家居的硬件設(shè)備外蜂厅,語音交互有機(jī)會(huì)將隨身設(shè)備、車載設(shè)備掘猿、乃至互聯(lián)網(wǎng)的一系列服務(wù)串聯(lián)起來锹雏。常見的語音交互場景包括:在車?yán)锿ㄟ^語音交互設(shè)備,提前把外賣點(diǎn)好(已經(jīng)實(shí)現(xiàn))礁遵;在跑步時(shí)通過智能耳機(jī),把家里的熱水器打開(還需要解決低功耗喚醒問題)采记;在家通過智能音箱佣耐,把凱叔召喚出來給孩子講故事(已經(jīng)實(shí)現(xiàn))唧龄。

智能設(shè)備的落地場景、核心技術(shù)既棺、以及服務(wù)聚合讽挟,點(diǎn)擊查看大圖

技術(shù)本身就是讓原本少數(shù)人的特權(quán)(鋼鐵俠擁有的 Javis)飛入尋常百姓家丸冕。能夠見證這一過程耽梅,的確令人興奮胖烛。

>>
Back to top btn
亚洲AV无码国产精品网址,久久亚洲AV成人出白浆无码国产,日韩AV美乳欧美,永久免费AV无码软件app下载