還別說(shuÅ)噪生,耳機(jÄ«)鑲鉆,真好看东囚ï¼
從傳統(tǒng)麥克風(fēng)到智能麥克風(fēng)塔猾,語(yǔ)音技術(shù)在硬件上的進(jìn)化與轉(zhuǎn)變 | WARE 2017
語(yÇ”)音技術(shù)看似簡(jiÇŽn)單鸦采,實(shÃ)則是一個(gè)é¾å¤§å’Œå¾©(fù)雜的工程宾å·ã€‚
在人機(jÄ«)äº¤äº’é ˜(lÇng)域渔伯,語(yÇ”)音是最自然的交互方å¼é¡¶éœžï¼Œå®Œæ•´çš„語(yÇ”)音系統(tÇ’ng)涉åŠåˆ°äººè²å–šé†’ã€èªž(yÇ”)音è˜(shÃ)別锣å¼ã€èªž(yÇ”)義分æžé€‰æµ‘ã€é‚輯判斷ã€ä¿¡æ¯å›žé¥‹çŽ„å ã€èªž(yÇ”)音åˆæˆé²œä¾¥ï¼Œä»¥åŠæ©Ÿ(jÄ«)器的麥克風(fÄ“ng)陣列ã€éŸ³é »ç·¨è§£ç¢¼è¯¸å…¸ã€æ‡‰(yÄ«ng)用處ç†å™¨ç‰æ函,從軟件到硬件的方方é¢é¢ã€‚
å°(duì)于用戶來(lái)說(shuÅ)ç‹ç²±ï¼Œé€šéŽ(guò)é¡å¤–çš„æ“作喚醒語(yÇ”)音è¨(shè)備的方å¼é¡¯å¾—多æ¤ä¸€èˆ‰èˆ€å¯“,未來(lái)的語(yÇ”)音è¨(shè)備必定是全天候 24 å°æ™‚(shÃ)在線,隨時(shÃ)隨地è†è½(tÄ«ng)肌蜻,ç‰å¾…用戶的喚醒互墓。
在深圳ç£èˆ‰è¾¦çš„「WARE 2017 語(yÇ”)音智能平臺(tái)與應(yÄ«ng)用峰會(huì)ã€ä¸ï¼Œç‘žè²ç§‘技高級(jÃ)ç ”ç™¼(fÄ)工程師張金宇從語(yÇ”)音交互的硬件基礎(chÇ”)上進(jìn)行分享和交æµè’‹æœï¼Œå’Œåœ¨å ´(chÇŽng)的觀眾共åŒæŽ¢è¨Žèªž(yÇ”)音技術(shù)未來(lái)的發(fÄ)展趨勢(shì)篡撵。
以下來(lái)自張金宇在「WARE 2017 語(yÇ”)音智能平臺(tái)與應(yÄ«ng)用峰會(huì)ã€çš„演講整ç†ã€‚

語(yÇ”)音技術(shù)應(yÄ«ng)該「隨時(shÃ)隨地ã€è±†æŒ½ï¼Œå¹¶ä¸”「自然而然ã€
人機(jÄ«)交互分三類育谬,首先是視覺(jué)交互,它的特點(diÇŽn)是è±å¯Œå¸®å“ˆã€æ²‰æµ¸è†›æª€ï¼Œæ¯”如在一些游戲和娛樂(lè)é ˜(lÇng)域的應(yÄ«ng)ç”¨ï¼Œå› ?yà n)樗î軌蛱å³â”³éŠèœ‡S富的信æ¯é‡å¨˜ä¾ï¼Œçµ¦ç”¨æˆ¶å±•ç¾(xià n)具有沖擊力的畫é¢å’–刃,3D 眼é¡å’Œé«”æ„Ÿæ“控的浪潮更是把沉浸å¼çš„視覺(jué)體驗(yà n)推到了一個(gè)極致。第二是觸覺(jué)的交互憾ç,包括éµç›¤åšŽæ¨ã€è§¸å±ï¼Œé€™ç¨®äº¤äº’æ–¹å¼æ‡‰(yÄ«ng)用于å°(duì)æ“作精準(zhÇ”n)度è¦æ±‚æ›´é«˜çš„å ´(chÇŽng)åˆæ°§è…°ï¼Œæ¯”如日常辦公枫浙ã€è¨(shè)計(jì)é ˜(lÇng)域刨肃。第三是語(yÇ”)音,語(yÇ”)音交互一個(gè)很é‡è¦çš„å¸‚å ´(chÇŽng)æ˜¯å®¶å±…å’Œç”Ÿæ´»é ˜(lÇng)域自脯,其特點(diÇŽn)是自然開(kÄi)放之景,隨時(shÃ)隨地工作,給我們輕æ¾ä¾¿åˆ©çš„å饋和信æ¯æ”¯æŒè†æ½®ã€‚
語(yÇ”)音是一個(gè)很開(kÄi)放的æ±è¥¿é”»ç‹—,在機(jÄ«)器å°(duì)話ä¸ï¼Œæˆ‘們希望機(jÄ«)器人ä¸åƒ…僅是èœå–®å¼çš„é¸æ“‡ç„•å‚ï¼Œè€Œæ˜¯èƒ½å¤ çµ(jié)åˆä¸Šä¸‹æ–‡é€²(jìn)è¡Œç†è§£è½»çºªï¼Œç„¶åŽåšå‡ºæœ‰æ•ˆçš„回應(yÄ«ng),這也是語(yÇ”)音技術(shù)的一個(gè)難點(diÇŽn)å 纷。在生活ä¸åˆ»å¸šï¼Œèªž(yÇ”)音å¯ä»¥è§£æ”¾æˆ‘們的雙眼和雙手,把「智能ã€æ”¾åˆ°å¹•åŽæ¶©åš£ï¼Œä¸å†è®“「智能ã€æˆç‚ºç”Ÿæ´»çš„è² (fù)æ“”(dÄn)崇众,而是隱è—在背åŽçš„,稱è·çš„助手航厚。
å°(duì)于家里的è€äººå’Œå°å©ä¾†(lái)說(shuÅ)é¡·æŒï¼Œä»–們ä¸å®¹æ˜“掌æ¡æœ€é…·ç‚«çš„技術(shù),也常常ä¸å–œæ¡åŽ»æ“作功能復(fù)雜的智能家電幔ç¬ã€‚我們能ä¸èƒ½ç‚ºä»–們åšäº›ä»€ä¹ˆå‘¢çœ¯æ¼©ï¼Ÿèªž(yÇ”)音技術(shù)是一個(gè)天然的ã€ä½Žå¸(xué)ç¿’(xÃ)æˆæœ¬çš„交互方å¼éº»é¡¶ï¼Œéš¨è‘—語(yÇ”)音交互技術(shù)çš„æˆç†Ÿèµ¦æŠ–,我們讓這些人群更好地享å—智能è¨(shè)備帶來(lái)的便æ·ã€‚
所以辅肾,一個(gè)語(yÇ”)音助手队è¤ï¼Œå®ƒæ‡‰(yÄ«ng)該åšåˆ°çš„是自然而然,隨時(shÃ)隨地宛瞄。隨著技術(shù)臻于æˆç†Ÿå’Œç²¾è‡´æµ®ç¦¾ï¼Œè®“它å¸(xué)è‘—ç†è§£æˆ‘們既有的語(yÇ”)言習(xÃ)慣,ä¸éœ€è¦æˆ‘們懂它份汗。這樣,「智能ã€æ‰èƒ½çœŸæ£çš„深入到人們的生活è´ç°‡ï¼Œè€Œä¸æ˜¯è®“人「眼å‰ä¸€äº®ã€çš„技術(shù)æ¯æ´»ã€‚

功耗更低ã€é«”ç©æ›´å°ç†¬è¯ã€æˆæœ¬æ›´å°‘的智能麥克風(fÄ“ng)
為了é©æ‡‰(yÄ«ng)智能交互的è¦æ±‚æ—钧,我們希望語(yÇ”)音系統(tÇ’ng)å¯ä»¥ 24 å°æ™‚(shÃ)全天候工作å¸é‡ï¼Œä½ å¯ä»¥éš¨æ™‚(shÃ)給它一個(gè)ä¿¡æ¯ï¼Œè®“它喚醒一個(gè)è¨(shè)å‚™æªä»Šï¼Œç„¶åŽè®“它去è˜(shÃ)別嚎幸,這樣æ‰é©åˆæˆ‘們生活的狀態(tà i),但是這樣åšåŠŸè€—太大寄猩。
為了解決這些å•(wèn)é¡Œå«‰æ™¶ï¼Œæˆ‘å€‘å˜—è©¦è‘—å…ˆäºŽå¸‚å ´(chÇŽng)é‚出一å°æ¥ï¼Œé–‹(kÄi)發(fÄ)了一款智能麥克風(fÄ“ng)田篇。這款智能麥克風(fÄ“ng)把語(yÇ”)音喚醒功能集æˆåœ¨ä¸€å¡ŠèŠ¯ç‰‡ä¸Šæ›¿åºŸï¼Œå…許麥克風(fÄ“ng)外的整機(jÄ«)è™•äºŽä¼‘çœ ç‹€æ…‹(tà i),從而節(jié)çœé›»é‡çš„消耗泊柬。當(dÄng)用戶開(kÄi)啟語(yÇ”)音助手的時(shÃ)候椎镣,麥克風(fÄ“ng)會(huì)發(fÄ)出一個(gè)信號(hà o),喚醒需è¦é–‹(kÄi)啟的模塊兽èµã€‚這款智能麥克風(fÄ“ng)最低å¯ä»¥åšåˆ°ä½ŽäºŽ 100 微瓦安的éœæ…‹(tà i)功率状ç”,å¯ä»¥å®Œæˆæ¯«ç§’ç´š(jÃ)的觸發(fÄ)å‹•(dòng)作,真æ£åœ°è®“用戶擺脫了å°(duì)功耗的顧慮刀崖。

除了功耗之外惊科,我們還希望它的體ç©è¶³å¤ å°ï¼Œæˆæœ¬è¶³å¤ 低蒲跨,并å¯ä»¥é©ç”¨äºŽä¸åŒé¡žåž‹è¯‘æ–,ä¸åŒæ‡‰(yÄ«ng)ç”¨å ´(chÇŽng)景的è¨(shè)備。
我們開(kÄi)發(fÄ)了 Analog AVD 技術(shù)或悲,用以å€(qÅ«)分人è²èˆ‡ç’°(huán)境噪è²å™å’ªï¼Œé¿å…在嘈雜的環(huán)境下長(zhÇŽng)時(shÃ)間的處于喚醒狀態(tà i)。我們引入了å°é«”ç©å·¡è¯ã€ä½Žä¸»é »ç¿Žè¹ˆã€ä½ŽåŠŸè€—çš„é—œ(guÄn)éµå—è˜(shÃ)別單元,為更多的智能è¨(shè)å‚™æ供低門檻的語(yÇ”)éŸ³æŽ§åˆ¶æ–¹æ¡ˆç”·å…¬ã€‚æˆ‘å€‘åŠ å…¥äº†å£“é›»éº¥å…‹é¢¨(fÄ“ng)çš„ wake on sound 功能æ£æŽï¼Œå¯¦(shÃ)ç¾(xià n)了接近零功耗的éœæ…‹(tà i)模å¼çƒ˜è‹¹ã€‚借助立體å°è£æŠ€è¡“(shù),我們把這些功能å°è£äºŽæ•¸(shù)個(gè)毫米的極致空間之內(nèi)。
語(yÇ”)音產(chÇŽn)å“è¦çµ(jié)åˆä¸åŒçš„應(yÄ«ng)ç”¨å ´(chÇŽng)景和需求
防水與防塵已經(jÄ«ng)é€æ¼¸æˆç‚ºä¸»æµæ‰‹æ©Ÿ(jÄ«)的標(biÄo)準(zhÇ”n)é…置〔⊥î ç¾(xià n)有的雙層çµ(jié)構(gòu)çš„é›»å®¹å¼ MEMS 麥克風(fÄ“ng),當(dÄng)水或者顆粒物進(jìn)入振膜和背極之間的間隙鞋邑,會(huì)引起致命的失效èšè™šã€‚ç›®å‰ä¸»æµçš„手機(jÄ«),比如 iPhone7 或者三星 S7速梗,å‡é€šéŽ(guò)一層防水膜å±è”½ç•°ç‰©çš„侵入肮塞,但僅僅用于防范æ£å¸¸ä½¿ç”¨ä¸çš„æ„外進(jìn)水襟齿,并ä¸èƒ½è®“用戶自由地在有水或者沙塵環(huán)境下使用,也并ä¸æ供進(jìn)æ°´çš„ä¿ä¿®æž•èµµã€‚ç‘žè²é–‹(kÄi)發(fÄ)çš„ MEMS 壓電麥克風(fÄ“ng)則是一個(gè)單層膜çµ(jié)構(gòu)猜欺,å³ä½¿æœ‰å°‘é‡çš„水或顆粒物進(jìn)入,å°(duì)性能也幾乎ä¸ç”¢(chÇŽn)生影響拷窜。這實(shÃ)ç¾(xià n)了由é¿å…侵入到ä¸æ‡¼ä¾µå…¥çš„跨越开皿。
隨著語(yÇ”)音交互技術(shù)çš„ä¸æ–·é€²(jìn)æ¥å’Œæå‡ï¼ŒéŸ³é »ç¡¬ä»¶å’Œç®—法装黑ã€æ‡‰(yÄ«ng)用端å„自為戰(zhà n)的情形顯然是難以應(yÄ«ng)å°(duì)å¸‚å ´(chÇŽng)的需è¦çš„副瀑。在這里,一方é¢æ‹è°ï¼Œæˆ‘希望能給大家?guÄ«)î†?lái)一些è²å¸(xué)器件方é¢çš„è¦–è§’ç³ ç¡ï¼Œæ›´é‡è¦çš„,也希望我們能在彼æ¤äº¤æµä¸ç–šé¢Šï¼Œç¢°æ’žå‡ºä¸€äº›æ–°çš„ç«èŠ±ç‹ˆå”。
ç¾(xià n)å ´(chÇŽng)觀眾æå•(wèn)
æå•(wèn):我想å•(wèn)一下,把 AVD 放在 ADC 之å‰æ义,目å‰é€™å€‹(gè) AVD 是åšåˆ°ä»€ä¹ˆæ¨£çš„æ°´å¹³å‡æŠ½ï¼Ÿå®ƒèƒ½å¤ è˜(shÃ)別關(guÄn)éµè©žï¼Œé‚„是åªèƒ½è˜(shÃ)別噪音其掂? 它的記憶原ç†æ˜¯ä»€ä¹ˆæ²¹æŒ¥ï¼Ÿ
張金宇:它能è˜(shÃ)別一個(gè)ç©©(wÄ›n)定的噪è²å’Œä¸€å€‹(gè)çªç™¼(fÄ)çš„è²éŸ³ã€‚å¦å¤–款熬,它è˜(shÃ)別人è²å’Œå…¶ä»–的噪è²çš„æˆåŠŸçŽ‡å¾ˆé«˜æ·±å¯¥ï¼Œæ¯”如按喇åçš„è²éŸ³ï¼Œå’Œäººçªç„¶å°(duì)它說(shuÅ)話的è²éŸ³è´¤ç‰›ã€‚但是關(guÄn)éµå—的話 AVD 是åšä¸åˆ°çš„惋鹅。
它的記憶ä¸åƒ…åƒ…æ˜¯é »èœï¼Œé€™æ˜¯ä¸€å€‹(gè)比較長(zhÇŽng)的技術(shù)發(fÄ)展éŽ(guò)程殉簸。最åˆå®ƒæ˜¯åœ¨æ•¸(shù)å—端來(lái)實(shÃ)ç¾(xià n)的闰集,一個(gè)比較復(fù)雜的算法,ä¸æ–·æ”¶é›†ä¸æ–‡çš„般å‘,英文的æ¦é²ï¼Œå®ƒä¸€äº›ç™¼(fÄ)音的特點(diÇŽn)ç©ç´¯ä¸‹ä¾†(lái)å½¢æˆä¸€å€‹(gè)算法,一個(gè)經(jÄ«ng)é©—(yà n)庫(kù)è 检,然åŽé€æ¼¸æŠŠå®ƒç°¡(jiÇŽn)化洞å‘,å¯ä»¥åœ¨ä¸€å€‹(gè)很低的功耗下來(lái)實(shÃ)ç¾(xià n)。
æå•(wèn):我們用怎樣客觀的方å¼åŽ»æ¸¬(cè)試麥克風(fÄ“ng)陣列處ç†ä¹‹åŽçš„çµ(jié)æžœè‡çŽ‡ï¼Ÿ
張金宇:這應(yÄ«ng)該是å–æ±ºäºŽä½ å…·é«”é©ç”¨çš„目的迟æ‚,å–決于具體的功能。
æå•(wèn):瑞è²çš„麥克風(fÄ“ng)的有開(kÄi)é—œ(guÄn)功能本慕,這個(gè)é–‹(kÄi)é—œ(guÄn)çš„é™å®šæ˜¯è¨(shè)定在什么ä½ç½®æ¯”較åˆé©æŽ’拷?
張金宇:ç¾(xià n)在有兩種模å¼ï¼Œä¸€ç¨®æ˜¯è‡ªèº«ç”¨çš„模å¼é”…尘,它é 它的芯片來(lái)判斷监氢,比如在地éµé‡Œå®ƒæœƒ(huì)自動(dòng)調(dià o)高,在會(huì)å ´(chÇŽng)上會(huì)é™ä½Žè—¤è¿ï¼Œåœ¨å®¶é‡Œæœƒ(huì)é™å¾—更低浪è…。å¦å¤–,它也å¯ä»¥æ˜¯é€šéŽ(guò)上ä½æ©Ÿ(jÄ«)顿乒,比如手機(jÄ«)çš„ AP(應(yÄ«ng)用處ç†å™¨ï¼‰è®®è¡—,或者是智能家居的 MCU 來(lái)控制。
åŽè¨˜ï¼š
在峰會(huì)åŽçš„講師晚é¤ä¸ç’§æ¦„,我們和金宇èŠåˆ°äº†æ™ºèƒ½éº¥å…‹é¢¨(fÄ“ng)的應(yÄ«ng)ç”¨å ´(chÇŽng)景特漩,智能手機(jÄ«)ã€æ™ºèƒ½å®¶å±…骨æ‚ã€ä»¥åŠç¾(xià n)在銷é‡å·²ç¶“(jÄ«ng)超éŽ(guò) Apple Watch çš„ AirPod 智能耳機(jÄ«)涂身。我們能看到語(yÇ”)音智能èŠå¤©æ‰‹æ©Ÿ(jÄ«)未來(lái)å¯è§€çš„終端增長(zhÇŽng)數(shù)é‡ï¼Œä¹Ÿçœ‹åˆ°äº†è„«é›¢æ‰‹æ©Ÿ(jÄ«)的語(yÇ”)音喚醒的智能耳機(jÄ«)æ“蚪,å°(duì)于麥克風(fÄ“ng)ç‰ç¡¬ä»¶çš„挑戰(zhà n)蛤售。比如關(guÄn)éµå—è˜(shÃ)別需è¦çš„模塊略大,如果僅僅是 VAD 功能的妒æ½ï¼Œå¤§ç´„在 3.x mm * 2.x mm悴能,如果需è¦é—œ(guÄn)éµå—觸發(fÄ)ï¼Œå°±éœ€è¦ 4.x * 3mmæœè€™ã€‚å¦å¤–用ä¸åŒ IC å·¥è—節(jié)點(diÇŽn)å¯ä»¥ç¸®æ¸›å°ºå¯¸æœéª¡ï¼Œä½†æ˜¯æˆæœ¬æ高åŠæ¯”較多了。
æˆ‘å€‘æœŸå¾…ä¸Šæ¸¸å» å•†åœ¨ç¡¬ä»¶æŠ€è¡“(shù)ç ”ç™¼(fÄ)上的çªç ´ä½‘女,為下游應(yÄ«ng)ç”¨å» å•†å¸¶ä¾†(lái)çš„è±å¯Œå ´(chÇŽng)景應(yÄ«ng)用機(jÄ«)會(huì)è®°é¡ã€‚