售價 2999 元且改,支持 34 種語言验烧,帶屏幕的訊飛翻譯機 2.0 能繼續(xù)領(lǐng)航翻譯機市場嗎?
篤信語音交互將成為主流各谚,訊飛向 80 萬開發(fā)者展示了升級后的 AI 和 IoT 能力
向現(xiàn)場 2000 位開發(fā)者例行能力秀:老樣子紧憾,訊飛各項工作做的都挺好。
很長一段時間赴穗,訊飛的盈利問題都遭到業(yè)界的質(zhì)疑。但昨晚膀息,在訊飛開放平臺的「AI·飛無界」新品發(fā)布會上般眉,科大訊飛執(zhí)行總裁胡郁給出了解釋:
訊飛每年在開發(fā)者平臺和核心技術(shù)上的投入是上億級的,2017 年訊飛的技術(shù)投入占總營收比重高達(dá) 61.61%潜支,技術(shù)開發(fā)團隊的人數(shù)增長率則高達(dá) 56.04%甸赃,均大幅度高于 2016 年。
作為一家老牌技術(shù)企業(yè)毁腿,科大訊飛善于源頭技術(shù)的系統(tǒng)創(chuàng)新辑奈,但是在產(chǎn)品和應(yīng)用方面的創(chuàng)新苛茂,單靠訊飛自身的力量是做不到的。訊飛在開發(fā)者平臺商不惜代價的投入巨大的財力物力人力鸠窗,就是希望不斷降低創(chuàng)新門檻妓羊,與開發(fā)者共同推動語音交互技術(shù)的應(yīng)用創(chuàng)新。
老樣子稍计,首先回顧 AIUI 的發(fā)展歷程以及取得的成績躁绸,這些更新的數(shù)據(jù)了解一下
在還沒有 Echo 和 Alexa 的 2010 年,訊飛發(fā)布了首個中文語音開發(fā)者平臺臣嚣。2015 年净刮,訊飛發(fā)布了 AIUI,提出了人機交互的新場景和新理念硅则。歷經(jīng)三年發(fā)展淹父,平臺注冊開發(fā)者已經(jīng)達(dá)到 80 萬。
科大訊飛消費者事業(yè)群執(zhí)行總裁于繼棟首先對 AIUI 平臺商的開發(fā)者進行了分析怎虫,發(fā)現(xiàn)了一些有意思的現(xiàn)象:2017 年暑认,伴隨著 AI 的發(fā)展,平臺開發(fā)者數(shù)量增長了 30 萬大审;移動終端的開發(fā)者快速增長蘸际,而代表了辦公場景的 Windows 開發(fā)者和代表了智能硬件的 Linux 開發(fā)者都獲得了快速增長,此外還有微信小程序的 API 開發(fā)者和 Java 小程序開發(fā)者徒扶,這些都是 AI 落地的表現(xiàn)粮彤。
過去一年,訊飛也努力的推動著技術(shù)走進人們的生活姜骡。從訊飛輸入法的數(shù)據(jù)分析來看导坟,語音輸入作為一個應(yīng)用,活躍度已經(jīng)可以躍進手機 TOP 10 應(yīng)用圈澈。用戶每天通過訊飛開放平臺與設(shè)備的交互次數(shù)達(dá)到 45 億次乍迄,其中智能音箱的日活達(dá)到 4000 萬次,車機的語音交互活躍度超過 90%士败。
而在 AI 硬件設(shè)備商的成績闯两,則包括訊飛 AI 翻譯機 2.0、與中國移動聯(lián)合發(fā)布的咪咕語音助手谅将、與金山居合作推出游戲手辦漾狼、阿爾法蛋系列兒童陪伴機器人、與美團合作推出的騎手智能耳機饥臂、與美的合作的無葉風(fēng)扇逊躁、與京東合作的支持視覺交互叮咚 PLAY 智能音箱、與紅星美凱龍合作的智能導(dǎo)購機器人隅熙、與快思聰合作的智能家居方案稽煤,等等核芽。
加大對智能家居場景的滲透酵熙,升級后的魔飛 2.0轧简,解決了多設(shè)備同時被喚醒的尷尬
魔飛(MORFEI)是一款成品級的硬件開發(fā)平臺。在去年發(fā)布的雙環(huán)八麥智能麥克風(fēng)的基礎(chǔ)上匾二,訊飛發(fā)布了升級版的「魔飛 2.0」哮独。超越了固定的硬件形態(tài)的局限,「軟核化」升級后的魔飛可以安裝在各類硬件設(shè)備中察藐。同時皮璧,融合了 AIUI 的云函數(shù)能力,使開發(fā)者可以在云端直接編寫業(yè)務(wù)邏輯分飞,實現(xiàn)在一個小時之內(nèi)完成業(yè)務(wù)場景的搭建悴务,進一步壓縮開發(fā)周期。
魔飛的產(chǎn)品經(jīng)理涂康宏特別強調(diào)了魔飛 2.0 的兩點創(chuàng)新:
擁有分布式能力譬猫。過去惨寿,當(dāng)用戶對多臺設(shè)備進行喚醒時,命令執(zhí)行會引發(fā)多臺設(shè)備同時被喚醒的尷尬局面删窒;現(xiàn)在种樱,多臺設(shè)備在同一個局域網(wǎng)限番、同一個賬戶號下,當(dāng)用戶喊出「魔飛魔飛」喚醒詞時蛀蜜,所有在局域網(wǎng)內(nèi)的設(shè)備進行喚醒分值計算特碳,離用戶最近的那一臺設(shè)備會優(yōu)先響應(yīng)用戶喚醒诚亚。
擁有能量跟隨能力。過去午乓,當(dāng)設(shè)備被喚醒之后站宗,麥克風(fēng)陣列會根據(jù)聲源的位置指定一個固定的波束方向,除非用戶再次喚醒設(shè)備益愈,否則波束方向不會改變梢灭;現(xiàn)在,波束可以根據(jù)用戶的位置和聲源地移動蒸其,動態(tài)的調(diào)整播出方向敏释,從而給用戶帶來更自然的交互體驗,也給開發(fā)者帶來更多的想象空間摸袁。
此外钥顽,魔飛還開放了包括音頻降噪接口、文本轉(zhuǎn)寫接口靠汁、合成播報接口在內(nèi)的全鏈路接口蜂大,實現(xiàn)了聲紋喚醒能力闽铐,開發(fā)者可以通過聲紋接口獲取到用戶的身份信息,并給予用戶個性化推薦奶浦。
強調(diào)精品技能開發(fā)兄墅,升級后的 AIUI 3.0 完善了技能開發(fā)工具和平臺能力
AIUI 3.0 集成了語音喚醒、語音識別财喳、語義理解察迟、語音合成、IoT 等核心技術(shù)耳高,優(yōu)化了技能平臺扎瓶,并整合了硬件、SDK泌枪、WebAPI概荷、芯片、小程序等接入平臺碌燕,構(gòu)成了一張豐富的系統(tǒng)架構(gòu)全景圖误证。
訊飛也例行的公布了技能和內(nèi)容平臺的應(yīng)用數(shù)量:120+ 技能和 60+ 內(nèi)容,但更加強調(diào)了打造高活躍的精品技能的重要性修壕。優(yōu)質(zhì)內(nèi)容提供商「工程師爸爸」和「豆果美食」被特別的點名愈捅。
為了讓開發(fā)者能夠更加高效的開發(fā)出個性化的技能,訊飛的技能平臺為開發(fā)者提供了自定義問答工具慈鸠、自定義技能工具蓝谨,以及云函數(shù)即云端編程的能力、和半監(jiān)督優(yōu)化能力青团。這個頗有創(chuàng)新性的「半監(jiān)督優(yōu)化能力」譬巫,通俗的來講,就是通過系統(tǒng)分析人機交互日志督笆,了解各種熱門說法并推薦給開發(fā)者芦昔,并提供多種響應(yīng)方式的建議,從而幫助開發(fā)者更加高效的捕獲用戶需求和優(yōu)化技能體驗娃肿。
AIUI 3.0 在不斷的豐富著設(shè)備的接入方式咕缎,即便是不智能的嵌入式設(shè)備,只要具有 Wi-Fi 能力料扰,就可以低成本快速的接入 AIUI 的語音能力锨阿。
現(xiàn)場,訊飛還舉辦了一場語音技能開發(fā)的挑戰(zhàn)记罚,有 4 位開發(fā)者僅用了很短的時間墅诡,就完成了一項技能的開發(fā),并通過現(xiàn)場配置好的魔飛麥克風(fēng),進行了技能演示和驗證末早。這里不一一舉例烟馅。
發(fā)布智能物聯(lián)云 AIoT,旨在實現(xiàn) 20 億智能硬件的互聯(lián)互通
2018 年然磷,硬件終端規(guī)模已近 20 億郑趁,其中,非手機類的智能終端比例姿搜,已經(jīng)從 1% 提高到了 7.6%寡润,智能硬件市場正在崛起。過去 18 個月舅柜,訊飛已經(jīng)接入了近 1.5 億智能硬件終端設(shè)備梭纹,在安防、智能家居致份、智能辦公变抽、機器人、智能穿戴等領(lǐng)域的合作伙伴數(shù)量都在快速增長氮块。
新發(fā)布的智能物聯(lián)云 AIoT 不僅可以實現(xiàn)訊飛自家設(shè)備互聯(lián)互通绍载,還可以實現(xiàn)自家設(shè)備和其他設(shè)備的互聯(lián)互通,并且還能兼容第三方物聯(lián)網(wǎng)滔蝉。
智能物聯(lián)云 AIoT 有兩大能力:提供開放击儡、聚合、智能的云服務(wù)平臺蝠引;支持設(shè)備在本地的霧計算(邊緣計算)阳谍。這些能力被整合到 PaaS 級的開發(fā)平臺里,為開發(fā)者提供 AI 接口和開放設(shè)備連接立肘,讓開發(fā)者可以定制開發(fā),自由創(chuàng)造個性化的智能場景名扛。
現(xiàn)場谅年,訊飛的團隊也為大家展示了設(shè)備互聯(lián)互通和多模態(tài)人機交互的能力。
發(fā)布操作系統(tǒng) iFLYOS肮韧,整合技術(shù)和內(nèi)容融蹂,免費提供系統(tǒng)級解決方案
最后一項發(fā)布是 iFLYOS,一種更輕量的智能硬件接入方式弄企,一種系統(tǒng)級的語音交互解決方案超燃。
iFLYOS 不僅整合了訊飛語音喚醒、語音識別拘领、語音合成意乓、語義理解這四大基礎(chǔ)技術(shù)能力并免費開放給開發(fā)者,并且约素,還整合了 1300 萬首咪咕高清音樂届良、20 萬部訊飛閱讀有聲內(nèi)容笆凌、以及 3 萬部院線大片。
為了更好的助力開發(fā)者士葫,iFLYOS 還提供了 API 開放接口乞而、開源了端代碼、并且兼容亞馬遜 AVS 可以讓亞馬遜設(shè)備快速接入訊飛慢显。
篤信基于視覺呈現(xiàn)的語音交互將成為主流交互方式
胡郁的新品發(fā)布后爪模,不僅強調(diào)了科大訊飛在技術(shù)上的策略投入,還和觀眾探討了未來的人機交互方式荚藻。
統(tǒng)計表明屋灌,90% 信息輸出依靠語音,80% 信息輸入依靠視覺鞋喇∩模基于視覺呈現(xiàn)的語音交互,是否能成為觸摸交互之后侦香,最主要的交互方式落塑?胡郁給出的答案是堅定的。未來罐韩,將會有更多的帶有視覺呈現(xiàn)的語音交互場景憾赁,如跑步等移動場景下,人們佩戴耳機的無視覺呈現(xiàn)的語音交互散吵;在車載環(huán)境下龙考,對著后視鏡的弱視覺呈現(xiàn)的語音交互;還有在家庭環(huán)境下矾睦,在電視晦款、投影等屏幕前的強視覺呈現(xiàn)的語音交互等等。
擁抱軟硬件開發(fā)者的姿態(tài)
自去年 1024 開發(fā)者節(jié)后枚冗,訊飛不斷的擴大著開發(fā)者的受眾范圍缓溅,并細(xì)化著他們的畫像。訊飛將開發(fā)者分為 5 類:能力開發(fā)者赁温、方案開發(fā)者坛怪、產(chǎn)品開發(fā)者、技能開發(fā)者股囊、內(nèi)容開發(fā)者袜匿,并預(yù)測今年將突破 100 萬訊飛開放平臺的注冊開發(fā)者。
在會后的采訪環(huán)節(jié)稚疹,當(dāng)深圳灣問起常常出差來深圳的于繼棟居灯,如何描繪深圳的開發(fā)者時,他說,深圳是一個充滿創(chuàng)新的地方穆壕。深圳是北京之外開發(fā)者最多的城市待牵,但相比北京的開發(fā)者,深圳的開發(fā)者的兼容性略顯不足喇勋。
基于這兩年對語音智能生態(tài)的觀察缨该,我們發(fā)現(xiàn),具有技術(shù)能力的軟硬件開發(fā)者和方案商川背、終端設(shè)備的開發(fā)者贰拿、以及具有軟件開發(fā)和內(nèi)容整合能力的應(yīng)用開發(fā)者,都被或正在被卷入到語音智能這個大生態(tài)熄云。而在各大巨頭和實力派系都在競相搭平臺「秀肌肉」的時候膨更,開發(fā)者的活躍度也超過了以往任何時候。應(yīng)該以怎樣的姿態(tài)擁抱開發(fā)者缴允,則是這些大平臺長遠(yuǎn)的課題荚守。(主筆:陳壹零 / 深圳灣;圖源:科大訊飛)