科大訊飛開放平臺產(chǎn)品總監(jiān)王磊:聲音的力量岁歉,語音交互在虛擬現(xiàn)實(shí)中的應(yīng)用
科大訊飛山哥教你玩轉(zhuǎn)人工智能丨山哥下午茶回顧
不論 2016 年是否為人工智能爆發(fā)的元年,今年人工智能領(lǐng)域所取得的巨大成績是不能否認(rèn)的治专,同時(shí)也讓「人工智能」卖陵、「神經(jīng)網(wǎng)絡(luò)」這些原本只存在于故紙堆的學(xué)術(shù)概念走進(jìn)了每個(gè)尋常百姓家中。
不論 2016 年是否為人工智能爆發(fā)的元年张峰,今年人工智能領(lǐng)域所取得的巨大成績是不能否認(rèn)的泪蔫,同時(shí)也讓「人工智能」、「神經(jīng)網(wǎng)絡(luò)」這些原本只存在于故紙堆的學(xué)術(shù)概念走進(jìn)了每個(gè)尋常百姓家中喘批。
12 月 23 日撩荣,2016 年的末尾,2017 年的前夜饶深,是一個(gè)適合總結(jié)過去和展望未來的日子餐曹,訊飛開放平臺智能硬件業(yè)務(wù)總監(jiān)張陳、訊飛開放平臺合作伙伴總監(jiān)陳其山敌厘,以及來自深圳本地狗尾草科技技術(shù)總監(jiān)王昊奮來到「山哥下午茶」活動現(xiàn)場台猴,與在場的開發(fā)者探討訊飛開放平臺的發(fā)展與未來合作展望。訊飛開放平臺作為全球首個(gè)開放的智能交互技術(shù)服務(wù)平臺俱两,致力于為開發(fā)者打造一站式智能人機(jī)交互解決方案饱狂。
主持人炫姐姐在開場介紹說:「一個(gè)月前, 以『 AI+ 』即『 人工智能+創(chuàng)造美好世界』為主題的科大訊飛 2016 年度發(fā)布會在北京國家會議中心隆重舉行锋华。本次會議上嗡官,科大訊飛推出基于『 訊飛超腦』 的七大新品,包括萬物互聯(lián)輸入法毯焕、智能車載系統(tǒng) —— 飛魚助理衍腥、中英互譯神器 —— 曉譯翻譯機(jī)、智能客服機(jī)器人 —— 曉曼纳猫、以超腦魔盒為基礎(chǔ)的智能家居系統(tǒng)等 婆咸。今天,科大訊飛開放平臺系列技術(shù)活動『山哥下午茶』第一次走進(jìn)『深圳灣』芜辕,與在座的各位人工智能尚骄、機(jī)器人、智慧終端等領(lǐng)域的專業(yè)人士侵续,共話語音產(chǎn)業(yè)倔丈,解答技術(shù)疑難憨闰。」
信息爆炸的人工智能時(shí)代需五,語音和視覺才是最適的人機(jī)交互方式
從 PC 時(shí)代到移動時(shí)代鹉动,信息量不斷增加,而到了未來的智能時(shí)代宏邮,信息呈爆發(fā)性增加泽示,原有的通過鼠標(biāo)、鍵盤蜜氨、觸屏的人機(jī)交互方式遠(yuǎn)不能滿足人們需求械筛。如果說 PC 時(shí)代是通過一條「縫隙 」獲取外部信息,移動時(shí)代是通過一個(gè)「面」來獲得信息飒炎,那么智能時(shí)代的人類就處在一個(gè)全方位被信息包裹的環(huán)境中埋哟。
張陳認(rèn)為:「在智能時(shí)代,語音厌丑、視覺定欧、手勢才是最自然最合適的人機(jī)交互方式∨停」所以砍鸠,科大訊飛以語音交互為主,未來會結(jié)合視覺處理和手勢識別耕驰,目前已推出業(yè)界首個(gè)人工智能交互界面 —— AIUI爷辱。「AIUI 集成了遠(yuǎn)場降噪朦肘、方言識別饭弓、全雙工持續(xù)對話、多輪對話媒抠、上下文修正弟断、自然語音合成等技術(shù)」張陳說。
訊飛開放平臺智能硬件業(yè)務(wù)總監(jiān)張陳
除了優(yōu)化人與智能機(jī)器的交互趴生,在未來萬物互聯(lián)的人工智能時(shí)代的背景下阀趴,AI 的現(xiàn)實(shí)意義是輔助決策,把人們從重復(fù)性的勞動中解放出來苍匆。在 2014 年刘急,訊飛啟動了一個(gè)人工智能項(xiàng)目——訊飛超腦,它是訊飛以語音為切入口浸踩、從感知智能到認(rèn)知智能的人工智能革命的一大推進(jìn)叔汁,目前該項(xiàng)目已經(jīng)成功運(yùn)用于教育領(lǐng)域中。
那它是如何工作的呢?張陳說:「我們把考試題庫輸入系統(tǒng)据块,訊飛超腦通過一段時(shí)間的自我學(xué)習(xí)后码邻,就能解出題目」迮ィ」另外冒滩,張陳表示:「我們的目標(biāo)是在不久的將來,讓這臺機(jī)器考上清華北大浪谴。」
訊飛開放平臺的理念是與開發(fā)者共同成長
作為中國最大的智能語音技術(shù)提供商因苹,科大訊飛推出了全球首個(gè)移動互聯(lián)網(wǎng)智能交互平臺 —— 訊飛開放平臺苟耻。訊飛開放平臺合作伙伴總監(jiān)陳其山說:「從 10 年開放語音聽寫開始,我們持續(xù)開放了語音合成扶檐、命令識別凶杖、個(gè)性化聽寫等服務(wù)。15 年款筑,隨著智能硬件行業(yè)的興起智蝠,我們也陸續(xù)開放了面向智能硬件方向的遠(yuǎn)場交互方案,如麥克風(fēng)陣列奈梳、用戶級喚醒杈湾、AIUI 等服務(wù)。訊飛開放平臺秉持著開放共贏的理念攘须,持續(xù)為開發(fā)者提供最好的服務(wù)漆撞,目前已經(jīng)覆蓋 17 萬合作應(yīng)用和 8.9 億終端∮谥妫」
訊飛開放平臺的發(fā)展歷程
陳其山從技術(shù)的角度對訊飛開放平臺的功能接入做了詳細(xì)介紹和案例分析浮驳,他說,訊飛曾與一款叫做「心聲」的產(chǎn)品合作捞魁,這款 App 可以幫助聾人更好地傾聽別人說的話至会。在與「心聲」合作的過程中,訊飛提供的語音技術(shù)將語音轉(zhuǎn)換為文字谱俭,幫助聾人更好地溝通奉件。同時(shí),訊飛還與「心聲」團(tuán)隊(duì)共同探討商業(yè)模式旺上,并且推薦參加各種商業(yè)競賽瓶蚂,讓「心聲」更好地服務(wù)社會。陳其山表示:「訊飛秉持著與開發(fā)者共同成長的理念宣吱,全維度地服務(wù)開發(fā)者窃这。」
訊飛開放平臺合作伙伴總監(jiān)陳其山
那么作為一個(gè)開發(fā)者,應(yīng)該如何借力訊飛開放平臺的資源打造產(chǎn)品呢杭攻?陳其山表示祟敛,開發(fā)者至少要搞清楚兩個(gè)問題:一是產(chǎn)品的應(yīng)用場景和人群定位,應(yīng)對不同的人群和場景兆解,產(chǎn)品就需要有不同的功能馆铁。第二,訊飛的技術(shù)要解決什么問題锅睛,如何通過訊飛的技術(shù)解決目標(biāo)用戶的需求埠巨。
琥珀·虛顏 —— 一個(gè)虛擬生命的誕生
在今天的「下午茶」活動中,來賓除了訊飛的張陳和陳其山现拒,還有一位是深圳狗尾草科技公司技術(shù)總監(jiān)王昊奮辣垒。他認(rèn)為,對于一個(gè)專注產(chǎn)品和應(yīng)用的公司來說印蔬,人工智能的價(jià)值就在于創(chuàng)造一個(gè)虛擬的生命勋桶。所以,結(jié)合訊飛的語音技術(shù)侥猬,狗尾草科技創(chuàng)造出一個(gè)叫琥珀·虛顏的虛擬角色例驹。
琥珀·虛顏是一個(gè)用全息 3D 顯示器投射出來的二次元少女的動畫形象。按照王昊奮的說法退唠,琥珀·虛顏是 AI + VR 鹃锈、AI + IP、AI + Game 的結(jié)合铜邮,它有完整的人物背景故事仪召,本身可 360 度進(jìn)行投影,同時(shí)它可以擁有很多技能松蒜,做很多動作扔茅,用戶通過裸眼就能看到它生活的方方面面。同時(shí)秸苗,它是個(gè)虛擬的藝人召娜,著名組合羽泉會為它寫歌【ィ總之玖瘸, 琥珀·虛顏就是在一個(gè)硬件里的虛擬少女養(yǎng)成游戲。
狗尾草科技技術(shù)總監(jiān)王昊奮
飛躍時(shí)代檀咙,語見「AI+硬件」的未來
在「下午茶」間歇雅倒,主持人炫姐姐向科大訊飛的兩位來賓提問:「科大訊飛開放平臺的開發(fā)者主要分布于哪些領(lǐng)域?與開發(fā)者對接合作的過程中碰到過哪些困難弧可?」
針對第一個(gè)問題蔑匣,陳其山總結(jié):「目前,訊飛的語音技術(shù)在各個(gè)領(lǐng)域都有廣泛的應(yīng)用,包括教育裁良、醫(yī)療凿将、機(jī)器人、智能家居等价脾,因?yàn)槲覀兪且粋€(gè)平臺牧抵,面向全領(lǐng)域。不過侨把,以目前的情況來看犀变,訊飛的語音技術(shù)在智能硬件上結(jié)合點(diǎn)更多、結(jié)合的程度更深座硕,屬于比較典型應(yīng)用場景弛作。」
對于第二個(gè)問題华匾,張陳補(bǔ)充到:「語音技術(shù)發(fā)展至今,其實(shí)有很高的技術(shù)門檻机隙,所以有些開發(fā)者對語音技術(shù)的理解不太深入蜘拉。第二,訊飛只是提供技術(shù)支持有鹿,但對于開發(fā)者來講旭旭,對應(yīng)用的集成和上下游的整合,就是一個(gè)比較大的挑戰(zhàn)葱跋〕旨模」
茶歇期間,陳其山對開發(fā)者進(jìn)行技術(shù)講解
「山哥下午茶」現(xiàn)場展示的訊飛麥克風(fēng)陣列開發(fā)套件
張陳正在向開發(fā)者演示訊飛 AIUI 評估板
訊飛工作人員與開發(fā)者們探討技術(shù)和未來合作的可行性
「山哥下午茶」為與會者提供了豐富的茶點(diǎn)
「山哥下午茶」是科大訊飛開放平臺聯(lián)合硬件創(chuàng)業(yè)社區(qū)深圳灣(shenzhenware)共同打造的語音智能開發(fā)者交流活動娱俺,聚焦語音技術(shù)與人工智能創(chuàng)業(yè)稍味,聚集專家、技術(shù)達(dá)人荠卷、創(chuàng)業(yè)者模庐,通過技術(shù)分享、案例分析等方式油宜,以輕松的下午茶形式促進(jìn)行業(yè)技術(shù)交流掂碱,共話語音產(chǎn)業(yè),解答技術(shù)疑難慎冤。
我們堅(jiān)信疼燥,2017 年「AI+硬件」將呈現(xiàn)更加豐富的場景和更加智能的應(yīng)用,我們也將在 2017 年將更多更優(yōu)質(zhì)的技術(shù)交流活動呈現(xiàn)給大家蚁堤。