不怕寒冬飘言,主打便攜智能的 Rokid 家族新成員 Rokid.Pebble 有望走向大眾 | CES 2017
在這場(chǎng) 5000 多人參與的線上人工智能研討會(huì)背后擅耽,更多的是 Rokid 對(duì)市場(chǎng)戰(zhàn)略的思考
Rokid 期待能擁有屬于自己的一片領(lǐng)地,也正在努力著段磨。
去年 9 月份,人工智能初創(chuàng)企業(yè) Rokid 宣布完成 6500 萬(wàn)美元的 B 輪融資蝶溶,一躍成為市值 4.5 億的公司嗜历。緊接著,在今年年初抖所,Rokid 被福布斯當(dāng)選為全球 AI 公司里的 Top 50梨州。
近日,這家公司組織了內(nèi)部 5 位分別負(fù)責(zé)工業(yè)設(shè)計(jì)田轧、聲紋識(shí)別技術(shù)暴匠、人工智能、深度學(xué)習(xí)等方面的博士傻粘、專家在知乎開(kāi)展了一場(chǎng)線上 live每窖,吸引了超過(guò) 5000 人參與帮掉,據(jù)說(shuō)是有史以來(lái)由企業(yè)舉辦的 live 里參與人數(shù)最多的一場(chǎng)〉呵耄可以說(shuō)旭寿,這場(chǎng) live 不僅僅是為了公司、產(chǎn)品的宣傳崇败,還有的就是為公司招攬領(lǐng)域內(nèi)人才盅称。
Rokid 靠什么「討好」消費(fèi)者
從 2014 年成立以來(lái),Rokid 就致力于人工智能的研發(fā)后室,其打造的第一代人工智能產(chǎn)品 Rokid 憑借高透光度曲面外殼缩膝、DLP 投影、三星 8 核 CPU 的高性能配置岸霹,以及獨(dú)具「?jìng)€(gè)性」的語(yǔ)音助手贏得的了業(yè)界和極客們的關(guān)注疾层。
Rokid 第一代人工智能產(chǎn)品
新產(chǎn)品 Pebble 的外形設(shè)計(jì):繼續(xù)打破傳統(tǒng),將「用戶體驗(yàn)」擺在第一位
相比 Google Home贡避、亞馬遜 Echo 等偏日惩蠢瑁化的設(shè)計(jì),Rokid 則顯得激進(jìn)些刮吧,并將設(shè)計(jì)作為提升「用戶體驗(yàn)」的一項(xiàng)重點(diǎn)工程湖饱。
Rokid 打造的第二代產(chǎn)品——Pebble(月石)再一次打破了人們對(duì)這類產(chǎn)品的想象。Rokid 團(tuán)隊(duì)從單細(xì)胞生物上得到啟發(fā)杀捻,采用圓形井厌、曲線的設(shè)計(jì),將 Pebble 打造成一個(gè)石頭盆景般的外形致讥,使其能夠與家庭場(chǎng)景融為一體仅仆,更符合美觀的要求。
Rokid 打造的第二代產(chǎn)品——Pebble(月石)
而這也意味著他們將要克服更多技術(shù)上的困難垢袱,例如在物理上如何避免音頻受到干擾——據(jù)悉墓拜,同類的 Google Home,Echo 等之所以做成箱體形狀请契,正是為了將拾音結(jié)構(gòu)撮弧、音箱進(jìn)行一定距離的區(qū)隔(分別在頭尾兩端)。
Rokid 工業(yè)設(shè)計(jì)師姜公略表示姚糊,他們從始至終都是將「用戶體驗(yàn)」放在了第一位,包括其他同類產(chǎn)品所沒(méi)有電池設(shè)置授舟,使得產(chǎn)品能夠在戶外場(chǎng)景中使用救恨。
通過(guò)人機(jī)交互設(shè)計(jì)解決人機(jī)對(duì)話「開(kāi)口難」的問(wèn)題
姜公略進(jìn)一步表示,面對(duì)語(yǔ)音對(duì)話機(jī)器人释树,人們往往會(huì)出現(xiàn)「開(kāi)口難」的問(wèn)題肠槽,即不知道該如何與機(jī)器溝通擎淤。他解釋道,這是由人們不了解機(jī)器人的邊界秸仙、缺乏基于人機(jī)對(duì)話的經(jīng)驗(yàn)所造成嘴拢,這就像我們?cè)诟粋€(gè)嬰兒談話一樣,得了解嬰兒(機(jī)器)能夠?qū)υ挼姆懂牸偶停瑥闹蟹e累和嬰兒(機(jī)器)對(duì)話的能力席吴。
姜公略表示,可通過(guò)設(shè)計(jì)改變這一現(xiàn)狀捞蛋。目前孝冒,人機(jī)交互主要包括 GUI(Graphical User Interface,圖形用戶界面)拟杉、VUI(Voice User Interface庄涡,語(yǔ)音用戶界面)兩種模式。
其中搬设,GUI 具有直觀穴店、高效的特點(diǎn),用戶只需在電腦拿穴、手機(jī)等屏幕上獲取信息并直接點(diǎn)選泣洞。而 VUI 這種以語(yǔ)音交互進(jìn)行獲取信息的方式則存在「低效」的劣勢(shì),這是因?yàn)椋?b>GUI 與 VUI 存在維度上的差異:GUI 是二維獲取信息的方式贞言,VUI 只是一維斜棚,需要用戶從頭到尾聽(tīng)或講一遍信息,才能執(zhí)行下一步操作该窗。
Rokid 作為一款人機(jī)對(duì)話的產(chǎn)品弟蚀,自然會(huì)面臨這樣的問(wèn)題。姜公略解說(shuō)道酗失,基于大數(shù)據(jù)以及人工智能強(qiáng)大的算法能力义钉,VUI 能夠有很大的提升空間,為用戶過(guò)濾大量的選擇规肴,提高輸入捶闸、輸出信息的效率。例如拖刃,在執(zhí)行「餐廳推薦」任務(wù)時(shí)删壮,機(jī)器人能夠先將「日本菜」、「西餐」等選項(xiàng)供用戶選擇兑牡,首先篩掉一大部分信息央碟,接著給予更接近用戶意圖的選擇。當(dāng)然均函,機(jī)器人也可在一開(kāi)始時(shí)根據(jù)用戶以往習(xí)慣進(jìn)行推薦亿虽。
Rokid 就此基于人工智能算法的 VUI 設(shè)計(jì)菱涤,能夠降低人機(jī)交互的復(fù)雜程度,并提高效率洛勉。
Rokid 的打造并非是「將手機(jī)語(yǔ)音助手搬上音箱」這么簡(jiǎn)單
要讓機(jī)器人做到與用戶順暢交流粘秆,是人機(jī)語(yǔ)音交互面臨的一大難題。Rokid 的朱磊博士表示收毫,聽(tīng)到攻走、聽(tīng)懂、反饋是機(jī)器與人交流的三個(gè)關(guān)鍵牛哺。他強(qiáng)調(diào)陋气,Rokid 的打造并非是「將手機(jī)語(yǔ)音助手搬上音箱」這么簡(jiǎn)單,它在這三個(gè)環(huán)節(jié)都面臨著重大挑戰(zhàn):
首先引润,需要解決「聽(tīng)到」的問(wèn)題巩趁,也就是區(qū)分用戶是不是在跟機(jī)器說(shuō)話。通常的辦法是使用語(yǔ)音激活詞淳附,一般情況下议慰,許多同類產(chǎn)品包括 Google Home,Echo奴曙,微軟 cotana 均采用三音節(jié)詞别凹,目的在于降低誤激活率。為了迎合國(guó)內(nèi)稱呼二字人名的習(xí)慣洽糟,Rokid 最終選取了 Rokid(中文喚醒詞為「若琪」)這一二音節(jié)喚醒詞炉菲,克服大量技術(shù)難題,并前后花費(fèi)了一年多的時(shí)間才得以完成坤溃。
其次拍霜,要讓機(jī)器「聽(tīng)清楚」用戶的聲音,也就是遠(yuǎn)場(chǎng)拾音的技術(shù)難題薪介,包括麥克風(fēng)陣列下的波束祠饺、降噪、多麥克 VAD 等問(wèn)題汁政。朱博士表示道偷,基于前人大量的基礎(chǔ)工作,使得這項(xiàng)技術(shù)能夠得到良好的解決记劈,對(duì)于他們來(lái)說(shuō)并非是大的難題勺鸦。
最后就是解決回聲消除方面的難題。目前技術(shù)能夠處理信噪比大于 0 的情況目木。而在現(xiàn)實(shí)生活中祝旷,信噪比往往在 -30~-60dB 之間,已經(jīng)超出技術(shù)本身的極限。
為此怀跛,Rokid 團(tuán)隊(duì)則采用非技術(shù)的手段,包括拾音孔柄冲、麥克風(fēng)的方位設(shè)計(jì)吻谋、隔音、減震結(jié)構(gòu)等现横,從技術(shù)漓拾、工藝、結(jié)構(gòu)等多方面降低回聲消除的難度戒祠。
可見(jiàn)骇两,為了讓產(chǎn)品能夠更貼近用戶、受歡迎姜盈,Rokid 團(tuán)隊(duì)將「用戶體驗(yàn)」作為首要的衡量標(biāo)準(zhǔn)低千,在這基礎(chǔ)上穩(wěn)固的打磨人機(jī)交互設(shè)計(jì)以及 AI 技術(shù),堅(jiān)持著他們自身的準(zhǔn)則馏颂,并為此花下了不少心思示血。
Rokid 的潛在問(wèn)題與「迷茫」
雖然 Rokid 一直以來(lái)都堅(jiān)持自己慣有的風(fēng)格救拉,希望將產(chǎn)品做到極致难审。但與 Google Home、Echo 等同類產(chǎn)品相比亿絮,Rokid 昂貴的成本使得產(chǎn)品自身價(jià)格偏高(Rokid 第一代產(chǎn)品價(jià)格在 5000 以上告喊,Echo、Google Home 價(jià)格都不超過(guò)千元)派昧。
不難想象的是黔姜,這樣的價(jià)格已經(jīng)令不少想嘗鮮的人望而卻步。除了價(jià)格斗锭,Rokid 對(duì)設(shè)計(jì)的高度重視已超過(guò)產(chǎn)品本身地淀,這從 Rokid 此前借助機(jī)械臂展示產(chǎn)品的宣傳片當(dāng)中也能看出,Rokid 的定位傾向于偏高端消費(fèi)人群岖是,或者更通俗的講帮毁,是偏「geek」。
其實(shí)豺撑,身為一家初創(chuàng)公司烈疚,Rokid 這樣做似乎不太妥當(dāng)。知乎上一位關(guān)注 Rokid 的投資者認(rèn)為聪轿,Rokid 沒(méi)有 Google Home爷肝,Echo 那樣的數(shù)據(jù)、電商優(yōu)勢(shì),尤其在后兩者重點(diǎn)為鞏固他們?cè)谒阉鹘绲婆住㈦娚探绲匚欢鴮⒂布鳛檩o助金赦、沖量的產(chǎn)品的情況下,Rokid 走出了靠賣硬件賺錢這樣的一條道路对嚼,而這也注定是一條無(wú)比艱難的路夹抗。
從 Rokid 的布局看它對(duì)未來(lái)的思考
不過(guò),在發(fā)展到了一定程度后纵竖,Rokid 也意識(shí)到了這一點(diǎn)漠烧。
在這場(chǎng)知乎 live 中,Rokid 相關(guān)負(fù)責(zé)人表示靡砌,Rokid 即將在 5 月 15 日發(fā)布的 Pebble 以及后續(xù)的新品已脓,價(jià)格都會(huì)很「親民」。這隱約的暗示著通殃,他們希望通過(guò)降低價(jià)格的方式度液,讓產(chǎn)品的觸角伸向更多的消費(fèi)者。同時(shí)邓了,Rokid 也正積極尋求各方渠道合作伙伴恨诱。
目前,Rokid 已與部分智能家居骗炉、物聯(lián)網(wǎng)廠商等產(chǎn)業(yè)上游企業(yè)合作照宝,提供芯片及方案。另外句葵,Rokid 也正在建設(shè)開(kāi)發(fā)者社區(qū)厕鹃,開(kāi)放類似亞馬遜 Echo 的軟、硬件平臺(tái)(包括語(yǔ)音識(shí)別乍丈、NLP剂碴、TTS、拾音模塊等)轻专。未來(lái)忆矛,Rokid 將會(huì)把這些開(kāi)放給各中、小企業(yè)请垛。
除了產(chǎn)品催训、渠道、商業(yè)合作伙伴等方面布局宗收,Rokid 也十分重視底層技術(shù)的積累漫拭。在去年,繼北京「Rokid A-Lab」之后混稽,Rokid 緊鑼密鼓的在硅谷部署了「Rokid R-Lab」采驻,持續(xù)大力投入資源和人才在新技術(shù)的研發(fā)當(dāng)中审胚,腳步一刻都沒(méi)放慢下來(lái)過(guò)……
從成立到現(xiàn)在短短兩年多的時(shí)間里,Rokid 從 5 人的「咖啡廳創(chuàng)業(yè)團(tuán)隊(duì)」迅速成長(zhǎng)為一個(gè)橫跨中礼旅、美兩國(guó)膳叨,遍布三地的人工智能研發(fā)中心,一路堅(jiān)持拿到 B 輪投資并成為世界最有價(jià)值的人工智能企業(yè)之一各淀。對(duì)于一家初創(chuàng)公司來(lái)說(shuō)懒鉴,實(shí)屬不易,也是值得驕傲的資本碎浇。
而從這一路以來(lái)的變化,特別是商業(yè)模式方面的探索璃俗,我們也看到了他們的努力奴璃。