助力 AI 產(chǎn)業(yè)落地矮锈,云知聲展示全棧 AI 硬核技術(shù)

云知聲展示全棧 AI 硬核能力有送,讓機(jī)器更好地服務(wù)人類(lèi)
全棧指的是全棧技術(shù)能力和落地能力淌喻,將技術(shù)創(chuàng)新貫穿到產(chǎn)業(yè)應(yīng)用中,打造價(jià)值閉環(huán)雀摘;而硬核技術(shù)方案能夠高效率地解決產(chǎn)業(yè)規(guī)乃凄停化痛點(diǎn)
4 月 18 日届宠,云知聲 AI 技術(shù)開(kāi)放日(Open Day)深圳站期間,云知聲董事長(zhǎng)/CTO 梁家恩博士向深圳的合作伙伴和開(kāi)發(fā)者講解了云知聲全棧 AI 技術(shù)圖譜和產(chǎn)業(yè)能力乘粒。梁家恩博士強(qiáng)調(diào)豌注,「AI 不是刷榜炫技,而是要真正解決產(chǎn)業(yè)實(shí)際問(wèn)題灯萍≡」AI 技術(shù)只有與產(chǎn)業(yè)結(jié)合起來(lái),解決產(chǎn)業(yè)問(wèn)題旦棉,才有可能發(fā)揮其最大的價(jià)值齿风。
創(chuàng)立 7 年,云知聲立足產(chǎn)業(yè)需求绑洛,逐步形成了自己的 AI 哲學(xué)救斑。梁家恩博士將其總結(jié)為全棧+硬核,「全棧讓我們關(guān)注用戶(hù)價(jià)值和應(yīng)用問(wèn)題真屯,硬核幫助我們破解產(chǎn)業(yè)難題脸候。」其中绑蔫,全棧指的是全棧技術(shù)能力和落地能力运沦,將技術(shù)創(chuàng)新貫穿到產(chǎn)業(yè)應(yīng)用中,打造價(jià)值閉環(huán)配深;而硬核技術(shù)方案能夠高效率地解決產(chǎn)業(yè)規(guī)男恚化痛點(diǎn)。

全棧 AI 能力篓叶,貫通技術(shù)創(chuàng)新到產(chǎn)業(yè)應(yīng)用的價(jià)值閉環(huán)
「全椓衣樱」包含了全棧 AI 技術(shù)能力和全棧 AI 落地能力兩個(gè)維度羞秤。
從技術(shù)的角度看,云知聲很早就搭建了 Atlas 機(jī)器學(xué)習(xí)計(jì)算平臺(tái)向叉,該平臺(tái)具備超強(qiáng)的 GPU 計(jì)算資源和浮點(diǎn)計(jì)算能力锥腻,為在人工智能新領(lǐng)域的拓展奠定了強(qiáng)大的計(jì)算能力基礎(chǔ)。Atlas 平臺(tái)向上支撐起信號(hào)(AEC/SSP/ISP)母谎、語(yǔ)音(ASR/TTS/VPR/CALL)瘦黑、語(yǔ)言與認(rèn)知(NLU/NMT/SDS/ICI)、圖像(FID/OD/OCR)等多技術(shù)領(lǐng)域的橫向擴(kuò)展和縱向迭代奇唤⌒页猓基于此,云知聲硬核 AI 技術(shù)圖譜具備了完整感知咬扇、表達(dá)甲葬、認(rèn)知與計(jì)算能力。
在完成了全棧技術(shù)搭建之后懈贺,云知聲將能力封裝到自研芯片中经窖,打造「云端芯」一體化產(chǎn)品體系,為產(chǎn)業(yè)提供面向具體場(chǎng)景的軟硬件一體化 Turnkey 解決方案梭灿,可讓行業(yè)用戶(hù)站在更高的設(shè)計(jì)起點(diǎn)画侣、以更低的成本,在更短的時(shí)間周期內(nèi)打造出更穩(wěn)定可靠的產(chǎn)品堡妒,繼而貫通云知聲從 AI 技術(shù)到產(chǎn)業(yè)應(yīng)用的生態(tài)閉環(huán)配乱。

硬核 AI 技術(shù),破解產(chǎn)業(yè)規(guī)钠こ伲化應(yīng)用難題
立足產(chǎn)業(yè)需求搬泥,云知聲對(duì)其 AI 硬核技術(shù)進(jìn)行優(yōu)化和提升,使其能夠有效解決行業(yè)規(guī)姆幔化應(yīng)用中的難題忿檩。截止到目前,云知聲的硬核 AI 技術(shù)覆蓋了語(yǔ)音感知與表達(dá)爆阶、語(yǔ)言與知識(shí)計(jì)算休溶、AIoT 芯片落地,以及超算平臺(tái)與圖像扰她、翻譯拓展等多個(gè)維度兽掰。
硬核技術(shù) 1:語(yǔ)音感知與表達(dá)
語(yǔ)音感知和表達(dá)是人機(jī)交互的基礎(chǔ)。在感知層徒役,需要賦予機(jī)器感知并語(yǔ)音指令的能力孽尽,讓設(shè)備能夠聽(tīng)得清、聽(tīng)得到忧勿。在遠(yuǎn)場(chǎng)拾音階段杉女,云知聲 AI Labs 技術(shù)專(zhuān)家關(guān)海欣表示瞻讽,目前,云知聲在回聲消除熏挎、混響抑制速勇、噪聲處理等方向均已有成熟的技術(shù)方案,相關(guān)技術(shù)指標(biāo)均達(dá)行業(yè)一流水準(zhǔn)坎拐。在語(yǔ)音識(shí)別階段烦磁,云知聲基于大數(shù)據(jù)、聲學(xué)建模哼勇、自適應(yīng)學(xué)習(xí)搭建了聲學(xué)模型都伪,并有一個(gè)數(shù)據(jù)規(guī)模大、融合能力強(qiáng)积担、靈活和個(gè)性化的語(yǔ)言模型陨晶,以上模型在還將基于超算平臺(tái)不斷優(yōu)化迭代。在表達(dá)層帝璧,云知聲通過(guò)「算法+數(shù)據(jù)+工程」三位一體的方式先誉,輸出高質(zhì)量、個(gè)性化的語(yǔ)音合成能力的烁。

硬核技術(shù) 2:語(yǔ)言與知識(shí)計(jì)算
認(rèn)知能力是機(jī)器智能的核心褐耳,只有解決了認(rèn)知問(wèn)題,設(shè)備才有可能解決撮躁、滿(mǎn)足用戶(hù)的需求。從公司創(chuàng)立之初买雾,云知聲便開(kāi)始布局語(yǔ)言與知識(shí)計(jì)算把曼;2013 年,云知聲面開(kāi)放了對(duì)話(huà)技能開(kāi)放平臺(tái)(語(yǔ)義云)漓穿,幫助合作伙伴打造更加自然的人機(jī)交互體驗(yàn)嗤军;2018 年,云知聲形成了完整的技術(shù)和應(yīng)用體系晃危,實(shí)現(xiàn)了家叙赚、車(chē)載、智能兒童機(jī)器人等場(chǎng)景的智能交互僚饭,和醫(yī)療震叮、教育、酒店等場(chǎng)景的行業(yè)智能鳍鸵。

云知聲的人機(jī)對(duì)話(huà)系統(tǒng)具備流式交互苇瓣、語(yǔ)用計(jì)算與知性會(huì)話(huà) 3 大硬核能力。云知聲 AI Labs 技術(shù)專(zhuān)家單波介紹到偿乖,流式交互最大的特點(diǎn)是在多輪對(duì)話(huà)免喚醒击罪,大大的提升了人機(jī)對(duì)話(huà)過(guò)程中的流暢程度哲嘲;語(yǔ)用計(jì)算則是將人機(jī)對(duì)話(huà)內(nèi)容放置到對(duì)應(yīng)的語(yǔ)境中傍衡,讓設(shè)備準(zhǔn)確的理解人的意圖趾疚;最后纵顾,知性會(huì)話(huà)則是通過(guò)將知識(shí)圖譜應(yīng)用到人機(jī)對(duì)話(huà)過(guò)程中拒炎,讓設(shè)備靈活響應(yīng)用戶(hù)的問(wèn)題芭概。
硬核技術(shù) 3:AIoT 芯片落地
要將 AI 技術(shù)落地冯吓,讓技術(shù)真正惠及行業(yè)磷支,僅僅打包云端算法能力是不夠的谬返,必須將語(yǔ)音交互和 AI 技術(shù)硬件化丧枪,通過(guò)芯片光涂、模組的方式配合廠商快速推出智能產(chǎn)品。
2014 年開(kāi)始拧烦,云知聲確立了「云端芯」戰(zhàn)略忘闻,隨后發(fā)布了物聯(lián)網(wǎng) AI 硬件芯片方案(IVM)。2015 年云知聲正式啟動(dòng)自研 AI 芯片計(jì)劃恋博。2018 年齐佳,云知聲推出第一代 UniOne 物聯(lián)網(wǎng) AI 芯片「雨燕」,并將基于雨燕的解決方案進(jìn)行開(kāi)源债沮。在此基礎(chǔ)上炼吴,云知聲推出智能家居、智能音箱的兩套標(biāo)桿解決方案疫衩。

2019 年 1 月硅蹦,云知聲重磅發(fā)布多模態(tài) AI 芯片戰(zhàn)略,同時(shí)宣布推出 3 款全新芯片:第二代物聯(lián)網(wǎng)語(yǔ)音 AI 芯片雨燕 Lite闷煤、面向智慧城市的支持圖像與語(yǔ)音計(jì)算的多模態(tài) AI 芯片海豚(Dolphin)童芹,以及面向智慧出行的車(chē)規(guī)級(jí)多模態(tài) AI 芯片雪豹(Leopard)±鹉茫基于這一些 AI 芯片假褪,云知聲不斷拓展技術(shù)與場(chǎng)景生態(tài),實(shí)現(xiàn)產(chǎn)業(yè)賦能近顷。
硬核技術(shù) 4:超算平臺(tái)與圖像生音、翻譯拓展
超算平臺(tái)是 AI 技術(shù)自我優(yōu)化、進(jìn)行橫向擴(kuò)展和縱向迭代的重要基礎(chǔ)窒升。早在 2013 年缀遍,云知聲便開(kāi)始建設(shè)被譽(yù)為云知聲版「TensorFlow+GKE(GoogleKubernetesEngine)」的 Atlas 機(jī)器學(xué)習(xí)智能計(jì)算平臺(tái),把統(tǒng)計(jì)學(xué)習(xí)和深度學(xué)習(xí)里面的一些通用算法抽樣出來(lái)饱须。該平臺(tái)以 GPU 和 CPU 為計(jì)算集群的基礎(chǔ)硬件資源瑟由,針對(duì)智能計(jì)算的需求和任務(wù)特點(diǎn),使用云知聲內(nèi)部改進(jìn)的 Kubernetes 作為資源管理和調(diào)度系統(tǒng),通過(guò)計(jì)算任務(wù)容器化和圖形化的任務(wù)交互歹苦,最大化的簡(jiǎn)化算法研究人員提交計(jì)算任務(wù)的復(fù)雜度青伤,實(shí)現(xiàn)計(jì)算任務(wù)的全流程管理和一鍵式分布式運(yùn)行。同時(shí)殴瘦,針對(duì)智能計(jì)算對(duì)海量真實(shí)應(yīng)用場(chǎng)景數(shù)據(jù)的訪(fǎng)問(wèn)特點(diǎn)狠角, Atlas 智能計(jì)算平臺(tái)構(gòu)建具備 PB 量級(jí)的高 IO 和高可靠的分布式存儲(chǔ)系統(tǒng)。

去年 5 月份的 WMT 2018 國(guó)際機(jī)器翻譯大賽中英翻譯比賽中蚪腋,云知聲 NMT 機(jī)器翻譯團(tuán)隊(duì)首戰(zhàn)即斬獲英中第二丰歌、中英第四,綜合第三(BLEU 關(guān)鍵評(píng)分僅次于第二名 0.1)的成績(jī)屉凯。這些成績(jī)都是 Atlas 計(jì)算平臺(tái)為云知聲探索多模態(tài) AI 技術(shù)能力過(guò)程中帶來(lái)的重要價(jià)值立帖。
立足產(chǎn)業(yè),讓機(jī)器更好地服務(wù)人類(lèi)
在邁進(jìn) 2019 年之后悠砚,AIoT 產(chǎn)業(yè)還將面臨諸多變革晓勇,其中,既有面向大眾用戶(hù)的智能交互需求灌旧,也有面向特定領(lǐng)域的行業(yè)智能需求绑咱。
在智能人機(jī)交互過(guò)程中,新數(shù)據(jù)維度(圖像枢泰、語(yǔ)音描融、視頻、VR/AR等)出現(xiàn)帶來(lái)數(shù)據(jù)傳輸?shù)膹?fù)雜度及對(duì)數(shù)據(jù)實(shí)時(shí)性處理的要求衡蚂,需要更全面的運(yùn)算能力窿克,多模態(tài) AI 技術(shù)能力建設(shè)成為關(guān)鍵。而面向行業(yè)場(chǎng)景毛甲,將知識(shí)圖譜與大數(shù)據(jù)結(jié)合年叮,構(gòu)建行業(yè)知識(shí)圖譜,打造可遷移的行業(yè)智能系統(tǒng)丽啡,方可解決行業(yè)智能化實(shí)際問(wèn)題谋右。
未來(lái)硬猫,在全棧能力與硬核科技雙輪驅(qū)動(dòng)下补箍,云知聲將繼續(xù)定位需求與問(wèn)題,致力于打通技術(shù)創(chuàng)新到產(chǎn)業(yè)應(yīng)用的閉環(huán)啸蜜,解決產(chǎn)業(yè)規(guī)目友牛化應(yīng)用的關(guān)鍵問(wèn)題。