Uploads%2farticles%2f11734%2f1 hn0swohyrhedoc blkxblg
|
2017-08-14

AssemblyAI 想讓人人都能做定制化語音識(shí)別陪踩,雖然他們只有三個(gè)人

三人的小團(tuán)隊(duì)如何搶占巨頭的市場(chǎng)猴凹?

如今的語音技術(shù)宰闰,不僅僅是巨頭們爭(zhēng)搶的市場(chǎng),我們也能發(fā)現(xiàn)簿透,不少創(chuàng)業(yè)公司憑借獨(dú)有的技術(shù)移袍,在巨頭紛爭(zhēng)的語音市場(chǎng)頑強(qiáng)地前行,AssemblyAI 就是這樣的一家創(chuàng)業(yè)公司老充。

AssemblyAI 由硅谷著名創(chuàng)業(yè)孵化器 Y Combinator 投資葡盗,他們希望通過構(gòu)建 API 讓每個(gè)開發(fā)者都能快速地開發(fā)出定制化的語音交互接口。AssemblyAI 的創(chuàng)始人 Dylan Fox 說:「我們正在構(gòu)建用于定制化語音識(shí)別的 API啡浊,開發(fā)人員可以用我們的 API 將語音轉(zhuǎn)錄成文字或者創(chuàng)建自己的語音接口觅够,而且他們不需要做任何數(shù)據(jù)上的挖掘和訓(xùn)練,我們會(huì)為他們完成海量自定義字詞的識(shí)別巷嚣〈龋」

眾所周知,語音模型的訓(xùn)練和語音數(shù)據(jù)的挖掘分析需要耗費(fèi)大量的人力和資源廷粒,非資金雄厚的大公司不能承受苹祟,像 AssemblyAI 這樣只有三個(gè)人的創(chuàng)業(yè)公司要做這樣一件費(fèi)時(shí)費(fèi)力又不討好的事情,確實(shí)有點(diǎn)像天方夜譚评雌。

作為前思科工程師,F(xiàn)ox 明白一個(gè)創(chuàng)業(yè)公司要建立一個(gè)定制化的語音識(shí)別系統(tǒng)需要面對(duì)不小的挑戰(zhàn)直焙,但他表示景东,AI 的進(jìn)步和機(jī)器學(xué)習(xí)的發(fā)展使得他們現(xiàn)在正在做的事情成為可能。

Fox 說奔誓,首先斤吐,他們需要大量的 GPU ,因?yàn)檎Z音模型的訓(xùn)練是計(jì)算密集型任務(wù)厨喂。相比于 CPU和措,GPU 具有并行度高,內(nèi)存帶寬高蜕煌,運(yùn)行速度快等特點(diǎn)派阱,所以 GPU 不僅僅用于圖像信息的計(jì)算,同時(shí)也用于大數(shù)據(jù)或者 AI 模型訓(xùn)練等需要大量計(jì)算的工作斜纪。僅靠三人團(tuán)隊(duì)的力量獲取足夠多的 GPU 陣列有些不現(xiàn)實(shí)贫母,不過文兑,好在 Y Combinator 給了他們足夠多的的幫助,用以構(gòu)建 GPU 云服務(wù)腺劣。

除了硬件上的支持绿贞,AssemblyAI 技術(shù)還需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練。作為創(chuàng)業(yè)公司橘原,AssemblyAI 無法像 Google 和 Amazon 那樣調(diào)用大量的用戶和數(shù)據(jù)資源籍铁,所以,他們開發(fā)了一款叫做 Harvest 的自主架構(gòu)趾断,用來在網(wǎng)絡(luò)上收集音頻數(shù)據(jù)拒名。

其實(shí),Harvest 就是一款爬蟲軟件歼冰,它能夠在網(wǎng)絡(luò)上尋找并標(biāo)注可以用于訓(xùn)練 AI 模型的數(shù)據(jù)靡狞。由于該架構(gòu)的高準(zhǔn)確性,使得 AssemblyAI 可以用高標(biāo)準(zhǔn)的數(shù)據(jù)來訓(xùn)練模型隔嫡,在幾個(gè)星期之內(nèi)甸怕,AssemblyAI 已經(jīng)收集了數(shù)百萬條高質(zhì)量的音頻剪輯,用作其神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)腮恩。

Fox 表示:「作為創(chuàng)業(yè)公司梢杭,我們必須開發(fā)大量的新技術(shù)來實(shí)現(xiàn)尖端的 AI 技術(shù),在不久的將來我們還會(huì)貢獻(xiàn)更多新的想法和技術(shù)秸滴∥淦酰」

另外,F(xiàn)ox 認(rèn)為良好的用戶體驗(yàn)也將是他們成功的關(guān)鍵荡含,并且另外找了一個(gè)團(tuán)隊(duì)專門做前端的開發(fā)和優(yōu)化咒唆。「作為一家專注于語音識(shí)別技術(shù)的小公司释液,我們可以提供比大公司更好的用戶體驗(yàn)全释,」對(duì)于大公司是否會(huì)搶占 AssemblyAI 的市場(chǎng),他是這樣回答的误债,「我們會(huì)提供更好的技術(shù)文檔浸船、更簡(jiǎn)單的集成方式,幫助開發(fā)者快速上手寝蹈±蠲」

到目前為止,AssemblyAI 的產(chǎn)品還處于測(cè)試階段箫老,有幾家公司開始使用他們的 GPU 云服務(wù)封字。有關(guān) AssemblyAI 這家創(chuàng)業(yè)公司的最新動(dòng)態(tài),深圳灣將會(huì)持續(xù)關(guān)注。

>>
Back to top btn
亚洲AV无码国产精品网址,久久亚洲AV成人出白浆无码国产,日韩AV美乳欧美,永久免费AV无码软件app下载