搜狗新一代錄音筆 C1 Pro 開(kāi)售诉瓦,支持 WiFi 藍(lán)牙雙傳輸川队,售價(jià) 598 元
搜狗推出 8 麥陣列的 AI 錄音筆猛们,拾音和轉(zhuǎn)寫(xiě)能力大幅提升
錄音、轉(zhuǎn)寫(xiě)狞洋、翻譯齿风,不錯(cuò)的生產(chǎn)力工具讼溺!
其實(shí)早在上世紀(jì) 90 年代,小型迷你錄音筆就被發(fā)明出來(lái)了假勿。在之后的 20 年里,錄音筆的產(chǎn)品形態(tài)和基本功能基本上沒(méi)有變化态鳖。雖然存儲(chǔ)空間越來(lái)越大转培,錄音的音質(zhì)越來(lái)越好,但并沒(méi)有本質(zhì)的幫用戶(hù)解決問(wèn)題浆竭。
那么錄音筆從本質(zhì)上應(yīng)該為用戶(hù)解決哪些問(wèn)題浸须?作為一家 AI 公司,搜狗在一年前推出第一款錄音筆 C1 的時(shí)候邦泄,就曾經(jīng)思考過(guò)羽戒,如何用「以語(yǔ)言為核心的 AI 能力」去驅(qū)動(dòng)錄音筆,讓它能夠?yàn)橛脩?hù)提供更好的使用體驗(yàn)虎韵。
這其中的思考方向有三:
更好的拾音能力易稠,用人工智能的能力增強(qiáng)人聲,這樣聽(tīng)起來(lái)講話(huà)的聲音更清晰包蓝;
更準(zhǔn)確的轉(zhuǎn)寫(xiě)能力驶社,能夠把錄下來(lái)的聲音準(zhǔn)確地轉(zhuǎn)成文字,兼顧準(zhǔn)確率和轉(zhuǎn)寫(xiě)速度测萎;
更高效的整理和使用這些錄音和轉(zhuǎn)寫(xiě)文字亡电。
△ 搜狗 2019 年發(fā)布的錄音筆 C1 Pro
在錄音筆這個(gè)不算很大的垂直細(xì)分領(lǐng)域,不難看到一些被吐槽「錄音效果甚至不如手機(jī)」的渣渣產(chǎn)品硅瞧,不外乎幾個(gè)原因:硬件配置不夠份乒,錄音和轉(zhuǎn)寫(xiě)能力不夠,整體使用體驗(yàn)不佳腕唧。
在經(jīng)歷了這些年在消費(fèi)電子市場(chǎng)的摸索或辖、以及在軟硬件產(chǎn)品能力的積累和沉淀后,搜狗在 2020 年 2 月 26 日枣接,通過(guò)線(xiàn)上發(fā)布會(huì)的方式颂暇,重磅推出了 S1、E1 兩款旗艦級(jí)的 AI 錄音筆新品但惶,在去年發(fā)布的 C1 的基礎(chǔ)上耳鸯,進(jìn)一步實(shí)現(xiàn)了產(chǎn)品功能的全面突破與升級(jí)。
△ 搜狗楊洪濤發(fā)布 S1膀曾、E1 兩款 AI 錄音筆
這兩款產(chǎn)品是如何做到「更好地拾音县爬、更準(zhǔn)確地轉(zhuǎn)寫(xiě)、更高效地整理」呢添谊?我們從整個(gè)錄音到整理的過(guò)程來(lái)看财喳,搜狗是如何在這兩款產(chǎn)品上「下血本」的。
8 麥克風(fēng)陣列 + AI 降噪碉钠,大幅提升拾音能力
在錄音的過(guò)程中纲缓,不管是使用錄音筆、還是手機(jī)的錄音軟件喊废,經(jīng)常會(huì)遇到各種噪音干擾的情況祝高,比如會(huì)場(chǎng)里竊竊私語(yǔ)的聲音,比如會(huì)議室的空調(diào)聲污筷、敲鍵盤(pán)聲工闺、翻閱材料的聲音,比如咖啡館里的背景音樂(lè)瓣蛀、電話(huà)鈴聲和各種人來(lái)人往的雜音......如果錄音的時(shí)候不加處理陆蟆,就會(huì)導(dǎo)致錄音者的人聲不清晰,甚至被噪音覆蓋掉惋增。
搜狗 AI 錄音筆首先從硬件的層面解決噪音的問(wèn)題叠殷。S1 配備了 2 顆哈曼 10mm 指向性麥克風(fēng) + 6 顆全向麥克風(fēng)。通常智能手機(jī)只有最多 2 個(gè)麥克風(fēng)诈皿,而智能音箱也不過(guò) 4 個(gè)麥克風(fēng)林束。
在會(huì)議和采訪(fǎng)模式下,將錄音筆平放的時(shí)候稽亏,可以實(shí)現(xiàn) 360° 方向的聲音收錄壶冒,并對(duì)各個(gè)方向的聲音進(jìn)行平衡;而在聽(tīng)課模式下截歉,麥克風(fēng)則指向正前方胖腾,通過(guò)波束采集較遠(yuǎn)處主講人的聲音。
在實(shí)現(xiàn)全向錄音后瘪松,搜狗還利用了 AI 降噪技術(shù)咸作,對(duì)麥克風(fēng)的拾音信號(hào)進(jìn)行三個(gè)層面的優(yōu)化處理∠溃基于麥克風(fēng)陣列算法性宏,首先在空間層面,通過(guò)增強(qiáng)人聲状飞、去除背景音毫胜,優(yōu)化 8 個(gè)麥克風(fēng)的全向信噪比。
△ 現(xiàn)場(chǎng)演示 AI 降噪功能
而針對(duì)與人聲同時(shí)被錄入進(jìn)來(lái)的極端噪聲诬辈,則通過(guò)判斷時(shí)域酵使、頻率的特征,進(jìn)行去除焙糟。此外口渔,當(dāng)遇到一些無(wú)法判斷特征的不確定的噪音時(shí),搜狗還能利用神經(jīng)元和 AI 學(xué)習(xí)的方法穿撮,對(duì)噪聲進(jìn)行判斷和區(qū)分缺脉。
據(jù)搜狗介紹痪欲,在 S1 上采用的這個(gè) PureVoice AI 深度降噪算法,能夠過(guò)濾 4 萬(wàn)余種真實(shí)噪音攻礼。
合并輸入法詞匯业踢,支持多語(yǔ)言和方言,全面提升轉(zhuǎn)寫(xiě)準(zhǔn)確率
現(xiàn)如今礁扮,無(wú)論是媒體從業(yè)人員知举,還是各行各業(yè)常常開(kāi)會(huì)和聽(tīng)講的人,對(duì)于錄音筆的需求已經(jīng)不局限于錄音這一個(gè)功能上太伊,錄音后的文字轉(zhuǎn)寫(xiě)功能雇锡,已經(jīng)成為這些人的「剛需」。
搜狗 S1 在錄音的同時(shí)僚焦,還可以實(shí)時(shí)轉(zhuǎn)寫(xiě)文字锰提,并同時(shí)顯示在屏幕下方。而在錄音完成后芳悲,將文件上傳云端欲账,還能完成通篇的轉(zhuǎn)寫(xiě)。理論上芭概,1 小時(shí)的錄音生成稿件可以在 5 分鐘內(nèi)完成轉(zhuǎn)寫(xiě)赛不,識(shí)別率達(dá)到 98%。
如何通過(guò)技術(shù)手段來(lái)確保這一過(guò)程的高效呢罢洲?在遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別技術(shù)之上踢故,S1 還利用了搜狗輸入法背后的語(yǔ)音技術(shù),當(dāng)用戶(hù)在錄音筆上登錄搜狗賬號(hào)惹苗,就可以在服務(wù)器上合并個(gè)人的語(yǔ)匯殿较,從而獲得更符合個(gè)人需求和準(zhǔn)確率更高的語(yǔ)音識(shí)別。
△ 現(xiàn)場(chǎng)演示上課場(chǎng)景的定向拾音 + 實(shí)時(shí)轉(zhuǎn)寫(xiě)
搜狗輸入法每天有接近 6 億次的活躍用戶(hù)桩蓉,每天會(huì)產(chǎn)生 10 億次的語(yǔ)音請(qǐng)求淋纲,這些數(shù)據(jù)可以對(duì)語(yǔ)音識(shí)別和轉(zhuǎn)寫(xiě)進(jìn)行支持,從而可以準(zhǔn)確識(shí)別一些通常很生僻但已經(jīng)在用戶(hù)數(shù)據(jù)庫(kù)里的詞匯院究,比如通訊錄里的人名洽瞬,或者用戶(hù)經(jīng)常輸入的專(zhuān)業(yè)詞匯。
搜狗的 AI 錄音筆還支持中英日韓德等 10 種語(yǔ)言业汰、以及川粵津陜貴等 10 種方言的錄音和轉(zhuǎn)寫(xiě)伙窃。除此之外,搜狗語(yǔ)音團(tuán)隊(duì)經(jīng)過(guò)長(zhǎng)時(shí)間訓(xùn)練創(chuàng)建的財(cái)經(jīng)貿(mào)易样漆、醫(yī)療衛(wèi)生为障、IT 科技、政法、文化體育 5 個(gè)專(zhuān)業(yè)領(lǐng)域的語(yǔ)言模型鳍怨,也應(yīng)用到了此次的新品呻右,從而提升了行業(yè)特有詞匯的識(shí)別準(zhǔn)確率。
△ 搜狗 AI 錄音筆背后的技術(shù)
智能標(biāo)注鞋喇、智能摘要声滥、語(yǔ)音查找,高效的文稿整理功能确徙,外加同聲傳譯
在實(shí)際的工作中,我們總能遇到錄音時(shí)間過(guò)長(zhǎng)执桌、轉(zhuǎn)寫(xiě)之后文字篇幅很大鄙皇、錄音文件較多的時(shí)候,查找起來(lái)費(fèi)時(shí)費(fèi)力仰挣。
△ 對(duì)轉(zhuǎn)寫(xiě)的文稿進(jìn)行智能標(biāo)注
搜狗錄音筆具備智能標(biāo)注的能力伴逸。當(dāng)有多個(gè)人講話(huà)的時(shí)候,錄音筆可以辨別不同的講話(huà)人膘壶,并進(jìn)行標(biāo)識(shí)错蝴;甚至還能在有掌聲、笑聲的部分進(jìn)行情緒標(biāo)注颓芭;并自動(dòng)去除一些口頭語(yǔ)顷锰、重復(fù)的詞匯。按下 M 鍵亡问,即可在轉(zhuǎn)寫(xiě)生成的文稿里查看這些標(biāo)注官紫,一目了然。
△ 現(xiàn)場(chǎng)演示:多人會(huì)議場(chǎng)景時(shí)的實(shí)時(shí)轉(zhuǎn)寫(xiě)+智能標(biāo)注
基于 NLP 技術(shù)和關(guān)鍵詞搜索技術(shù)州藕,搜狗還推出了業(yè)內(nèi)首創(chuàng)的智能摘要功能束世,可以自動(dòng)提煉錄音文稿的主題和關(guān)鍵語(yǔ)句,方便用戶(hù)對(duì)轉(zhuǎn)寫(xiě)內(nèi)容進(jìn)行整理床玻。
此外毁涉,搜狗 AI 錄音筆還支持用語(yǔ)音一句話(huà)查找錄音內(nèi)容。
△ 長(zhǎng)按 M 鍵喚醒語(yǔ)音助手锈死,可啟用語(yǔ)音搜索
在云端存儲(chǔ)技術(shù)的加持下贫堰,用戶(hù)還能在錄音筆、手機(jī) App待牵、網(wǎng)頁(yè)严嗜、PC 客戶(hù)端等多端自動(dòng)同步和管理錄音數(shù)據(jù),并實(shí)現(xiàn)一鍵導(dǎo)出洲敢、掃碼分享等便捷操作漫玄。
而在中英文的轉(zhuǎn)寫(xiě)方面,搜狗 AI 錄音筆還能實(shí)現(xiàn)個(gè)人同傳功能,聽(tīng)英文報(bào)告的時(shí)候可以實(shí)時(shí)進(jìn)行翻譯睦优。
△ 實(shí)時(shí)中英互譯渗常,轉(zhuǎn)寫(xiě)結(jié)果可以實(shí)時(shí)共享給其他人
S1 還支持全球 63 種語(yǔ)言的在線(xiàn)翻譯,以及中汗盘、英皱碘、日、韓隐孽、法癌椿、俄等 9 種常用語(yǔ)言的離線(xiàn)翻譯,同時(shí)還能實(shí)現(xiàn)自由對(duì)話(huà)翻譯功能菱阵。
價(jià)格和其他
續(xù)航方面踢俄,產(chǎn)品可滿(mǎn)足待機(jī) 20 天、滿(mǎn)電續(xù)航 10 小時(shí)晴及。而 S1 還配備了內(nèi)置的存儲(chǔ)卡和 4G 卡槽都办,定價(jià) 2698 元。
同時(shí)發(fā)布的 E1 是 S1 的親民版虑稼,定價(jià) 1298 元琳钉。E1 具備與 S1 相當(dāng)?shù)?AI 能力,只是屏幕要小一些蛛倦,只支持 Wi-Fi 聯(lián)網(wǎng)歌懒。
自去年搜狗發(fā)布 C1 之后,搜狗就將其 AI 服務(wù)向錄音筆行業(yè)的合作伙伴開(kāi)放溯壶,包括語(yǔ)音識(shí)別技術(shù)歼培、搜狗輸入法賬號(hào)服務(wù)體系、個(gè)性化語(yǔ)言識(shí)別茸塞、多端同步的云端編輯能力躲庄、云存儲(chǔ)服務(wù)能力等,并與索尼钾虐、萬(wàn)城集團(tuán)噪窘、愛(ài)國(guó)者、紐曼等硬件設(shè)備制造商展開(kāi)合作效扫。
在主流電商平臺(tái)上倔监,自 2019 年 3 月搜狗產(chǎn)品發(fā)布以后,AI 錄音筆的銷(xiāo)量快速增長(zhǎng)菌仁。在今年一季度的錄音筆市場(chǎng)浩习,AI 錄音筆已經(jīng)占據(jù)了 1/3 左右的市場(chǎng)份額。
總的來(lái)說(shuō)济丘,S1 和 E1 無(wú)論是硬件配置還是 AI 技術(shù)的加持谱秽,都是一款「上得了廳堂洽蛀、下得了廚房」的好「伴侶」,可以極大的提升工作效率疟赊。而具體的錄音和轉(zhuǎn)寫(xiě)的一些細(xì)節(jié)體驗(yàn)方面郊供,還真需要領(lǐng)回家慢慢感覺(jué)才好做判斷。
微信號(hào):shenzhenware
主筆近哟、編輯:大零 / 深圳灣