我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
近日,全球最大的語(yǔ)音會(huì)議 INTERSPEECH 2020 公布了 SdSV 聲紋識(shí)別比賽成績(jī),網(wǎng)易 AI Lab 從眾多國(guó)際頂級(jí)隊(duì)伍中脫穎而出,獲文本相關(guān)聲紋識(shí)別賽道綜合排名第一、單模型第一的雙料冠軍。彰顯了網(wǎng)易 AI Lab 在語(yǔ)音聲紋識(shí)別技術(shù)領(lǐng)域的領(lǐng)先地位。
本次國(guó)際聲紋識(shí)別比賽是業(yè)界非常具備權(quán)威性的賽事,參賽隊(duì)伍來(lái)自國(guó)際多家知名高校與企業(yè),包括近兩年全球各項(xiàng)聲紋識(shí)別比賽中的“常勝將軍”:布爾諾工業(yè)大學(xué)、新加坡通信研究院、約翰霍普金斯大學(xué)等。
比賽中,網(wǎng)易 AI Lab 基于常見(jiàn)的X-Vector 和 PLDA 算法,創(chuàng)新地提出了一種 ASR-free 的文本相關(guān)聲紋識(shí)別算法。相比傳統(tǒng)的 Deep Speaker Embedding 方法,該算法不需要依賴語(yǔ)音識(shí)別,就能夠在多語(yǔ)言環(huán)境下,同時(shí)完成說(shuō)話人和文本內(nèi)容的驗(yàn)證。
比賽采用 MinDCF(最小檢測(cè)代價(jià))和 EER(等錯(cuò)誤率)作為評(píng)測(cè)指標(biāo)。網(wǎng)易 AI Lab 的單模型在兩個(gè)指標(biāo)均為最佳,其中 EER 達(dá)到了 1.67%,相比第二名降低了 11.6%,并遠(yuǎn)低于比賽 X-Vector 基線系統(tǒng)(EER=9.05%)。
評(píng)估算法系統(tǒng)性能時(shí)常輸出 ROC 曲線,用于描述 FAR(誤識(shí)率)與 FRR(拒識(shí)率)之間的關(guān)系。
簡(jiǎn)單說(shuō),在聲紋識(shí)別中,誤識(shí)率就是“把不應(yīng)該匹配的聲紋當(dāng)成匹配聲紋”的比例,拒識(shí)率則是“把應(yīng)該匹配的聲紋當(dāng)成不匹配聲紋”的比例。
在對(duì)安全要求非常高的應(yīng)用場(chǎng)景,就會(huì)把 FAR 值設(shè)置得低一些,因?yàn)榕袛噱e(cuò)一次的代價(jià)很大,但這樣做的同時(shí)會(huì)導(dǎo)致 FRR 值上升,用戶體驗(yàn)度下降。
等錯(cuò)誤率(EER)是系統(tǒng)的誤識(shí)率(FAR)和拒識(shí)率(FRR)相等時(shí)的錯(cuò)誤率,即 ROC 曲線與 45 度角直線相交的點(diǎn),是衡量聲紋識(shí)別算法系統(tǒng)綜合性能的重要指標(biāo)。EER 數(shù)值越小,系統(tǒng)性能越好。
聲紋識(shí)別是生物識(shí)別技術(shù)的一種,也稱為說(shuō)話人識(shí)別,是一種通過(guò)聲音判別說(shuō)話人身份的技術(shù)。
目前,人工智能主要有三個(gè)研究方向:視覺(jué)識(shí)別、智能語(yǔ)音、NLP 自然語(yǔ)言處理。其中,在語(yǔ)音識(shí)別領(lǐng)域,聲紋識(shí)別屬于相對(duì)藍(lán)海市場(chǎng),解決的主要是“我是我”的身份認(rèn)證問(wèn)題,多應(yīng)用在安全驗(yàn)證場(chǎng)景。
從近幾年的市場(chǎng)趨勢(shì)來(lái)看,銀行,金融服務(wù),保險(xiǎn)已成為聲紋識(shí)別應(yīng)用的領(lǐng)導(dǎo)領(lǐng)域。
隨著技術(shù)的不斷成熟和融合,聲紋識(shí)別技術(shù)將逐漸融入日常生活,根據(jù)不同應(yīng)用場(chǎng)景的特點(diǎn)進(jìn)行針對(duì)性開(kāi)發(fā),將產(chǎn)生巨大的應(yīng)用價(jià)值。
而網(wǎng)易 AI Lab 聲紋識(shí)別技術(shù)其實(shí)早已被運(yùn)用于游戲場(chǎng)景中。除了進(jìn)行游戲身份驗(yàn)證,還能夠針對(duì)音色對(duì)用戶進(jìn)行分類、豐富玩家畫像,從而更加精準(zhǔn)地為玩家推薦志趣相投的好友、匹配實(shí)力相當(dāng)?shù)膶?duì)手,為玩家?guī)?lái)更好的游戲體驗(yàn)。
?。?a href="http://www.nasamidwest.com/wechat/">河北小程序開(kāi)發(fā))
小米應(yīng)用商店發(fā)布消息稱 持續(xù)開(kāi)展“APP 侵害用戶權(quán)益治理”系列行動(dòng) 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線 加速數(shù)字技術(shù)在實(shí)體經(jīng)濟(jì)中的落地和應(yīng)用 11:34:49
樂(lè)視回應(yīng)還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購(gòu)物車擴(kuò)展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺(tái)推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區(qū)分公司 09:53:13