国产微拍一区二区三区四区,亚洲欧美一区二区三区四区,黄色网址国产,动漫精品视频一区二区三区,免费人与牲口做爰视频,亚洲精品久久久久久一区,欧美槡BBBB槡BBB少妇,国产精品99,亚洲 日韩 国产 制服 在线

Internet Develppment
互聯(lián)網(wǎng)開發(fā)& 推廣服務(wù)提供商

我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

Meta 發(fā)布 AI 模型SeamlessM4T,可轉(zhuǎn)錄和翻譯近100種語(yǔ)言

發(fā)布時(shí)間:2023-08-24 09:56:07來源:鈦媒體

  科技巨頭 Facebook 母公司 Meta 對(duì)外發(fā)布了一款最新人工智能(AI)翻譯引擎 SeamlessM4T,可以更輕松地跨文本語(yǔ)音翻譯和轉(zhuǎn)錄近 100 種語(yǔ)言。

  同時(shí),Meta 還公布了新的開源翻譯數(shù)據(jù)集 SeamlessAlign,將 44.3 萬小時(shí)的語(yǔ)音與文本、2.9 萬小時(shí)的語(yǔ)音轉(zhuǎn)錄數(shù)據(jù)進(jìn)行對(duì)齊,教會(huì) SeamlessM4T 如何將語(yǔ)音轉(zhuǎn)錄為文本、翻譯文本、從文本生成語(yǔ)音。

  Meta 表示,SeamlessM4T 將與 SeamlessAlign 一同開源。SeamlessM4T 代表了 AI 技術(shù)驅(qū)動(dòng)的“語(yǔ)音到語(yǔ)音”和“語(yǔ)音到文本”領(lǐng)域的“重大突破”。


圖片來自網(wǎng)絡(luò)/侵刪

  據(jù)悉,作為最早投資 AI 的大型科技企業(yè)之一,Meta 于 2013 年成立了 AI 基礎(chǔ)研究實(shí)驗(yàn)室,聘請(qǐng)了 AI 領(lǐng)域的頂級(jí)學(xué)者,有大量社交與元宇宙算法,推出 Pytorch 框架、Zion 等軟硬件產(chǎn)品。不過,雖然 Meta 在 AI 領(lǐng)域也取得了一些進(jìn)展,但它落后于 OpenAI、微軟、谷歌等公司。

  隨著 ChatGPT 風(fēng)靡全球,Meta AI 團(tuán)隊(duì)正在加緊追趕,以及重新組合其關(guān)于語(yǔ)言、對(duì)話等領(lǐng)域與大模型相關(guān)的研究。

  去年底之后,Meta 陸續(xù)發(fā)布 No Language Left Behind(不留語(yǔ)言)文本到文本的機(jī)器翻譯模型,支持 200 種語(yǔ)言,以及開發(fā)多語(yǔ)言數(shù)據(jù)集 SpeechMatrix、生成文本到聲音的 AudioCraft 等。另外在今年 7 月,Meta 還發(fā)布開源對(duì)話大模型 Llama 2,引發(fā)廣泛討論和關(guān)注。

  此次公布的 SeamlessM4T,建立在 Meta AI 翻譯模型的技術(shù)能力基礎(chǔ)上,并重新設(shè)計(jì) Fairseq 序列建模工具包,以創(chuàng)建更輕量級(jí)的模型和處理更多信息。Meta 表示,SeamlessM4T 從“爬取的網(wǎng)頁(yè)數(shù)據(jù)的公開可用存儲(chǔ)庫(kù)中”收集了 400 萬小時(shí)的“原始音頻”,該模型可以在近 100 種語(yǔ)言之間進(jìn)行文本到語(yǔ)音的翻譯,并支持 35 種語(yǔ)言的完全語(yǔ)音到語(yǔ)音翻譯。

  對(duì)于安全性和脫敏性,Meta 表示,在開發(fā) SeamlessM4T 時(shí),團(tuán)隊(duì)構(gòu)建了一個(gè)可以識(shí)別敏感詞系統(tǒng),目標(biāo)是能夠過濾了訓(xùn)練數(shù)據(jù)中不平衡的數(shù)據(jù)信息,從而檢測(cè)和輸出正確的翻譯內(nèi)容。而且,Meta 研究人員還嘗試清理誤譯一些臟話的數(shù)據(jù)集,以便更準(zhǔn)確地檢測(cè)何時(shí)使用。

  Meta 研究科學(xué)家負(fù)責(zé)人 Paco Guzman 表示,SeamlessM4T 的一大突破是它不依賴中間模型來產(chǎn)生結(jié)果,這使得它更加靈活,甚至支持動(dòng)態(tài)更改語(yǔ)言。這將促進(jìn)更多人使用其進(jìn)行日程對(duì)話。

  不過,Meta 建議不要使用 SeamlessM4T 進(jìn)行長(zhǎng)篇翻譯,政府專用的認(rèn)證翻譯,以及不鼓勵(lì)出于醫(yī)療或法律目的部署該模型,原因或與專業(yè)領(lǐng)域的翻譯準(zhǔn)確度有關(guān)??萍季W(wǎng)站《對(duì)話》(theconversation)最近表示,AI 翻譯有許多缺陷,包括不同形式的性別錯(cuò)誤和偏見、語(yǔ)音識(shí)別算法偏差等。

  據(jù)報(bào)道稱,Meta 后續(xù)將把這些翻譯和轉(zhuǎn)錄方面的 AI 進(jìn)展,整合到 Facebook、Instagram、WhatsApp、Messenger 和 Threads 等產(chǎn)品當(dāng)中。
 ?。?a href="http://www.nasamidwest.com">邯鄲小程序)

最新資訊
? 2018 河北碼上網(wǎng)絡(luò)科技有限公司 版權(quán)所有 冀ICP備18021892號(hào)-1   
? 2018 河北碼上科技有限公司 版權(quán)所有.