国产微拍一区二区三区四区,亚洲欧美一区二区三区四区,黄色网址国产,动漫精品视频一区二区三区,免费人与牲口做爰视频,亚洲精品久久久久久一区,欧美槡BBBB槡BBB少妇,国产精品99,亚洲 日韩 国产 制服 在线

Internet Develppment
互聯(lián)網(wǎng)開(kāi)發(fā)& 推廣服務(wù)提供商

我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

Meta第二代自研AI芯投產(chǎn),擺脫英偉達(dá)依賴!為買H100小扎狂砸數(shù)百億美元

發(fā)布時(shí)間:2024-02-03 09:19:03來(lái)源:網(wǎng)易科技

  Meta第二代自研AI芯片Artemis,今年正式投產(chǎn)!

  據(jù)悉,新的芯片將被用于數(shù)據(jù)中心的推理(Inference)任務(wù),并與英偉達(dá)等供應(yīng)商的GPU一起協(xié)同工作。

  對(duì)此,Meta的發(fā)言人表示:「我們認(rèn)為,我們自主開(kāi)發(fā)的加速器將與市面上的GPU相得益彰,為Meta的任務(wù)提供最佳的性能與效率平衡?!?/p>

  除了更高效地運(yùn)行的推薦模型外,Meta還需要為自家的生成式AI應(yīng)用,以及正在訓(xùn)練的GPT-4開(kāi)源競(jìng)品Llama 3提供算力。

  Meta的AI貼紙功能,此前在Messenger、Instagram和WhatsApp上都處于測(cè)試階段

  OpenAI工程師Jason Wei在Meta的一次AI活動(dòng)中聽(tīng)到,Meta現(xiàn)在有足夠的算力來(lái)訓(xùn)練Llama 3和4。Llama 3計(jì)劃達(dá)到GPT-4的性能水平,但仍將免費(fèi)提供

  不難看出,Meta的目標(biāo)非常明確——在減少對(duì)英偉達(dá)芯片依賴的同時(shí),盡可能控制AI任務(wù)的成本。

  Meta成英偉達(dá)大客戶

  Meta CEO小扎最近宣布,他計(jì)劃到今年年底部署35萬(wàn)顆英偉達(dá)H100 GPU,總共將有約60萬(wàn)顆GPU運(yùn)行和訓(xùn)練AI系統(tǒng)。

  這也讓Meta成為了繼微軟之后,英偉達(dá)最大的已知客戶。

  小扎表示,目前Meta內(nèi)部正在訓(xùn)練下一代模型Llama 3。

  在35萬(wàn)塊H100上訓(xùn)練的Llama 3,無(wú)法想象會(huì)有多大!

  Omdia的研究數(shù)據(jù)顯示,Meta在2023年H100的出貨量為15萬(wàn)塊,與微軟持平,且是其他公司出貨量的3倍。

  小扎稱,「如果算上英偉達(dá)A100和其他AI芯片,到2024年底,Meta將擁有近60萬(wàn)個(gè)GPU等效算力」。

  性能更強(qiáng)、尺寸更大的模型,導(dǎo)致更高的AI工作負(fù)載,讓成本直接螺旋式上升。

  據(jù)《華爾街日?qǐng)?bào)》的一位匿名人士稱,今年頭幾個(gè)月,每有一個(gè)客戶,微軟每月在Github Copilot上的損失就超過(guò)20美元,甚至某些用戶每月的損失高達(dá)80美元,盡管微軟已經(jīng)向用戶收取每月10美元的費(fèi)用。

  之所以賠錢,是因?yàn)樯纱a的AI模型運(yùn)行成本高昂。 如此高的成本,讓大科技公司們不得不尋求別的出路。

  除了Meta之外,OpenAI和微軟也在試圖打造自己專有的AI芯片以及更高效的模型,來(lái)打破螺旋式上升的成本。

  此前外媒曾報(bào)道,Sam Altman正計(jì)劃籌集數(shù)十億美元,為OpenAI建起全球性的半導(dǎo)體晶圓廠網(wǎng)絡(luò),為此他已經(jīng)在和中東投資者以及臺(tái)積電談判

  專為大模型定制AI芯

  去年5月,Meta首次展示了最新芯片系列——「Meta訓(xùn)練和推理加速器」(MTIA),旨在加快并降低運(yùn)行神經(jīng)網(wǎng)絡(luò)的成本。

  MTIA是一種ASIC,一種將不同電路組合在一塊板上的芯片,允許對(duì)其進(jìn)行編程,以并行執(zhí)行一項(xiàng)或多項(xiàng)任務(wù)。

  內(nèi)部公告稱,Met首款芯片將在2025年投入使用,同時(shí)數(shù)據(jù)中心開(kāi)啟測(cè)試。不過(guò),據(jù)路透社報(bào)道,Artemis已經(jīng)是MTIA的更高級(jí)版本。

  其實(shí),第一代的MITA早就從2020年開(kāi)始了,當(dāng)時(shí)MITA v1采用的是7nm工藝。

  該芯片內(nèi)部?jī)?nèi)存可以從128MB擴(kuò)展到128GB,同時(shí),在Meta設(shè)計(jì)的基準(zhǔn)測(cè)試中,MITA在處理中低復(fù)雜度的AI模型時(shí),效率要比GPU還高。

  在芯片的內(nèi)存和網(wǎng)絡(luò)部分,Meta表示,依然有不少工作要做。

  隨著AI模型的規(guī)模越來(lái)越大,MITA也即將遇到瓶頸,因此需要將工作量分擔(dān)到多個(gè)芯片上。

  當(dāng)時(shí),Meta團(tuán)隊(duì)還設(shè)計(jì)了第一代MTIA加速器,同樣采用臺(tái)積電7nm,運(yùn)行頻率為800MHz,在INT8精度下提供102.4 TOPS,在FP16精度下提供51.2 TFLOPS。它的熱設(shè)計(jì)功耗(TDP)為25W。

  2022年1月,Meta還推出了超算RSC AI,并表示要為元宇宙鋪路。RSC包含2000個(gè)英偉達(dá)DGX A100系統(tǒng),16000個(gè)英偉達(dá)A100 GPU。

  這款超算與Penguin Computing、英偉達(dá)和Pure Storage合作組裝,目前已完成第二階段的建設(shè)。

 

最新資訊
? 2018 河北碼上網(wǎng)絡(luò)科技有限公司 版權(quán)所有 冀ICP備18021892號(hào)-1   
? 2018 河北碼上科技有限公司 版權(quán)所有.