国产微拍一区二区三区四区,亚洲欧美一区二区三区四区,黄色网址国产,动漫精品视频一区二区三区,免费人与牲口做爰视频,亚洲精品久久久久久一区,欧美槡BBBB槡BBB少妇,国产精品99,亚洲日韩国产制服在线

<li id="zhdjo"></li>

<center id="zhdjo"></center>

Internet Develppment

互聯(lián)網(wǎng)開發(fā)& 推廣服務(wù)提供商

首頁微信與小程序網(wǎng)站開發(fā) 網(wǎng)站模板客戶案例新聞中心聯(lián)系我們城市

我們擅長商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。

歡迎瀏覽我們的案例。

首頁 > 新聞中心 > 新聞動態(tài) > 正文

阿里達(dá)摩院謝宣松：跨媒體、跨技術(shù)是視覺智能的發(fā)展方向

發(fā)布時(shí)間：2020-02-11 09:38:02來源：36氪

　　視覺智能，這門研究如何使機(jī)器“看”的科學(xué)，近年來隨著深度學(xué)習(xí)、大規(guī)模數(shù)據(jù)處理能力及云基礎(chǔ)設(shè)施的迅猛發(fā)展，逐步應(yīng)用到各行各業(yè)中，發(fā)揮著越來越大的作用。

　　近來，為了控制病毒的傳播，多地政府要求市民出入公共場所必須戴口罩。為了幫助工作人員防控疫情，阿里云緊急在 48 小時(shí)內(nèi)上線口罩檢測技術(shù)，該技術(shù)可以識別人員是否佩戴口罩，對機(jī)場、火車站、地鐵等公共場所的衛(wèi)生安全檢測和實(shí)時(shí)預(yù)警，大大緩解了人員壓力。該技術(shù)的快速推出得益于阿里云視覺智能開放平臺(以下簡稱：“開放平臺”)所提供的原子能力。

　　開放平臺將阿里巴巴視覺智能技術(shù)實(shí)踐經(jīng)驗(yàn)開放給視覺應(yīng)用的開發(fā)者與用戶，讓他們可以在阿里云視覺平臺上選擇相關(guān)能力，自行封裝產(chǎn)品、服務(wù)或者是解決方案滿足自身或者最終用戶的應(yīng)用需求。平臺由阿里巴巴集團(tuán)技術(shù)委員會視覺技術(shù)小組和戰(zhàn)略合作部牽頭，達(dá)摩院聯(lián)合阿里云產(chǎn)品與解決方案管理部以及集團(tuán)各個(gè)視覺技術(shù)團(tuán)隊(duì)一起創(chuàng)建，于 2019 年 12 月，完成了公測上線。

　　該平臺也正在積極吸引更多的用戶，正與阿里云開放平臺、阿里云異構(gòu)計(jì)算、NVIDIA 聯(lián)合舉辦 AI 挑戰(zhàn)賽，讓用戶免費(fèi)體驗(yàn)視覺智能平臺相關(guān)能力。

　　就此，36 氪于近日專訪了阿里巴巴機(jī)器智能技術(shù)實(shí)驗(yàn)室資深算法專家、阿里云視覺智能開放平臺負(fù)責(zé)人謝宣松(星瞳)，和他聊了聊這一開放平臺的產(chǎn)品邏輯，以及達(dá)摩院在視覺智能技術(shù)的思考。

　　以下是對話(經(jīng)編輯)：

　　01.

　　談達(dá)摩院：既求先進(jìn)，又務(wù)實(shí)

　　36 氪：作為阿里前沿技術(shù)探索的核心陣地，達(dá)摩院有著怎樣具體的定位?

　　謝宣松：2017 年，達(dá)摩院成立。成立初期，外界多認(rèn)為達(dá)摩院可能只會做一些特別前沿、特別基礎(chǔ)、不那么落地的研究。但其實(shí)達(dá)摩院也有務(wù)實(shí)的一面，也一定程度遵從一個(gè)大的策略：“以市場為導(dǎo)向的，以產(chǎn)品為核心，以技術(shù)為基礎(chǔ)”。達(dá)摩院它不是一個(gè)孤立的個(gè)體，也是屬于阿里巴巴的一部分。阿里對達(dá)摩院也有兩方面的考慮，一是希望業(yè)務(wù)在達(dá)摩院技術(shù)加持下走得更快，相當(dāng)于提升業(yè)務(wù)的一些核心競爭力。另外一個(gè)，是希望達(dá)摩院的本身能夠走得更遠(yuǎn)，主要體現(xiàn)其愿景實(shí)現(xiàn)和基礎(chǔ)技術(shù)競爭力的優(yōu)勢建設(shè)上。

　　達(dá)摩院在阿里體系中還是有它獨(dú)特的定位。研發(fā)上，達(dá)摩院既會做一些影響力更深遠(yuǎn)的事情，也能做業(yè)務(wù)落地支持型的產(chǎn)品?，F(xiàn)在，達(dá)摩院也越來越強(qiáng)調(diào)和其他部門的聯(lián)合作戰(zhàn)。達(dá)摩院會更關(guān)注做“深的能力”，即做到極致效果、有影響力的事;同時(shí)又會做“寬的能力”，即在各行各業(yè)做出更多案例?？偟膩碚f，達(dá)摩院既要為阿里云提供技術(shù)加持，也要做好阿里集團(tuán)內(nèi)部系統(tǒng)基礎(chǔ)性的工作。

　　36 氪：達(dá)摩院推出這一開放平臺的目的是什么?

　　謝宣松：首先整個(gè)阿里巴巴集團(tuán)有上千名開發(fā)人員圍繞著視覺技術(shù)在電子商務(wù)、城市大腦、金融支付、交通物流、通信會議、新零售、文娛等多個(gè)行業(yè)的應(yīng)用需求，對外貢獻(xiàn)了許多產(chǎn)品和解決方案，這其中沉淀了諸多視覺基礎(chǔ)“原子能力”，即底層能力。同時(shí)，阿里巴巴的許多內(nèi)部業(yè)務(wù)，如淘寶、天貓、支付寶、優(yōu)酷等諸多明星產(chǎn)品都有視覺能力在背后的支持有著海量的用戶規(guī)模，對這些視覺智能技術(shù)能力進(jìn)行了千錘百煉。

　　但此前阿里云沒有一個(gè)統(tǒng)一的入口和品牌，將這些基礎(chǔ)能力統(tǒng)一集合起來。于是，我們便決定建立一個(gè)平臺。

　　這個(gè)平臺首先是一個(gè)視覺智能核心零部件的供給庫。這些零件有自營的，即阿里巴巴團(tuán)隊(duì)自己研發(fā)的;也有第三方供應(yīng)商的，即生態(tài)伙伴或者其他相關(guān)人士提供的。其次，開放平臺也是一個(gè)效率工具，有著大量的場景案例，可以幫助開發(fā)人員更高效開發(fā)落地產(chǎn)品。開放平臺是雙向的，內(nèi)部和外部都可以使用，對外主要面向視覺智能技術(shù)的開發(fā)與應(yīng)用用戶，為其提供好用、易用、普惠的視覺智能 API 服務(wù)，幫助企業(yè)、開發(fā)者快速建立視覺智能技術(shù)的應(yīng)用能力。

　　總結(jié)起來，該平臺有這么幾個(gè)特點(diǎn)：一是專業(yè)，達(dá)摩院科學(xué)家及集團(tuán)專業(yè)工程師加持;二是實(shí)用，上線的視覺技術(shù)是通過阿里巴巴海量場景和最佳案例檢驗(yàn)的;三是全面，平臺集合了規(guī)?；?、多樣化、場景化的視覺 AI 能力，為開發(fā)者和用戶提供一站式能力選擇;四是易用，依托阿里云智能堅(jiān)實(shí)的基礎(chǔ)設(shè)施服務(wù)，提供普惠易用標(biāo)準(zhǔn)的 AI 能力，用起來省心省力。即有硬實(shí)力，又有軟實(shí)力。

　　36 氪：開放平臺中集成了哪些類型原子能力?這樣的分類基于怎樣的邏輯?

　　謝宣松：開放平臺將圍繞以多個(gè)視覺智能的主要類目不斷為用戶提供多種視覺 AI 原子能力，包括：圖像識別、文字識別、視頻理解等多種視覺基礎(chǔ)技術(shù)。

　　主要是從三個(gè)維度去分：一是業(yè)務(wù)維度，比如一些剛需場景，包括文字識別、商品理解、內(nèi)容審核等;二是從技術(shù)角度分，比如識別類、檢測類、分割類、增強(qiáng)生產(chǎn)類，這些主要針對一些通用場景;三是針對特定的長尾場景。

　　36 氪：開放平臺如何收費(fèi)?

　　謝宣松：這就要說到我們產(chǎn)品普惠化的特點(diǎn)，在目前已經(jīng)公開的產(chǎn)品中，我們采取了一些免費(fèi)的策略。這些免費(fèi)策略根據(jù)輸出的“能力”的不同而不同，比如有的是根據(jù)用量，有的按 QPS 多少，這些我們都給予一定程度上的免費(fèi)額度，基本能滿足一些要求不高的用戶。

　　但 AI 既要做普惠，也要考慮商業(yè)化盈利策略，這樣才能讓平臺能夠持久運(yùn)營下去。這就要求我們有合理的商業(yè)化策略，也就是找到普惠和商業(yè)化之間的平衡點(diǎn)。好在平臺上的原子能力是多樣化的，所以這個(gè)平臺也能有比較融合和多樣化的商業(yè)策略，這也是我們正在探索的。

　　02.

　　談 AI：跨媒體、跨技術(shù)的應(yīng)用是值得關(guān)注的新方向

　　36 氪：您提到了普惠 AI，您怎么定義?

　　謝宣松：首先普惠的話并不是等于免費(fèi)，這是兩個(gè)不同的概念，當(dāng)然免費(fèi)可能是符合普惠的一個(gè)特點(diǎn)。主要可以從幾個(gè)維度來看，第一是用戶進(jìn)入使用 AI 的成本門檻降低;二是用戶使用感受是省時(shí)、省力、易用的;三是使用 AI 獲得的收益相對付出的成本來說更高。

　　36 氪：1 月初，達(dá)摩院發(fā)布了 2020 年十大技術(shù)趨勢的預(yù)測，第一條是“人工智能從感知智能向認(rèn)知智能演進(jìn)”。視覺智能要從感知智能走向認(rèn)知智能有哪些需要突破的點(diǎn)?

　　謝宣松：我想從感知到認(rèn)知的變化，不是一個(gè)簡單的更進(jìn)一步，有著豐富的涵義：

　　一是從理解到思考的能力;目前的 AI 在識別理解世界上做得比較多，但是下一步的聯(lián)想推理、生產(chǎn)輸出怎么做，就做得比較少，而這些正是認(rèn)知智能需要具備的。

　　二是從數(shù)據(jù)到知識的能力;因?yàn)楝F(xiàn)在感知層面的模型，更多的是數(shù)據(jù)在不同維度空間的映射，但是數(shù)據(jù)之間關(guān)聯(lián)、推理依據(jù)和模型本身的可解釋性都不是那么成熟。

　　三是成本和落地的能力;目前的 AI 大多時(shí)候都是強(qiáng)數(shù)據(jù)驅(qū)動，不同功能、不同場景所需要數(shù)據(jù)不一樣，就需要再次進(jìn)行大量數(shù)據(jù)處理，在少樣本學(xué)習(xí)、能力遷移、跨域應(yīng)用上，沒有辦法做到低成本和泛化，因而很難做到快速推廣落地。

　　36 氪：視覺智能要從感知智能走向認(rèn)知智能有哪些需要突破的點(diǎn)?

　　謝宣松：而視覺智能要從感知到認(rèn)知這個(gè)角度來看，我覺得至少要做三件事：

　　一是視覺算法本身的突破，以前的大部分的視覺智能的算法是識別分類算法方面做得比較好，要向認(rèn)知智能演進(jìn)，可能需要在決策推理、生成強(qiáng)化等技術(shù)要點(diǎn)進(jìn)行突破，來拓展機(jī)器自主變化和輸出決策的能力。

　　二是橫向技術(shù)的打通;到認(rèn)知智能層面，知識是非常重要的要素，AI 在具體細(xì)分行業(yè)的應(yīng)用落地將會更加深入，如何將細(xì)分場景的數(shù)據(jù)抽象成知識，知識又如何抽象形成框架性的東西都是需要進(jìn)一步攻克的。此外，視覺、NLP、圖譜等技術(shù)的橫向拉通，對于認(rèn)知智能的形成也非常重要，這里的 NLP 不是專指人的自然語言，更多的是指機(jī)器能夠理解的知識邏輯，也許可以叫 MLP。

　　三是工程系統(tǒng)能力的增強(qiáng);深度學(xué)習(xí)之所以可以在目前階段實(shí)現(xiàn)大規(guī)模的落地，是因?yàn)樗懔?、?shù)據(jù)以及工程化都已經(jīng)達(dá)到可控可用的狀態(tài)。同理，從感知演進(jìn)認(rèn)知，同樣的工程系統(tǒng)和效率工具也需要向前演進(jìn)，比如大規(guī)模的圖計(jì)算工程框架，否則認(rèn)知智能的規(guī)模化落地是空談。

　　36 氪：您認(rèn)為哪些細(xì)分場景和方向可能會更早實(shí)現(xiàn)計(jì)算機(jī)視覺的認(rèn)知智能落地?謝宣松：我不好做具體的預(yù)測。但是，可以按照一定的邏輯進(jìn)行分析。一般來說，能夠在實(shí)際落地當(dāng)中，特別好或者特別快地解決矛盾的方案和方向，會發(fā)展得更快一些。比方說從“數(shù)據(jù)、算法、算力”這經(jīng)典的三要素來看落地，首先，當(dāng)一個(gè)行業(yè)它的數(shù)字化程度高時(shí)，數(shù)據(jù)體系也會相對完善;其次，在算法層面來說，視覺智能起到的是核心作用;最后，這一場景智能驅(qū)動力特別強(qiáng)，有創(chuàng)新的機(jī)會且能賺錢，有足夠的資源投入。能同時(shí)滿足以上三點(diǎn)的條件的行業(yè)機(jī)會更大。

　　36 氪：在視覺智能領(lǐng)域，有哪些值得關(guān)注的新方向?

　　謝宣松：不難發(fā)現(xiàn)，大部分視覺智能團(tuán)隊(duì)做的都是識別檢測相關(guān)的事情，這很合乎邏輯，因?yàn)槿艘彩窍日J(rèn)識理解世界，才談得上生產(chǎn)改造世界。但是，還有一些跨領(lǐng)域、跨媒體、跨技術(shù)的非純粹理解方向的技術(shù)應(yīng)用成熟度還不那么高，比如說生產(chǎn)類、增強(qiáng)類的視覺智能， 2D 和 3D 融合、全 3D 圖像、圖形學(xué)和視覺算法相融合、從靜態(tài)到動態(tài)的技術(shù)。

　　從人本身的角度來進(jìn)一步抽象一下，視覺技術(shù)發(fā)展方向也有脈絡(luò)可循：一是維度上從低維到高維(2D 到 2D+T 再到 3D 再到 3D+T)，二是從離人近的到離人遠(yuǎn)的(如到文字商品再到自然萬物)，三是從粗到細(xì)(比如整體識別到定位再到精細(xì)識別)，四是從理解到生成，五是從自然圖到抽象圖，最后是，核心行業(yè)應(yīng)用到各行各業(yè)。

　　拿具體的例子來說，比如 2019 年突然“火”了的換臉軟件、數(shù)字虛擬人像、2D 圖像生成 3D 模型、自動服裝設(shè)計(jì)等就用到了 2D 和 3D 融合、從靜態(tài)圖像到動態(tài)畫面等技術(shù)。盡管這些技術(shù)目前應(yīng)用的并不是成熟，但卻是未來數(shù)字世界與現(xiàn)實(shí)世界進(jìn)一步交互，不可缺少的重要技術(shù)。

　　我們正在做一個(gè)智能服裝設(shè)計(jì)產(chǎn)品就可以很好地詮釋這一趨勢。它背后技術(shù)路線就是，將現(xiàn)在海量 2D 圖像信息，用技術(shù)手段變成 3D 的東西。然后在生成 3D 后再繼續(xù)生成各種各樣的拓展。比如，再利用物理模擬手段，把這些服裝放到一個(gè)數(shù)字人身上，然后去展現(xiàn)衣服真實(shí)的物理質(zhì)感等，視覺上很難去感覺出區(qū)別了。進(jìn)而，虛擬的衣服可以進(jìn)一步用于數(shù)字化營銷的廣告、虛擬數(shù)字秀場等，而且這一虛擬的 3D 衣服還能回到生產(chǎn)線上，由虛擬走向物理世界。

　　另外，隨著其它基礎(chǔ)設(shè)施或者環(huán)境的變換，也會帶一些新的方向，比如 5G，比如當(dāng)前新冠肺炎引發(fā)的在線辦公和教育行業(yè)，這些就不細(xì)述了。
　?。?a href="http://www.nasamidwest.com">邯鄲網(wǎng)站建設(shè)）

阿里巴巴發(fā)布二十條商家...

巴西發(fā)力，想要成為世界...

熱點(diǎn)推薦

最新資訊

? 2018 河北碼上網(wǎng)絡(luò)科技有限公司版權(quán)所有冀ICP備18021892號-1

? 2018 河北碼上科技有限公司版權(quán)所有.

聯(lián)系電話

手機(jī)18931099002
官方微信
返回頂部