我們擅長商業(yè)策略與用戶體驗的完美結(jié)合。
歡迎瀏覽我們的案例。
9 月 17 日上午,在海南省??谑姓匍_的 2021 世界新能源汽車大會上,特斯拉首席執(zhí)行官埃隆·馬斯克通過視頻發(fā)言時表示,未來的自動駕駛可以通過視覺神經(jīng)網(wǎng)絡(luò)實現(xiàn),并且相比普通人駕駛有十倍以上的安全性。
近日,特斯拉向其搶先體驗車隊推出 FSD(Full-self Driving,完全自動駕駛)Beta V10 軟件。這是在特斯拉 AI Day 上發(fā)布最新應(yīng)用在自動駕駛上的視覺神經(jīng)網(wǎng)絡(luò)之后,技術(shù)上做了重要改進(jìn)的的純視覺自動駕駛方案新版本。
特斯拉 CEO 伊隆·馬斯克稱,有望在 9 月 25 日左右向所有特斯拉車主開放使用。
FSD Beta 10 的軟件版本號為 2021.24.15。在該版本軟件的支持下,特斯拉汽車能夠在高速公路和城市街道上虛擬駕駛,但它仍然被視為 L2 級駕駛員輔助駕駛,因為它需要駕駛員仍然對車輛負(fù)責(zé),將手放在方向盤上,并隨時準(zhǔn)備好控制。
在 Youtube(譯為“油管”,是目前全球最大的視頻搜索和分享平臺)上參與測試的用戶發(fā)布的針對性測試和路測結(jié)果來看,目前還有很多情景下會出現(xiàn)問題,一個最明顯的提升表現(xiàn)在駕駛中可視化用戶界面,越來越多的道路標(biāo)識和交通標(biāo)識物的識別走向細(xì)分化,但依然有部分道路標(biāo)志還不能準(zhǔn)確識別。
在近期的特斯拉人工智能日上,特斯拉 AI 負(fù)責(zé)人 Andrej Karpathy 和自動駕駛硬件高級總監(jiān) Ganesh Venkataramanan 介紹了純視覺自動駕駛系統(tǒng)與 FSD 軟件的最新成果,此前 5 月份,馬斯克曾發(fā)文表示,特斯拉最新版本的 FSD 將取消毫米波雷達(dá),采用純視覺感知方案。
在自動駕駛感知領(lǐng)域,有兩個明顯區(qū)別的路徑——純視覺派和激光雷達(dá)派,純視覺派認(rèn)為單純依靠攝像頭就可以完成自動駕駛所需要的周圍環(huán)境感知,特斯拉、極氪、百度都使用的是純視覺感知方案。激光雷達(dá)派則以激光雷達(dá)為主導(dǎo),配合毫米波雷達(dá)、超聲波傳感器、攝像頭多傳感器融合完成周圍環(huán)境感知,商湯 AR 小巴、小鵬 P5、蔚來 ET7 使用的是激光雷達(dá)方案。
商湯智能駕駛研發(fā)總監(jiān)李怡康在接受澎湃新聞采訪時表示,“無論是純視覺方案還是多傳感器融合的方案最終都是有可能實現(xiàn) L4 或 L5 級別的自動駕駛的,區(qū)別在于,引入激光雷達(dá)實際上是把問題變簡單了,因為我們引入了很多額外的信息,而且這些信息跟視覺很互補(bǔ),有些信息,比如深度,它可以估算地很準(zhǔn)確。假如最后兩條路徑都能實現(xiàn) L5 級自動駕駛,那我相信多傳感器融合這條路線可能會更快一些。當(dāng)然,感知只是決定自動駕駛是否實現(xiàn)的因素之一。”
特斯拉“純視覺派”技術(shù)路線:視覺神經(jīng)網(wǎng)絡(luò)
特斯拉人工智能與自動駕駛視覺總監(jiān) Andrej Karpathy 認(rèn)為,將激光雷達(dá)添加到自動駕駛堆棧會帶來其自身的復(fù)雜性。在 CVPR 2021 自動駕駛研討會上,Karpathy,“你必須用激光雷達(dá)預(yù)先繪制環(huán)境地圖,然后你必須創(chuàng)建一張高清地圖,你必須插入所有車道及其連接方式以及所有交通信號燈,收集、構(gòu)建和維護(hù)這些高清激光雷達(dá)地圖是不可擴(kuò)展的,讓這個基礎(chǔ)設(shè)施保持最新狀態(tài)將是極其困難的。”
Karpathy 表示特斯拉在其自動駕駛堆棧中不使用激光雷達(dá)和高清地圖,“發(fā)生的一切,都是第一次發(fā)生在車內(nèi),基于圍繞汽車的八個攝像頭的視頻”。
特斯拉汽車上安裝了 8 個攝像頭,攝像頭沒有深度信息,他們的目標(biāo)之一就是形成矢量空間視圖。那么要怎么知道旁邊一輛車究竟在哪里又有多長呢?
首先的一個難點是,不同視角的攝像頭都只能看到周邊環(huán)境的一部分,有不同的校準(zhǔn)(calibration)、位置(location)、取景方向(view direction)等,比如以下這張圖,誰能知道這個點對應(yīng)于相機(jī)視圖的哪個點?而我們只有知道這些信息,才能把周圍物體準(zhǔn)確放到向量空間視圖(vector space view)中。
因此就需要一種將多個攝像頭的信息融合在一起的技術(shù),特斯拉使用了在 2017 年提出,如今已經(jīng)席卷自然語言處理和計算機(jī)視覺領(lǐng)域的 Transformer 神經(jīng)網(wǎng)絡(luò)(Transformer Neural Network)。
然后則是加入有時間概念時間的 RNN(Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò))以判斷移動物體的速度以及對被遮擋物進(jìn)行預(yù)測。RNN 體現(xiàn)了“人的認(rèn)知是基于過往的經(jīng)驗和記憶”的觀點,通過記憶來處理任意時序的輸入序列,從而對接下來要發(fā)生的事情進(jìn)行預(yù)測。比如這里對被遮擋物預(yù)測,通過對遮擋前的特征和軌跡的記憶,使得視野被短暫遮蔽的情況下,依然可以預(yù)測遮擋視野后的物體運動軌跡,并記錄已行駛過的路段的各種路標(biāo)。
而對于深度信息,在缺少了雷達(dá)信息后,則需要通過對大量的有深度標(biāo)注的相機(jī)數(shù)據(jù)進(jìn)行訓(xùn)練得到的檢測算法來得到。
激光雷達(dá)多傳感器融合方案
激光雷達(dá)多傳感器方案是以激光雷達(dá)為主導(dǎo),毫米波雷達(dá)、超聲波傳感器及攝像頭作為輔助。通過激光雷達(dá)發(fā)射激光束,測量激光在發(fā)射及收回過程其中的時間差、相位差,從而確定車與物體之間的相對距離,實現(xiàn)環(huán)境實時感知及避障功能。攝像頭的價格在幾十美元左右,而激光雷達(dá)則要昂貴的多,這或許也是很多純視覺流派廠商一個沒有說的難言之隱。
商湯智能駕駛研發(fā)總監(jiān)李怡康向澎湃新聞介紹,“我們會做很多種傳感器的評測,去找到最適合我們設(shè)計需求的傳感器方案,然后通過自動化的算法將這些傳感器擺放到最合適的地方,從而實現(xiàn)最優(yōu)的環(huán)境信息獲取。傳感器之間是不在一個坐標(biāo)系下的,我們通過自動化標(biāo)定算法將不同傳感器的特性及相關(guān)關(guān)系非常準(zhǔn)確地找出來,然后設(shè)計融合感知模型,并用大量的感知數(shù)據(jù)去訓(xùn)練它,最終實現(xiàn)多傳感器融合感知。”
自動駕駛底層邏輯是感知、決策、執(zhí)行三個步驟的結(jié)合,對周圍環(huán)境的周密感知是所有決策的基礎(chǔ),也是自動駕駛汽車的安全保障。在了解周圍環(huán)境中物體的位置、速度和方向、路面的性質(zhì)、路緣石的位置、信號(交通、道路標(biāo)志)等之后,自動駕駛系統(tǒng)則要開始做計劃和控制:首先是其他移動物體在接下來的短時間會做什么,然后是根據(jù)整體計劃(比如規(guī)劃的通向目的地路線)計劃自己要做什么,最后就是告訴汽車要做什么。
?。?a href="http://www.nasamidwest.com/wechat/">邯鄲小程序開發(fā))
小米應(yīng)用商店發(fā)布消息稱 持續(xù)開展“APP 侵害用戶權(quán)益治理”系列行動 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線 加速數(shù)字技術(shù)在實體經(jīng)濟(jì)中的落地和應(yīng)用 11:34:49
樂視回應(yīng)還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購物車擴(kuò)展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區(qū)分公司 09:53:13