最近,“端到端”在車(chē)圈火了!特斯拉基于“端到端”的FSDV12(完全自動(dòng)駕駛)方案形成的標(biāo)桿示范效應(yīng),疊加入華傳聞,帶動(dòng)“蔚小理”等車(chē)企和華為、地平線等服務(wù)商紛紛轉(zhuǎn)向,加碼端到端自動(dòng)駕駛技術(shù)。
所謂“端到端”,其實(shí)是來(lái)自深度學(xué)習(xí)中的概念,英文為“End—to—End(E2E)”,指通過(guò)一個(gè)AI模型,只要輸入原始數(shù)據(jù)就可以輸出最終結(jié)果。應(yīng)用到自動(dòng)駕駛領(lǐng)域,意味著只需要一個(gè)模型,就能把攝像頭、毫米波雷達(dá)、激光雷達(dá)等傳感器收集到的感知信息,轉(zhuǎn)換成車(chē)輛方向盤(pán)的轉(zhuǎn)動(dòng)角度、加速踏板的踩踏深度以及制動(dòng)的力度等具體操作指令,讓汽車(chē)實(shí)現(xiàn)自動(dòng)駕駛。用小鵬汽車(chē)創(chuàng)始人何小鵬的說(shuō)法,表現(xiàn)得“很絲滑”,更像“人類(lèi)司機(jī)駕駛”。
此前,市面上絕大部分自動(dòng)駕駛系統(tǒng)為傳統(tǒng)模塊化方式,即一個(gè)人工和智能兩分天下的混搭系統(tǒng):感知依靠神經(jīng)網(wǎng)絡(luò),規(guī)劃控制則使用人類(lèi)手動(dòng)設(shè)計(jì)的算法。這一系統(tǒng)的好處在于分工明確,發(fā)現(xiàn)缺陷便于分模塊檢查、解決。但問(wèn)題是,這種模塊化的自動(dòng)駕駛系統(tǒng)在相對(duì)簡(jiǎn)單的駕駛?cè)蝿?wù)上表現(xiàn)不錯(cuò),而在復(fù)雜的駕駛?cè)蝿?wù)面前,其天花板顯而易見(jiàn)。就算是號(hào)稱(chēng)遙遙領(lǐng)先的城市高階智駕功能,依然會(huì)有機(jī)械感,也會(huì)在匯入快速路、通過(guò)大型路口時(shí)宕機(jī)。
考慮到自動(dòng)駕駛的核心挑戰(zhàn)是解決無(wú)窮無(wú)盡的邊緣場(chǎng)景,以有限人力解決無(wú)限長(zhǎng)尾問(wèn)題的成本和時(shí)間難以估量,數(shù)據(jù)化、模型化成為必然趨勢(shì)。不過(guò),端到端,同樣是一個(gè)需要老師傅精心打磨的高難度技術(shù)活。
一方面,端到端需要海量高質(zhì)量數(shù)據(jù)“投喂”訓(xùn)練。與大語(yǔ)言模型可以在互聯(lián)網(wǎng)上爬取海量文字?jǐn)?shù)據(jù)用于訓(xùn)練不同,端到端智駕需要的視頻數(shù)據(jù)獲取成本和難度極高。以特斯拉為例,目前其FSD累計(jì)學(xué)習(xí)的人類(lèi)駕駛視頻片段超過(guò)2000萬(wàn)個(gè),而這一規(guī)模的數(shù)據(jù)僅采集成本就需要50億元至80億元。
另一方面,端到端需要強(qiáng)大算力的支持。自動(dòng)駕駛涉及激光雷達(dá)、圖像感知以及V2X車(chē)路協(xié)同等技術(shù)與解決方案。強(qiáng)大的算力不僅有利于實(shí)時(shí)處理海量數(shù)據(jù),降低數(shù)據(jù)傳輸延遲,還可更好地支持面向智慧城市、智慧交通、高級(jí)別自動(dòng)駕駛等全場(chǎng)景。然而,華為車(chē)BU、百度極越、蔚來(lái)、理想、吉利、長(zhǎng)城、小鵬等國(guó)內(nèi)企業(yè)算力增長(zhǎng)目前均面臨較大瓶頸。
問(wèn)題還在于,算力與數(shù)據(jù)的制約又會(huì)顯著影響算法的發(fā)展。雖然國(guó)內(nèi)學(xué)術(shù)界提出的端到端自動(dòng)駕駛模型UniAD斬獲2023年CPVR最佳論文獎(jiǎng),為國(guó)內(nèi)企業(yè)提供了可以參考的方向,但是在開(kāi)環(huán)驗(yàn)證體系、小體量樣本數(shù)據(jù)下開(kāi)發(fā)的UniAD,上車(chē)還需要一定時(shí)間的工程化改造和大規(guī)模數(shù)據(jù)訓(xùn)練。
此外,端到端會(huì)同時(shí)放大自動(dòng)駕駛系統(tǒng)的上限與下限。因?yàn)槎说蕉藰?gòu)建的是一個(gè)神經(jīng)網(wǎng)絡(luò)黑箱,在獲取更高上限的過(guò)程中讓渡了一部分傳統(tǒng)模塊方案具備的可解釋性。如何在自動(dòng)駕駛系統(tǒng)中保留可解釋性,將那些不應(yīng)被逾越的規(guī)則,比如別闖紅燈,表征到神經(jīng)網(wǎng)絡(luò)中去,保證端到端能安全地落地應(yīng)用、進(jìn)化,也將是規(guī)控工程師們的重要課題。
攀登珠峰有兩條路線:一條是中國(guó)西藏的北坡,另一條是尼泊爾的南坡。不管選擇從南坡還是從北坡攀登,最終都將到達(dá)同一個(gè)頂峰。這與當(dāng)前自動(dòng)駕駛的發(fā)展路徑有相似之處。雖然現(xiàn)在還很難判定端到端就是自動(dòng)駕駛的最優(yōu)解或最終解,但這并不妨礙企業(yè)創(chuàng)新探索。畢竟端到端能夠比傳統(tǒng)模塊化方式更好地處理極端案例,并且代表了一種減少人工編碼依賴(lài)的更高效的思路;谶@個(gè)路徑,或許自動(dòng)駕駛能夠通往更高階段。(本文來(lái)源:經(jīng)濟(jì)日?qǐng)?bào) 作者:楊忠陽(yáng))