當前位置: 首頁 文章

特斯拉、Momenta合流闖進Robotaxi衛冕之戰

智能相對論-太平洋號
智能和車,邊評邊測;未來和家,且品且鑒。
+ 關注
AI選車專家

文 | 智能相對論

作者 | 海怪

2025年4月,工信部的一紙公告,讓炙熱的智駕行業開始了一場“集體正名”運動。

一夜之間,原本行業常用的“高階智駕”、“智能駕駛”、“零接管"等行業熱詞打回到本來面目:組合駕駛輔助或輔助駕駛。

(國際汽車工程師學會的自動駕駛分級)

過去的十年,智駕行業狂飆突進,理性與夢想齊飛,野心與煎熬并存。當下,在2025智駕淘汰賽和強力監管之下,所有智駕玩家,概念拉齊,剩下只看實力——裸泳者出局,喧囂者閉嘴,長跑者勝出。

引發智駕行業這場“正名”的“始作俑者”,正是今年剛剛將FSD功能引入中國市場的特斯拉。2013年,特斯拉在與谷歌無人車的一場早期合作中,馬斯克提出了Autopilot的構想,即將一個用于航空業的“自動駕駛儀”的概念應用到全新的自動駕駛領域。

Autopilot對行業影響深遠。至今我們在車企宣傳中看到的NOA(領航輔助駕駛),其中A就是Autopilot的簡寫。所以,Autopilot概念有著很強的前瞻性,能夠很好描述這種機器自主操控同時人類隨時監管的狀態。但它字面意義上又極具迷惑性,使得普通人很容易將其當做完全自動駕駛來使用,以至于此后引發了多起事故悲劇。

谷歌和特斯拉短暫合作過后,雙方很快分道揚鑣。谷歌開始專注完全無人的L4自動駕駛,瞄準Robotaxi市場,而特斯拉則面向乘用車市場,提供面向駕駛員的L2駕駛輔助。

特斯拉的邏輯是,通過量產輔助駕駛的數據推動軟件算法的迭代升級,以遠比L4更低的成本來逐步實現自動駕駛。而前谷歌自動駕駛技術負責人Chris Urmson后面則暗諷:輔助駕駛想要實現無人駕駛,就跟一個不斷練習跳高的人終有一天可以飛起來一樣(不可能)。

2016年,特斯拉發布了FSD智駕套件,FSD字面意思為完全自動駕駛。這是一個更具迷惑性的名字。但其實,FSD一直以來都只是其智駕硬件的代名詞。直到今天,特斯拉FSD的實質仍然是L2輔助駕駛級別,仍然強調其Supervised(人駕監督)的性質。所以,今年3月底,積極推動FSD入華的特斯拉便十分乖巧的將國內官網的FSD駕駛套件更名為“智能輔助駕駛功能”。

然而,時至今日。一個全新的契機也正悄然來臨。原本被Waymo(谷歌無人車業務2016年獨立而來)所看不上的輔助駕駛路線,正在悄然向L4自動駕駛發起沖鋒。

據報道,特斯拉重新提交“Tesla Robotaxi”商標申請,并計劃于6月中下旬在得克薩斯州奧斯汀啟動Robotaxi測試。雖然初步可能只有10臺左右的投放,但終于要把馬斯克多次跳票但一直堅持的大餅給圓上了。

而我們也看到,中國的Robotaxi玩家們也加速了規模化推廣和全球化商業運營的節奏。不止是追隨Waymo的小馬智行、文遠知行等玩家,作為量產輔助駕駛頭部玩家的Momenta也宣布要推出基于現有方案的前裝量產的Robotaxi,也將一舉從輔助駕駛方案抵達Robotaxi的市場。

以數據驅動推動AI算法進化,通過量產輔助駕駛和L4自動駕駛兩大支點的協同進化,讓“輔助駕駛”和“自動駕駛”的技術邊界線完全被打破。

為什么是數據驅動的特斯拉和Momenta,不約而同地完成這條“從跳躍到飛躍”的技術躍遷?我們還得從過去十年間說起,一起搞清楚這場蛻變背后的草蛇灰線。

激進拓荒者:特斯拉押注AI智駕路

19世紀初,大批美國的早期創業者們闖入西部,開疆擴土,開啟了持續半個世紀的西進運動。

而馬斯克就像當時那些心懷理想和發財夢的牛仔,帶著特斯拉開啟了乘用車智能輔助駕駛的狂飆突進。

特斯拉這場智駕的“西進運動”是如何推進的?

從2014年至今大致可以分為三個階段,分別是:2014-2016年的外部合作期,2016年到2019年的自研過渡期,以及2019年至今的全面自研期。

第一階段,特斯拉先后與Mobileye和英偉達建立過合作,經歷了“軟硬件外采”、“硬件外采、軟件自研”的艱難歷程。

2014年,特斯拉在“Autopilot”上并無多少積累,本著“能上車就算贏”的策略,選擇了當時市面上能達到L2輔助駕駛能力的視覺方案——Mobileye的EyeQ3,AI算力是今天看起來少得可憐的0.25 TOPS,只能支持一個前視攝像頭、一個毫米波雷達和12個超聲波雷達,從而實現了自適應巡航、前車碰撞預警以及方向盤自主變道等功能。

基于這一軟硬件外采方案,特斯拉于2014年10月發布Autopilot1.0版本和硬件模塊Hardware1.0。但實際上直到1年后的2015年10月,特斯拉車主采真正使用上。

馬斯克從一開始就對Mobileye的黑盒交付(就是軟硬件封裝起來,不會對主機廠開放)十分不滿。借著2016年那場人類世界首例“自動駕駛車事故”的由頭,特斯拉果斷拋棄Mobileye,轉向了英偉達的懷抱。

2016年10月,特斯拉發布了Autopilot 2.0和硬件模塊HW 2.0。計算單元是英偉達DRIVE PX2定制主板,主板上面搭載了Tegra X2 CPU和升級為Pascal架構的GPU,算力是10 TOPS,幾乎是Mobileye EyeQ3的整整40倍。外接傳感器包含了8個攝像頭、1個毫米波雷達、12個超聲波雷達。

但英偉達和特斯拉在軟件算法上也并沒有特別突出,一直到第二年的上半年,才將Autopilot 1.0的主要功能實現出來。

英偉達不過也是“過墻梯”,馬斯克通過NVIDIA Drive這樣一個自由度很高的開放平臺,鍛煉了軟件算法,為自研打下了基礎。

第二階段,特斯拉在和英偉達你儂我儂之際,就開始了智駕芯片的自研之路。這就是后面被公眾所熟知的FSD芯片,單片AI算力72TOPS,采用高度定制的CPU+GPU+ASIC架構,其中ASIC是由兩個神經網絡處理單元NPU組成,專門用作視覺圖形處理。

2019年,特斯拉推出FSD軟件系統和HW3.0。相比較前一代HW 2.5(算力20TOPS),HW3.0平臺上配備了兩顆FSD芯片達到144TOPS,系統算力增長了7倍多。

也是在這一階段,除了芯片自研之外,特斯拉招募了大批人工智能算法專家,開始感知和決策當中引入深度學習算法。為適應AI算法所需要的大規模數據處理和標注,特斯拉還引入了上千人的標注團隊以及不斷擴容的數據中心。

以至于在2019年4月的Autonomy Day上,馬斯克首次公布了超級計算機Dojo的研發計劃。

至此,特斯拉進入第三階段——全面自研階段。

作為量產的智能駕駛方案,在特斯拉這里,形成一個基于AI三要素——即算法、數據和算力,所形成的數據驅動的開發范式。

數據,自不必說,來自量產車型和采集車回傳的大量駕駛場景數據和駕駛行為數據,由于當時的算法采用監督學習,十分依賴高質量的標注數據,所以數據標注一直是一個“人工大于智能”的苦活累活。同時也包括大量仿真構造的虛擬場景數據,用于真實世界里很難遇到的corner cases(極端場景)或長尾場景。

算力,即剛剛一直講到的車端的計算單元,主要是指運行智駕算法AI芯片。同時也包括在云端進行算法訓練和數據處理的AI芯片,市面上主要是被英偉達的GPU所壟斷,而特斯拉的Dojo則更進一步為自動駕駛視覺模型訓練設計,

算法,籠統來講,就是由云端計算平臺根據大規模數據學習所訓練出來的一堆神經網絡,然后經過微調、蒸餾等方式部署到車端,形成一個可以處理感知理解、認知決策和預測規劃等任務的復雜神經網絡系統。

這里為什么可以將特斯拉比喻為“西部拓荒者”,原因無他,就是特斯拉以引路人的角色徹底塑造了如今主流的自動駕駛技術路線。

2021年的Tesla AI Day具有里程碑意義,約等于公開了特斯拉在之前數年時間的技術探索。我們以智駕系統最重要的感知算法為例,再花一些篇幅來梳理特斯拉智駕算法的迭代過程。

感知的核心任務是識別和理解外部環境。特斯拉的8個攝像頭可以不停地采集到外部世界的2D圖像,也就是平面圖像,但這不足以構造出我們人類駕駛所需要的始終延續的車道線、疾馳而過的車輛等信息。通過感知神經網路,特斯拉構建出一個表征真實世界的3D向量空間。

2021年 AI Day上,特斯拉公布的感知方案,就是基于3D向量空間構造出一個HydraNet架構,即多個任務頭(head,像九頭蛇一樣)共享一個數據“軀干”(BackBone),利用多頭執行包括物體檢測、交通燈識別、車道線預測等任務。

這就是外界所津津樂道的“BEV+Transformer”,其中BEV就是這8個攝像頭拼接而成的一個360度俯視場景圖,真實還原周圍的環境,前后相繼延長的車道線、出現在不同攝像頭里的車輛,符合我們人類視覺習慣,甚至超越人類視覺范圍。

而Transformer是2017年谷歌推出的一種神經網絡架構,開啟了我們今天所熟知的大模型時代,最初被應用在自然語言任務處理當中,而谷歌研究者在2020年發現,Transformer在處理圖像任務時也十分高效,由此推出了Vision Transformer(ViT),突破了原有的卷積神經網絡(CNN)的局限,一舉成為智駕主流的感知算法架構。

到了2022年的AI Day上面,特斯拉在感知模塊進一步升級了占用網絡(Occupancy Network),配合 NERF 算法,可以在 BEV+Transformer 感知框架的基礎上實現通用能力更強的 3D 空間感知。形象理解,就是將感知環境當中的元素給體素化,變成帶有時空信息的信息,能夠讓車輛更好預測障礙物的軌跡,也可以更好規劃自車的軌跡。

這兩屆AI Day帶給整個行業極大的啟發,大量從業者對特斯拉公布多方案進行像素級的研究。特斯拉擔心自己暴露了過多信息,所以2022 AI Day之后,至今再無下一屆。

就當中國的信徒們亦步亦趨跟隨特斯拉的技術方案之時,特斯拉又放出了“端到端”的全新方案。

在此之前,在特斯拉智駕軟件算法中,感知、規劃、控制等模塊一直是相對獨立,其中感知算法是神經網絡化最為徹底的,而規控算法則帶有大量的人工規則代碼。而特斯拉在“端到端”方案之前,已經嘗試將神經網絡用于自車軌跡預測、規劃當中。

而端到端,就是這一進程的最極致表現,完全采用一張神經網絡,將感知、軌控和執行鏈接起來,“圖像進、動作出”,像極了我們人類老司機開車的過程,我們做出加減速、轉向燈動作幾乎是跟感知同時且不加思索的。而之前的所謂模塊化,則像極了新手司機先要判斷下看到了什么、思考下這個情況應該怎么辦,然后再告訴手和腳要怎么行動。

端到端方案和模塊化方案的高下立分,但實現端到端并不容易。

2023年,特斯拉開始嘗試端到端方案的測試,系統運行速度比原方案更快,甚至直接刪掉了用于確保安全、文明駕駛的30萬行人工代碼,輔之以端到端系統自己學到的人類的開車知識。

2024年,特斯拉FSD V12版本正式發布,采用端到端架構,表現優異,再次引領了潮水的走向。

這幾乎是一次革命性的技術躍升,但特斯拉并沒有透露細節,但是特斯拉從開創的數據驅動的技術范式,讓同行找到端到端的known-how已經不再遙不可及。

來自大洋對岸的中國智駕創業公司,也找到了自己的破繭成長之路。

熱血難涼:Momenta篤定“數據飛輪”

2016年是全球自動駕駛產業第一個爆發節點。

這一年,谷歌無人車項目獨立,成為今天還活躍在 Robotaxi市場的Waymo,谷歌團隊出走創辦的Cruise在這一年被通用高價收購。

更多的自動駕駛精英先后走出,成立了一家又一家自動駕駛公司,進入無人出行及物流領域。

國內同樣繼百度之后,涌現出一批自動駕駛公司,Momenta、小馬智行以及17年成立的文遠知行,也都是作為Waymo的信徒,以實現L4自動駕駛為目標。

在接下來的幾年間,特斯拉從長期在自動駕駛領域墊底的小透明,成長為行業不可忽視的新興力量——它將智能輔助駕駛這條路走通了。

即通過規模量產積累數據,不斷優化軟件算法,來實現智駕的迭代升級,進一步又促進用戶的使用,形成數據驅動的正向加速。

而Robotaxi的重傳感器、重高精地圖的模式,只能用小規模車隊在限定范圍做運營測試,從而陷入難以規模化增長以實現正向商業閉環的陷阱。

這就是行業長期以來的跨越式和漸進式路線之爭。

谷歌向左,特斯拉向右,大多數跟隨者選擇了站隊Waymo,很長時間Robotaxi甚囂塵上。

Momenta似乎選擇了第三條路,更傾向于特斯拉,先做量產智駕方案,但不放棄L4自動駕駛。

Momenta CEO曹旭東,一個以《航海王》主人公路飛作為頭像的年輕人,以熱血少年的姿態,毫不猶豫地邁進自動駕駛的“偉大航路”里,試圖用人工智能的方式來完成一個少有人敢走的路,實現L4自動駕駛。

如今來看,Momenta仿佛是一開始就拿到偉大航路的地圖,踩對了幾乎所有節點,才成就了如今頭部量產輔助駕駛的地位。

但實際上,過程并不會如此簡單。

從2016到2018年最初成立的兩年,Momenta更像是一個技術研究院,專攻自動駕駛的算法優化,做課題、刷比賽,以學霸的方式來吸引投資人的關注。

數據驅動算法、量產輔助駕駛和全無人駕駛并行的想法,在Momenta成立之初就有。2018年,Momenta越來越意識到量產經驗和數據規模的重要性,后來將戰略總結成 “一個飛輪,兩條腿”。

所謂“一個飛輪”,就是打造“數據飛輪”這一高效開發模式,所謂“兩條腿”,就是智能輔助駕駛與自動駕駛Robotaxi兩個業務線相輔相成,用量產輔助駕駛產生海量數據以訓練自動駕駛算法,解決L4完全無人駕駛的長尾問題。同時再用L4的技術賦能L2量產輔助駕駛產品力 的提升,形成技術迭代與數據收集的良性循環。

2019年,Momenta發布了可量產的結構化道路自動駕駛解決方案Mpilot和完全無人駕駛方案MSD。Mpilot即L2智能輔助駕駛,側重于量產自動駕駛技術的快速演進。

2021年,Momenta憑借兩年前和上汽合作預研的記憶泊車項目的契機,Momenta不僅獲得了上汽的大筆融資,也拿到了最為關鍵的首個量產乘用車輔助駕駛車型——智己。

當時在市面上,Momenta的自動駕駛產品狀態最接近量產狀態,也最接近特斯拉的水平。特斯拉推出了高速NOA方案,而Momenta將其作為對標產品,要開始打造“中國的特斯拉NOA體驗”。

在和智己打磨這套量產輔助駕駛方案中,Momenta真正練就了這個高速運轉的數據飛輪,也鍛造了強大工程化能力。

對于L4自動駕駛,Momenta不僅是和其他Robotaxi公司一樣推動少量無人車的城區運營測試,而是更看重數據驅動范式下,通過量產乘用車的數據規模進行AI算法的持續迭代,以及對于閉環自動化流程不斷優化打造。

無怪乎,Momenta成為中國最早一批將端到端方案落地的智駕公司。

這一切有跡可循。

據官方透露,Momenta在2019年就開始用Transformer來做預測、路徑規劃等。到2022年初,Momenta的AD2.0已經在用AI模型做感知的多任務預測,以及開始嘗試決策模塊的模型化。

2023年上半年發布AD3.0,其感知可以將時序任務整合到同一模型,規劃算法轉向數據驅動,開始面向成熟量產上車。

2023年下半年,AD4.0可以將感知所有任務整合到同一模型,規劃全部數據驅動處理。這一階段的智駕方案,實質上就相當于兩段式端到端。

只不過當時,端到端這個名詞,特斯拉還沒有喊出來,整個行業對這一詞匯都稍顯陌生。

2024年3月底,特斯拉正式推出FSD V12端到端方案,然而不到半年,Momenta 也正式發布了AD5.0一段式端到端方案,將感知與規劃整合進一個大模型。

這一發難是按照人腦的長短期記憶結構構造的智駕大模型,按照類人直覺和體系,進行快速迭代。

短期記憶用來學習新的數據信息,等到數據和方法被驗證后,就會進入長期記憶去學習,最終成為端到端大模型的知識。

這一切仍然還是圍繞數據飛輪大模型進行運轉,短期記憶圍繞數據采集(比如車輛篩選、長尾覆蓋),以天級為迭代周期;而長期記憶,圍繞數據回流、數據分析、數據標注、模型訓練、測試驗證等環節,以周級為迭代周期。

現在,Momenta 這個一段式端到端智駕大模型,已經廣泛搭載到上汽智己、比亞迪騰勢、廣汽豐田、昊鉑、埃安等車型上面,實現了從感知到規劃再到控制的全過程模型化整合,用“無圖+端到端”的方式,來實現高速、城市領航輔助、泊車輔助等全場景無圖智駕功能。

找到OnePiece:開啟Robotaxi的衛冕之戰

此時,本文的兩大主角都來到了故事的中局——從量產輔助駕駛走向L4自動駕駛,與Waymo路線的老玩家們,一道開啟Robotaxi的衛冕之戰。

特斯拉宣布要在今年6月底正式在北美推出自己的Robotaxi,第一批可能就10多臺,但這次應該真的“狼來了”,不然老馬在自動駕駛上的信用賬戶就真的要破產了。而Momenta也宣布將在25年底推出行業內Robotaxi主駕無人的運營方案,并且聯手Uber在2016年進入歐洲市場。

值得一提,特斯拉的Robotaxi還不是之前大張旗鼓發布的去掉駕駛位的概念車,而是基于現有的量產車進行Robotaxi運營。

同樣,Momenta特意強調自己的Robotaxi是基于前裝量產車型,一方面通過復用量產傳感器和計算單元來降低單車成本,另一方面通過“無圖技術”,還可實現在各國不同城市道路環境中的快速適配。

預判一下,特斯拉和Momenta會相互成為Robotaxi的勁敵嗎?

短時間,應該不會。因為不要忘記在位十年的王者Waymo已經在北美經營已久,而國內的蘿卜快跑、小馬、文遠等L4車隊也已經攻城略地。

這是新王挑戰舊王的一場戰爭,也是沖擊Robotaxi規?;男l冕之戰。

新的冒險故事再次開啟。當年那個被Urmson所嘲笑的漸進式路線的邏輯,如今已然失效——那些練習跳躍的人雖然沒有克服地球引力,但是他們進化出了翅膀。

《航海王》里,所有海賊們都奔向了傳說中的大寶藏——Onepiece,那是自由與希望的應許之地。那在自動駕駛的偉大航路上,誰能最后摘取Robotaxi這顆最后的王冠明珠呢?

這后半程的故事或許要由特斯拉和Momenta繼續書寫。

*本文圖片均來源于網絡

此內容為【智能相對論】原創,

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。

?AI產業新媒體;

?澎湃新聞科技榜單月度top5;

?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

?著有《人工智能 十萬個為什么》

?【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。

聲明:本文由太平洋號作者撰寫,觀點僅代表個人,不代表太平洋汽車。文中部分圖片來自于網絡,感謝原作者。
38
06-05
智駕大橫評

相關車系

更多>>

相關推薦

熱門文章

|
国产人成亚洲第一网站在线播放