作者 | 德新
編輯 | 王博
盡管在2025年上半年輔助駕駛行業經歷了一番風波,但到了下半年,在技術上頭部公司的輔助駕駛系統明顯地要開始邁入下一階段。
理想、小鵬、元戎這些玩家們都霍霍欲試,以VLA為代表基于新一代模型的輔助駕駛系統呼之欲出。

理想已經在一季度的財報會上預告:7月理想將發布純電SUV i8,并同步推出基于VLA模型的輔助駕駛系統。i8將是理想繼MEGA之后在純電上的關鍵一戰,理想的前期宣傳將不少的賣點都寄托在了新的輔助駕駛上。
小鵬也在6月11日剛剛揭幕了全新的G7,G7首發了自研的圖靈芯片,并且一次就搭載3顆,擁有超過2200 Tops的算力。基于這個級別的算力,小鵬正在云端訓練超大規模的VLA模型,稱之為VLA-OL(Online Reenforcement Learning);接下來,小鵬將通過蒸餾的方式將VLA部署到車端。
除了新勢力自研的陣營,傳統廠商一側其對VLA技術也有強烈的興趣。供應商中,元戎啟行可能是對VLA推進得最早、最快的一家公司,其在去年6月份第一次對外公開談到在開發VLA,其預計今年將有至少5款車搭載元戎啟行提供的VLA模型上市,其中最早的車型預計在三季度量產并上線功能。
智能輔助駕駛已經成為新車銷售中的關鍵配置,今年伴隨著英偉達DRIVE Thor等新一代芯片上車,整個行業正經歷技術換代。
以VLA為代表的新模型能帶來什么樣的變化,這不僅是當下時下汽車行業的開發者們翹首以待的,甚至有準備購車的車主都在密切關注——畢竟動輒30萬元級的購車決策,誰也不想剛買的新車在關鍵配置上很快落后。
一、下一代模型VLA,將帶來哪些新功能?
關于新一代的VLA模型有什么功能,理想在今年3月份的GTC上已經給了一些小小的劇透;而最近一周內,元戎啟行的CEO周光在火山引擎Force大會上披露了更多細節。元戎重點展示了基于VLA 4個主要的能力:
- 空間語義理解,尤其是由于遮擋造成的盲區,這是一大類常見的問題,比如橋洞通行時或者因為公交車等大車造成的動靜態視野遮擋,VLA能夠理解這個語義,并且執行更安全、有防御性的駕駛決策。

- 異形障礙物識別,典型的比如施工、異形車或者因為超載而變形的車輛。
- 文字引導牌理解,比如轉彎待行區的文字指引、可變車道、潮汐車道等等。

- 語音控車,通過VLA模型,系統可以根據語音指令做出對應的駕駛決策,并且當用戶意愿與導航信息相沖突時,VLA模型會優先采納用戶意愿。
這些功能目前都已經有demo展示,元戎還預告了接下來還會有新的功能陸續會上線,包括豪車識別功能以及在園區里找充電樁等。

其實在過去幾個月里,我們已經初步體驗了一些新一代的系統,包括蔚來基于世界模型NWM的新版本,以及理想在新版AD Max(基于NVIDIA Drive Thor U平臺)上部署的初代Agent能力。
其中最大的感受是新的模型對場景的認知大幅提升,系統不再是執行一個簡單的「A點移動到B點」的指令,而是會根據語音下達的需求,認識、思考、執行,從而提高增加輔助駕駛功能的便利性。比如在停車場,能根據需要找到地庫的電梯口;能主動理解掉頭的需求,并且找到合適的點位掉頭。
不過目前我們已經體驗過的demo都限于封閉地庫或者園區場景,元戎給出的新功能則更多針對開放場景,看起來組合更加豐富。
基于更大算力和先進架構的模型,顯然還會有更多的功能推出。在G7上懟了3顆圖靈芯片的小鵬也給了這個預期,「G7出來的時候,后面每個月都會增加新的有趣的功能,會有很多新的行業沒有的功能出來,這是算力帶來的想象空間?!?/p>
二、行業為什么在這個時候,紛紛了選擇VLA?
在過去一年,幾乎所有主流的車企在輔助駕駛上都更新成了端到端大模型驅動的系統,在短時間內性能和體驗提升都比較明顯。但端到端黑盒的研發模式,導致了部分Corner Case無法追溯產生的原因,這也導致一部分車企很快地從「熱戀期」進入到了「瓶頸期」。
即使是當前TOP級別的端到端系統,在面臨復雜道路結構疊加復雜車流博弈時大多數情況也會崩潰。行業普遍面臨瓶頸,所以很自然地有公司開始探尋上限更高的新架構。
而VLA通過語言模型的引入,很好地解決了研發和用戶兩端黑盒的問題。

不過,這并不意味著端到端不值得投入開發。李想本人在最近的AI Talk中就提到,他們內部認為:如果規則算法都做不好,根本不知道怎么去做端到端;如果端到端沒有做到一個非常極致的水平,那連VLA(視覺語言行動模型)怎么去訓練都不知道。換句話說,在端到端上取得大規模成功量產經驗,是探索VLA的一個門檻。
小鵬是在國內智能輔助駕駛最早的推動者,而理想在2024年通過清晰的AI戰略大幅加速了其輔助駕駛的研發,「E2E+VLM」的范式在去年掀起了一波不小的風潮。元戎本身是一家有很強AI基因的公司,去年它在魏牌藍山和Smat精靈5上實現了端到端輔助駕駛方案的量產,先進性和工程能力受到頭部自主品牌的認可。
接下來,小鵬將在后續車型的Ultra版本(搭載3x圖靈芯片)上部署VLA;理想已經預告了除了Thor U版本,VLA也將在雙OrinX版上能跑起來。
元戎對今年累計量產規模的預計是超過20萬輛車,其VLA模型可以支持激光雷達和純視覺方案,并且正尋求通過蒸餾的方式適配更多的芯片平臺。
在開發車端VLA模型的同時,元戎正在通過與火山引擎在算力上合作,催化云端模型的迭代。
這些信息意味著,從規模上來講,VLA將成為一代非常主流的輔助駕駛大模型。
并且,由于今年絕大部分廠商的旗艦車型在硬件上將會上馬Thor U,但部分廠商去年在端到端的開發上并不理想,這倒是提供了更大的機會,加強車企與供應商在先進模型上的合作。
三、走向通用人工智能的必經之路
在G7的發布會上,何小鵬提到自研芯片的攤銷門檻至少是100萬片起步;圖靈芯片不光會用在車上,也會用在小鵬的飛行汽車以及機器人上。
對于大模型的研發來說,其投入規模也是巨大的,預計今年底/明年頭部廠商為輔助駕駛大模型的云端算力投入可能就是以1億美金作為門檻。
理想、小鵬、元戎選擇了VLA,某種程度上也是瞄準了自動駕駛以及通用人工智能的星辰大海,希望借助VLA邁向更加遠大的目標。
從VLA的起源來回溯,VLA本身最早就是由DeepMind提出來,用于機器人的模型范式。語言模型加入之后對推理能力的增加,能極大地幫助機器系統建立對世界的認知,從而形成更加通用化的能力。
元戎認為大語言模型最初是一個「弱專才」,其發展過程經歷了「弱專才 - 通才 - 強專才」三個階段,輔助駕駛模型也會類似。而現在的VLA模型是輔助駕駛領域的那個「通才」,是通過自動駕駛的必經之路。