賦能自動駕駛,大模型是真旺還是虛火?

發(fā)布日期:2023-06-28  來源:中國汽車報

核心提示:萬物皆可大模型成為今年各個產業(yè)都逃不開的話題。年初以來,能夠代寫論文、寫報告甚至寫新聞的ChatGPT,徹底引爆了社會各方對大
 “萬物皆可大模型”成為今年各個產業(yè)都逃不開的話題。
 
年初以來,能夠代寫論文、寫報告甚至寫新聞的ChatGPT,徹底引爆了社會各方對大模型的關注。在大眾紛紛擔心自己是否會被AI所取代時,自動駕駛產業(yè)已經瞄準大模型的商業(yè)價值,紛紛推出大模型。近日,理想汽車在理想家庭科技日發(fā)布會上宣布,理想采用大模型算法,自研MindGPT。多方吹捧的大模型,能否為自動駕駛產業(yè)帶來“第二春”?
 
01

大模型成新寵
 
“自動駕駛技術正進入以數(shù)據(jù)和知識雙驅動的多模態(tài)感知和認知理解為代表的新階段。”中科院雄安創(chuàng)新研究院認知智能實驗室副主任黃武陵在接受《中國汽車報》記者采訪時表示,大語言模型(LLM)、跨模態(tài)大模型的出現(xiàn),為自動駕駛產業(yè)的發(fā)展帶來突破口。目前,行業(yè)對大模型的定義是只有在參數(shù)達到千億以上才能夠被稱為大模型。當AI模型足夠大,經過不斷地訓練與學習,就有可能實現(xiàn)智能化。因此,被看作能夠改變世界的大模型,成為自動駕駛的新希望。
 
在數(shù)據(jù)閉環(huán)和仿真環(huán)節(jié),大模型將賦能自動駕駛。商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛表示,在人工智能1.0時代,大量的人工標注導致數(shù)據(jù)標注時間長、成本高、挖掘難度大。但在人工智能2.0時代,基于大模型可以實現(xiàn)自動標注,大大降低成本,可快速進行優(yōu)化和迭代。另外,還可通過AIGC利用人工智能做內容生成,模擬生成高度真實的場景,助力自動駕駛技術更好地進行測試和優(yōu)化。“在大模型的輔助下,研發(fā)人員可以更多集中在關鍵算法及其提升體驗上,集中打磨出更多滿足用戶體驗、效果良好的產品。”黃武陵說道。
 
在王曉剛看來,多模態(tài)大模型的應用還可實現(xiàn)從感知到決策、規(guī)劃、控制,端到端一體化的優(yōu)化。“當前大多是感知輸出一個結果,基于規(guī)則做一些判斷,做出決策,然后再基于手動規(guī)則,實現(xiàn)規(guī)劃控制。”他認為,未來大模型通過人工智能,可以實現(xiàn)端到端自動駕駛,提供更加可靠、像人開車一樣的體驗。
 
目前行業(yè)普遍認為,在技術方面,自動駕駛的底層架構和大部分技術問題已得到解決,但由于現(xiàn)實道路場景復雜,即便現(xiàn)有技術已實現(xiàn)90%以上場景的自動駕駛,剩下10%的長尾場景始終無法覆蓋。黃武陵表示,隨著大模型在垂直領域的應用逐漸成熟,成本可控且性能效率良好的前提下,大模型有望在環(huán)境認知理解、智能決策等算法功能上得到應用,將交通指示和駕駛經驗得以沉淀和應用,緩解自動駕駛的“長尾問題”。
 
此外,大模型還能為自動駕駛“拋棄”高精地圖提供助力。要想實現(xiàn)高級別自動駕駛,高精度地圖不可或缺,但實時更新難度大、法規(guī)風險高、成本極高三座“大山”始終難以跨越。擺脫高精地圖,成為不少企業(yè)的選擇。隨著大模型漸受關注,安信證券研報指出,AI大模型將助力企業(yè)實現(xiàn)“脫高精度地圖”。BEV感知算法通過將不同視角的攝像頭采集到的圖片統(tǒng)一轉換,相當于車輛實時生成地圖,補足自動駕駛后續(xù)決策所需的道路拓撲信息,實現(xiàn)“脫圖”。

02

產品接連發(fā)布
 
受到各界追捧的Chat-GPT,全稱為“Generative Pretrained Transformer”,其采用了谷歌在2017年提出的Transformer架構。對于自動駕駛領域而言,Transformer架構則并不陌生。早在2021年,特斯拉便將Transformer架構引入自動駕駛領域,推出基于Transformer的BEV感知方案。這是大模型技術在自動駕駛行業(yè)的首次亮相,也成為特斯拉實現(xiàn)純視覺自動駕駛方案的關鍵所在。隨后,華為、商湯科技、百度Apollo等企業(yè)相繼在“BEV+Transformer”上展開布局。中信證券研報指出,隨著小鵬城市NGP、華為城區(qū)NCA功能、毫末智行城市NOH等城市領航功能的相繼落地,“BEV+Transformer”將引領自動駕駛感知范式。
 
如今,大模型絕不僅限于自動駕駛感知領域。今年4月,毫末智行正式發(fā)布自動駕駛生成式大模型DriveGPT“雪湖·海若”。據(jù)毫末智行首席執(zhí)行官顧維灝介紹,毫末DriveGPT通過引入駕駛數(shù)據(jù)建立RLHF(人類反饋強化學習)技術,對自動駕駛認知決策模型進行持續(xù)優(yōu)化,現(xiàn)階段主要用于解決自動駕駛的認知決策問題,終極目標是實現(xiàn)端到端自動駕駛。顧維灝表示,毫末DriveGPT將率先探索智能駕駛、駕駛場景識別、駕駛行為驗證、困難場景脫困四大應用場景,首先將開放智能駕駛、駕駛場景識別兩大應用場景。
 
在自動駕駛領域,商湯科技開發(fā)了業(yè)界首個感知決策一體化的端到端自動駕駛解決方案——UniAD,在多目標跟蹤準確率、車道線預測準確率等多項關鍵技術指標上超越SOTA方法,整體系統(tǒng)和性能得到大幅提升。“未來,我們將利用多模態(tài)大模型,進一步推動自動駕駛技術發(fā)展,如通過AIGC產生大量困難樣本,用環(huán)視感知的數(shù)據(jù),和多模態(tài)數(shù)據(jù)作為多模態(tài)大模型的輸入,實現(xiàn)感知和決策一體化的集成。”王曉剛表示。
 
于不久前正式亮相的Mind GPT,則是屬于理想汽車自研的認知大模型。理想現(xiàn)已用1.3萬億個token為其進行基座模型訓練,讓其對話生成、語言理解、知識問答、邏輯推理等多項能力更安全、更準確、更有邏輯。在Mind GPT的賦能下,理想汽車所搭載的智能語音助手——理想同學,將像人一樣主動感知環(huán)境和他人、學習和思考、表達和互動。此外,在智能駕駛方面,理想AD Max 3.0可通過大模型AI算法,擺脫對高精地圖的依賴,實時感知、決策、規(guī)劃,識別準確度相當高。理想汽車智能駕駛副總裁郎咸朋表示:“在先進的技術架構和高效的訓練平臺共同推動下,智能駕駛將會很快在家庭出行中實現(xiàn)大規(guī)模普及,AI駕駛員替代人類駕駛員的時代也不再遙遠。”
 
此外,百度此前也表示,要將文心一言大模型應用在自動駕駛上,以加深Apollo自動駕駛車輛對復雜城市路況的理解,進一步提升其自動駕駛安全性和可靠性。斑馬智行則基于阿里巴巴通義千問大模型,打造了第三代汽車AI能力體系Banma Co-Pilot,構建云端一體的全棧AI能力。日前,特斯拉首席執(zhí)行官馬斯克也表示,特斯拉會迎來自己的“ChatGPT時刻”,如果不是今年,肯定也不會遲于明年。一系列大模型產品的相繼發(fā)布,可見大模型在自動駕駛領域的“受寵”程度。
 
 
03

商業(yè)化為時過早
 
“目前大模型究竟能給行業(yè)帶來什么影響尚不明晰,一些有能力、有資金的企業(yè)只是處于率先探索階段,商業(yè)化還為時過早。”全聯(lián)車商投資管理(北京)有限公司總裁曹鶴表示。
 
聚焦自動駕駛大模型,就此前發(fā)布的幾款大模型產品究竟含金量幾何,自動駕駛行業(yè)從業(yè)者呂兆波并沒有太大信心。他直言:“DriveGPT很不現(xiàn)實,就算大企業(yè)投資研發(fā),沒有5~10年很難見到成果。這個大模型的概念很大,他們可能就是做一個簡單的數(shù)據(jù)融合。”
 
在呂兆波看來,大模型的優(yōu)點就是能夠將各組數(shù)據(jù)融合在一起,對外界環(huán)境的感知更為準確。但是,要想使用大模型,首先就面臨部署問題。“如果大模型部署在云端,延遲問題很難解決;而如果部署在車端,如此龐大的數(shù)據(jù)量,延遲問題同樣不容小覷。”他說道。上不上車,成為困擾自動駕駛大模型商業(yè)化的首要問題。
 
對此,地平線創(chuàng)始人兼首席執(zhí)行官余凱在參加2023中國電動汽車百人會論壇時提出,車端的能量供給與散熱等現(xiàn)實困難,使得自動駕駛無法采用類似ChatGPT云端計算中那樣龐大的模型與計算量。顧維灝在接受媒體采訪時則表示,云端模型與車端模型的大小并不是完全等同的關系,目前DriveGPT參數(shù)規(guī)模已達1200億,但并不意味著把這1200億的參數(shù)大模型都上到車端,關鍵是留住核心能力。
 
此外,成本問題也是困擾之一。有業(yè)內人士指出,自動駕駛系統(tǒng)如果要上大模型,至少要增加5萬美元成本,隨著大模型進一步變大,成本或許會進一步增加。對此,呂兆波稱,成本問題可通過云端部署解決,但前提是解決云端的延遲問題。即便是大模型自身,也認為成本問題是一大重要考慮因素。在回答“如果將ChatGPT應用到自動駕駛中,是否會成本過高?”這一問題時,Chat-GPT給出的回復表示,將ChatGPT應用于自動駕駛系統(tǒng)會涉及一定的成本,主要涉及計算資源、數(shù)據(jù)收集和訓練、模型開發(fā)和集成等幾方面。
 
04

輿論火熱 資本冷靜
 
前有創(chuàng)新工場董事長兼首席執(zhí)行官李開復宣布籌辦全球化公司Project AI 2.0,后有搜狗創(chuàng)始人王小川投資5000萬美元成立百川智能。此前,紅杉中國種子基金也表示正在密切關注并開始布局AIGC領域的早期企業(yè)。一方是資本盛宴,另一方則略顯冷清。2022年以來,裁員、倒閉、關停的消息充斥自動駕駛產業(yè),不少人感嘆自動駕駛進入“寒冬期”。雖說大模型在自動駕駛領域的應用還為時過早,但不可否認,大模型的出現(xiàn)給正處于寒冬的自動駕駛產業(yè)重新燃起一把火。這波與大模型的聯(lián)動,能讓漸失熱度的自動駕駛重獲資本寵愛嗎?
 
中國生產力促進中心協(xié)會常務副理事長兼秘書長、研究員王羽認為,大模型的出現(xiàn)提供了一個群體性的突破機會,能夠提振行業(yè)信心,重塑單車智能技術路線。不過,在汽車行業(yè)分析師邵元駿看來,盡管資本對于大模型熱情高漲,但經過多年發(fā)展,資本已經認清自動駕駛產業(yè)的發(fā)展現(xiàn)狀,不會在大模型萌芽期貿然進行大手筆投資。
 
據(jù)王曉剛介紹,ChatGPT這樣的大模型僅訓練一次便需要上千萬美元的成本投入,商湯科技近幾年在AI研發(fā)中已累計投入上百億元,僅臨港AIDC基礎設施投入便超50億元。動輒成百上千億元的投入,在自動駕駛領域卻很難短時間實現(xiàn)盈利。
 
“現(xiàn)在受經濟形勢影響,整個資本行業(yè)本身就面臨寒冬,錢不多,出手就會更加謹慎。”邵元駿說。如此看來,炙手可熱的大模型似乎也難解當前自動駕駛產業(yè)之寒。
 

 
 
[ 新聞搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 違規(guī)舉報 ]  [ 關閉窗口 ]

 
0條 [查看全部]  相關評論


網站首頁 | 關于我們 | 聯(lián)系方式 | 使用協(xié)議 | 版權隱私 | 網站地圖 | 排名推廣 | 廣告服務 | 網站留言 | RSS訂閱 | 滬ICP備16055099號-3

充電樁網 版權所有 © 2016-2018 咨詢熱線:021-6117 0511  郵箱:sina@heliexpo.cn 在線溝通:

本網中文域名:充電樁網.本站網絡實名:充電樁網-最專業(yè)的充電樁行業(yè)信息網站