劃重點
01騰訊汽車編輯部推出智駕系列策劃,深入探討汽車工業(yè)未來十年可能發(fā)生的巨大變革。
02商湯絕影CEO王曉剛表示,與車企深度合作將是商湯絕影在AGI時代取得成功的最佳路徑。
03王曉剛認為,自動駕駛技術(shù)的發(fā)展與應(yīng)用是循序漸進的,商湯絕影已經(jīng)與多個品牌實現(xiàn)量產(chǎn)落地。
04除此之外,商湯絕影正在研發(fā)基于多模態(tài)大模型的DriveAGI智駕大模型,有望明年量產(chǎn)落地。
05王曉剛表示,行業(yè)里不太會出現(xiàn)一家獨大的情況,開放合作是更加長久的模式。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯絕影CEO王曉剛
編者按:騰訊汽車編輯部把過去十年的電動化浪潮稱之為中國汽車工業(yè)的“狂飆年代”,如今,站在2024年這個被譽為“智駕元年”的歷史節(jié)點,我們不禁要問:產(chǎn)業(yè)主要參與者將堅持怎樣的技術(shù)路線?又如何構(gòu)筑各自的競爭壁壘?騰訊汽車特別推出智駕系列策劃,通過訪談、實測、橫評、綜述等多種方式,力求站在歷史的原點,進一步洞悉汽車工業(yè)未來十年可能發(fā)生的巨大變革,為讀者和行業(yè)提供更全面的內(nèi)容導(dǎo)引,為行業(yè)留下部分歷史注腳。
科技新聞《遠光燈》
作者 傲敦
編輯 楊布丁
商湯闖入汽車圈,或許要感謝一場暴雨。
2017年夏天,商湯、本田和另一家公司的技術(shù)團隊同時出現(xiàn)在本田日本測試場,本田要求商湯只用兩顆攝像頭完成車輛自動駕駛,其他團隊則使用多傳感器融合方案。
誰都沒料到,演示那天下起了暴雨,那些依賴激光雷達、慣導(dǎo)、高精度地圖的車輛徹底“罷工”。商湯用純視覺方案,在惡劣天氣條件下順利完成了任務(wù)。
幾個月后,商湯和本田簽署了長達5年的合作協(xié)議,雙方共研L4自動駕駛技術(shù)。
那日帶隊贏下項目的是商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛,現(xiàn)在他還有另一個新身份商湯絕影CEO。從2017起,王曉剛便帶著近四十人的團隊一腳踏入眼下最卷、最殘酷的行業(yè):汽車圈。
2017年的智駕圈,Transformer等先進的網(wǎng)絡(luò)結(jié)構(gòu)尚未成熟,如今火爆的端到端更是沒出現(xiàn),自動駕駛技術(shù)路線、商業(yè)模式也都不清晰,多數(shù)以L4級為主,距離規(guī);慨a(chǎn)還有一段距離。
直到2020、 2021年,商湯等一批新入局的智駕供應(yīng)商終于看到了機會。當(dāng)時國內(nèi)車企多數(shù)用Mobileye方案,但它高度封閉,導(dǎo)致車企無法采集自己數(shù)據(jù),車廠不得不嘗試更多可能性。王曉剛回憶說,那時商湯看到了做量產(chǎn)智駕方案的機會,開始逐步加大對智駕的投入。2021年絕影品牌誕生,聚焦智能汽車領(lǐng)域。
闖入汽車圈后,商湯絕影經(jīng)歷了波折且痛苦的轉(zhuǎn)型過程,但最終還是成功交付,完成了第一階段蛻變。如今,特斯拉FSD入華已箭在弦上,但在王曉剛看來,這是商湯絕影一個機會點,“車企跟我們深度合作,會是在AGI時代取得成功的最佳路徑”。
“中國車企和科技公司的合作閉環(huán)里,不能只是會解bug。”王曉剛認為,雙方需要建立“你中有我,我中有你”的模式,共同打造一個可升級、可迭代的研發(fā)體系,即AI時代的基礎(chǔ)建設(shè)。
從2014成立那天起,商湯一直在聚光燈下,那里有一群頂尖科學(xué)家,曾被稱為“AI四小龍”之首。但成立十年來,商湯一直在探索如何通過技術(shù)變現(xiàn)來養(yǎng)活自己,按照王曉剛說法,“壓力還是很大的”。他對絕影團隊說, “只有半年的生命,半年之后可能再續(xù)命”。
以下是科技新聞《遠光燈》與王曉剛的對話,經(jīng)編輯:
“在今天,汽車成了AI最大的牽引動力”
《遠光燈》:我比較好奇,你從學(xué)術(shù)界轉(zhuǎn)到工業(yè)界,今天又進入到汽車這個特別卷的行業(yè),有什么感受?
王曉剛:我是2016年從學(xué)校進入到商湯,大家很多時候都覺得商湯是教授從實驗室出來創(chuàng)辦的公司,那里面學(xué)術(shù)氛圍比較濃,不接地氣。其實不是這樣,從商湯建立那天起,你就必須得通過技術(shù)變現(xiàn)來養(yǎng)活自己,壓力還是非常大的。所以,那時候開始我負責(zé)研究,很快開始接觸業(yè)務(wù),包括當(dāng)時跟本田的合作,手機業(yè)務(wù)、互聯(lián)網(wǎng)業(yè)務(wù)我都負責(zé)過。
今天我們說汽車行業(yè)“卷”,其實手機市場 “卷”得更早。在手機業(yè)務(wù)市場,我們經(jīng)歷過比較殘酷的、激烈的市場競爭,記得當(dāng)時我們大年初三就到崗,跟友商PK非常激烈,好在我們在技術(shù)比拼方面比較有優(yōu)勢,最后我?guī)ш犇孟铝擞唵巍?/p>
另外,我們最早接觸的本田項目也是我?guī)е鴪F隊最終贏下來的。當(dāng)時有一個展示前端技術(shù)的活動,本田的社長等高層都在場,本田要求我們就用兩顆攝像頭,在本田日本測試場里能夠完成自動駕駛。
那天有我們和本田自己的團隊、還有一個外部團隊,他們用的就是激光雷達、慣導(dǎo)、高精度地圖。演示那天下起了暴雨,那些強依賴于這些傳感器和硬件設(shè)備的團隊,整個就不能工作了。最后我們商湯純視覺方案,就用兩個攝像頭,還是在惡劣天氣條件下順利完成任務(wù),最終贏得了這個項目。
商湯是經(jīng)歷了很多考驗,但是進入汽車這個行業(yè)后,我們發(fā)現(xiàn)競爭更加激烈、更加殘酷。到淘汰賽階段,車廠對交付、質(zhì)量要求、deadline的限制,這些要求都特別高。我們也經(jīng)歷過項目交付的各種挑戰(zhàn),我跟團隊一塊駐場,跟客戶一起完成的。我覺得,這些都是必經(jīng)的過程,商湯和絕影也都是在這樣的過程當(dāng)中成長起來的。
《遠光燈》:“AI四小龍”里,其實你們是最早堅定的進入到汽車產(chǎn)業(yè)的公司,這是為什么?
王曉剛:這跟創(chuàng)始人對于每一個公司的未來和定位是息息相關(guān)的。商湯是一家人工智能平臺公司,因為AI的發(fā)展是有周期的,跟行業(yè)密切相關(guān),所以不同行業(yè)依次會形成AI的推動力,AI的發(fā)展需要某些行業(yè)來進行牽引。
在今天,我們看來,汽車就成了AI最大的牽引動力。但是,若干年前那就是智慧城市、手機和互聯(lián)網(wǎng),它們是AI的動力。商湯其實都有前瞻性的布局,作為一個平臺公司,商湯也是隨著行業(yè)的變化和發(fā)展,往前演進。
今天汽車作為非常重要的板塊,我們需要深耕下去,大模型無論是在智能駕駛還是智能座艙領(lǐng)域,它都是有非常好的、比較明確的落地場景。
將來,這些技術(shù)可能又能夠被機器人所復(fù)用。只不過今天,機器人的量產(chǎn)數(shù)量是非常少,汽車有比較龐大的量產(chǎn)群體給你提供反饋,去打磨你的技術(shù)。
《遠光燈》:所以對于商湯這類AI公司來說,下一個風(fēng)口行業(yè)就是機器人?
王曉剛:對于絕影來說,我們會扎根在汽車這個方向。商湯本身,它不會一直就只停留在汽車這個方向,它還會再往前走。因為人工智能技術(shù)本身也還在演進過程當(dāng)中,我們就會一直深耕下去。
《遠光燈》:目前你們在算力層面的儲備是多少?
王曉剛:在算力層面,商湯從2018年開始布局建設(shè)AI基礎(chǔ)設(shè)施,在上海臨港投入了超50億元建設(shè)智算中心AIDC。商湯大裝置已經(jīng)布局全國一體化的智算網(wǎng)絡(luò),運營54,000卡GPU,總體算力規(guī)模達20,000 petaFLOPS(每秒千萬億次浮點運算次數(shù),下稱“P”)。
其實,國內(nèi)大多數(shù)車企的算力儲備尚未突破2,000 P,所以說,我們充足的算力資源為UniAD自動駕駛方案的高效訓(xùn)練學(xué)習(xí)和實車部署奠定了堅實的基矗
《遠光燈》:商湯大裝置和基礎(chǔ)設(shè)施會給到絕影什么樣的支持?
王曉剛: 我們的合作非常緊密。首先,像基礎(chǔ)設(shè)施,也就是我們說的大裝置,算力平臺、數(shù)據(jù)存儲等,因為自動駕駛,尤其是端到端對于數(shù)據(jù)存儲要求非常高,因為都是視頻片段。
在端到端早期訓(xùn)練過程中,我們遇到了很多困難,中臺部門跟我們一起進行反復(fù)迭代;另外,大模型、多模態(tài)大模型等很多方面,商湯產(chǎn)研部門會進行支持,包括最新的日日新5o流式多模態(tài)大模型。我們把商湯在大模型上的這些突破運用到車載的領(lǐng)域。
自動駕駛量產(chǎn)交付是考驗的第一步
《遠光燈》: 從最早的本田項目再到絕影品牌,你們是怎么確定的這個方向?
王曉剛:我們是從2016、2017年開始了智駕方面的研發(fā)。當(dāng)時本田來中國尋找智駕合作伙伴,他們看了很多公司。當(dāng)時商湯整個體量還比較小,做智駕的研發(fā)人員也就三四十人,但本田非?粗厣虦诨A(chǔ)設(shè)施、訓(xùn)練框架等方面的能力和創(chuàng)新能力,所以最終選定跟我們合作。
本田當(dāng)時給我們提出的目標(biāo)跟今天的端到端自動駕駛非常像,就是純視覺,只用攝像頭、沒有高精度地圖,不使用激光雷達,直接根據(jù)視覺去預(yù)測輸出駕駛軌跡。在當(dāng)時,像Transformer等先進的網(wǎng)絡(luò)結(jié)構(gòu)還沒有成熟,無論是端上的算力還是云上的算力,也都不具備相應(yīng)條件。
另外,早期自動駕駛的技術(shù)路線、商業(yè)模式也都是不清晰,那時候雖然有很多自動駕駛公司,但大多數(shù)以L4級的自動駕駛為主。
直到2020和2021年,我們在智駕方面看到了一個契機。一些國產(chǎn)車廠之前大多用的都是某廠商的方案,它是高度封閉的,甚至車廠連自己的數(shù)據(jù)都沒有辦法采集到,就只能給到某廠商。所以,一些新的供應(yīng)商獲得了一個契機,為車廠去做量產(chǎn)智駕解決方案。從那時開始,商湯開始逐步加大對智駕的投入,2021年,商湯就有了“絕影”這個名字和品牌。
《遠光燈》:當(dāng)時你們內(nèi)部有沒有產(chǎn)生過什么爭執(zhí)或者猶豫過?對你們來說這是一個比較大的轉(zhuǎn)型。
王曉剛:2021年商湯上市之前,我們內(nèi)部針對智駕做過比較大的討論,因為智駕投入是比較高的,而且有很強的不確定性,風(fēng)險比較高,但是汽車給AI帶來的牽引動力會是巨大的,最后我們還是下決定要做。所以到2022年,我們就成立了絕影智能汽車事業(yè)群,由我來負責(zé)。
另外,這幾年商湯逐漸加大智能汽車領(lǐng)域的投入,因為我們也看到一些比較清晰的商業(yè)模式,跟主機廠合作去提供量產(chǎn)方案,這是一個趨勢。到2022年年底,我們提出了端到端UniAD的解決方案。
同時,2022年年底,ChatGPT出圈了,大家對大模型開始有了認知。其實在2022年一整年,我們給各個車廠推的就是智駕大模型,現(xiàn)在看來確實是太超前了。
所以到了2023年,我們絕影繼續(xù)加大這方面的投入,包括UniAD端到端自動駕駛,車艙大模型應(yīng)用。在這個過程中,絕影逐步找到了自己在整個行業(yè)中的定位和未來發(fā)展方向,同時商湯本身在基礎(chǔ)設(shè)施大裝置方面的優(yōu)勢也更加清晰。
《遠光燈》:剛開始的時候你們有沒有制定一個目標(biāo)或者打法?
王曉剛:具體看業(yè)務(wù)本身,座艙相對來說“輕”一些,交付速度會快一些,現(xiàn)在我們的市場覆蓋度還比較高,有30多個車廠合作。智駕業(yè)務(wù)比較“重”,從未來發(fā)展趨勢看,其實是要求合作伙伴跟車企有一些比較深度的合作。
尤其在今天的端到端時代,我們的目標(biāo)是能夠?qū)ふ規(guī)准抑攸c車企形成戰(zhàn)略合作,因為車企有量產(chǎn)車,有比較豐沛的數(shù)據(jù),而我們商湯絕影有包括算力和數(shù)據(jù)生產(chǎn)管線在內(nèi)的基礎(chǔ)設(shè)施,雙方能夠打通整個閉環(huán)。
這是比較重要的,因為汽車市場競爭比較激烈,未來還會進一步聚焦,我覺得重點不是說貪多,而是要一些形成閉環(huán)、戰(zhàn)略合作。
《遠光燈》:商湯是一家AI公司,你們是怎么說服更多車企客戶跟你們合作的?
王曉剛:我們這樣的AI公司作為供應(yīng)商進入汽車行業(yè),在量產(chǎn)交付上一定要實現(xiàn)一個蛻變。從整個行業(yè)看,2021年到2023年大家剛開始做自動駕駛量產(chǎn)交付、開始轉(zhuǎn)型,我們有三個量產(chǎn)交付的客戶其實都很關(guān)鍵,就是廣汽、合眾和一汽。
很多時候,實際上是我們客戶幫著我們成長的,因為他們有各種流程、工作方式的要求,這個轉(zhuǎn)型過程是非常波折和痛苦的,但最終還是成功交付了。
所以我覺得在那個階段,經(jīng)歷量產(chǎn)的考驗是第一步,是里程碑,絕影完成了蛻變。
我為什么說我們“只有半年的生命”
《遠光燈》:聽說你跟團隊說“只有半年的生命,半年之后可能再續(xù)命”,這是什么意思?
王曉剛:在汽車行業(yè),我們學(xué)到最多的就是結(jié)果導(dǎo)向。最終你要去看結(jié)果,你的量產(chǎn)交付質(zhì)量、時間點,在一個項目里面,我們做軟件可能是最后一環(huán),那前面還有很多環(huán)節(jié),最后到我們這是后墻不倒。
具體到自動駕駛,它又是一個技術(shù)棧特別深的的方向,要依賴的環(huán)節(jié)很多,所以要給大家梳理,要結(jié)果導(dǎo)向,守住自己的每一班崗。說的再好、再怎么樣天花亂墜,最終還是要結(jié)果。
對絕影來說,我們敬畏客戶,取得他們的信任和友誼,形成持久的戰(zhàn)略合作,這是因為我們在關(guān)鍵時刻能夠去交付好的結(jié)果。
汽車行業(yè)你也知道,很多時候有一款車沒有做好,可能關(guān)系到這家公司的生死存亡。之所以我說半年的時間,是因為在汽車行業(yè)經(jīng)歷的特定的時間點上,產(chǎn)業(yè)的演進速度與競爭格局是非常激烈的。
只有半年的時間,并不是說沒有錢了、沒有現(xiàn)金流了。而是說,當(dāng)你的技術(shù)落后了,或者是沒有去交付好的時候,半年以后你可能就沒有客戶了。沒有客戶,你自然就已經(jīng)是被市場拋棄了,那么無論你是有多大的團隊規(guī)模、多少現(xiàn)金,其實都是面臨著被淘汰的危險。
所幸的是今天我們是有機會的,但我們要時刻提醒自己,這個機會也是稍縱即逝的,因為大家演進的速度都非?。
大模型上車、端到端自動駕駛,在這個時間窗口里面,如果你不能夠拿出市場上認可的產(chǎn)品和技術(shù)的話,那就會被淘汰。
《遠光燈》: 你的意思是說,無論是誰,汽車產(chǎn)業(yè)的競爭變化是半年決定著大家的存活。
王曉剛: 對,而且你的技術(shù)路線也都是這樣的。去年這個時候,大家都在追求從高速到城區(qū),從有圖到無圖,現(xiàn)在是端到端的兩段式與一段式,技術(shù)演進非?臁
《遠光燈》:從競爭氛圍看,你覺得2021年同2024年有哪些不一樣?你的對手、客戶,跟2021、2022年相比發(fā)生了什么變化?
王曉剛:我們覺得上一個階段競爭出來的結(jié)果是一種標(biāo)準(zhǔn)化產(chǎn)品的交付,到了今天,大家開始關(guān)注端到端,很多企業(yè)也開始了內(nèi)部調(diào)整。
在上一個階段,大家發(fā)現(xiàn)市場上已經(jīng)有一些成熟方案跑出來了,出于時間和成本的考慮,客戶直接采購市場上成熟的方案就可以了。這會使得車企自研團隊跟供應(yīng)商,某種程度上是競爭和替代關(guān)系。
但是端到端出現(xiàn)以后,讓事情發(fā)生了變化。車廠數(shù)據(jù)、用戶駕駛數(shù)據(jù)更具價值了,車廠會給自研團隊一個新的定位。像特斯拉,它不僅有數(shù)據(jù),還有比較強的AI基礎(chǔ)設(shè)施。這十萬塊GPU和幾百萬臺車,能夠形成數(shù)據(jù)閉環(huán),特斯拉想采什么數(shù)據(jù)就可以從自己的數(shù)據(jù)中拿,根據(jù)需要去訓(xùn)練模型。
我們的車廠沒有那么多算力,別說十萬塊GPU,有的連1000塊都沒有。作為供應(yīng)商來說,它又沒有辦法去拿到數(shù)據(jù),那車企和供應(yīng)商要怎么去跟行業(yè)的標(biāo)桿進行抗衡?只有兩個結(jié)合在一起。
《遠光燈》:絕影能解決什么痛點?你們怎么保證這個結(jié)合一定能形成合力?
王曉剛:車廠自己的數(shù)據(jù)是有價值的,但怎么去用好這個數(shù)據(jù)?這需要有資源,怎么用好數(shù)據(jù)也有門檻。
車上每天產(chǎn)生的攝像頭采集數(shù)據(jù)量是龐大的,你不可能把這些數(shù)據(jù)都傳到后臺去,怎么去選擇這些數(shù)據(jù)、在什么樣的條件下去弄,這是非常關(guān)鍵的。
過去的標(biāo)準(zhǔn)化交付和未來與合作伙伴深度的合作,兩者之間有哪些差別,這些需要有車企自研團隊能夠去理解。
你可以想象,如果我們是一個標(biāo)準(zhǔn)化交付,給車廠的方案都是黑盒,車廠不會放心的把數(shù)據(jù)交給你。因為把數(shù)據(jù)交給你,他什么也沒有得到。只有車企也能夠擁有這些研發(fā)體系,能夠理解你的研發(fā)流程,才能夠跟你一起去共同合作,共建共生。只有這樣,車企數(shù)據(jù)的價值才能發(fā)揮出來。這里面就是會產(chǎn)生新的合作的模式,那就是下一個階段了。
《遠光燈》:下一個階段是指什么?
王曉剛:在端到端時代,車企和供應(yīng)商是要有比較深的融合,不僅僅是產(chǎn)品交付層面的合作,中國車企和科技公司的合作閉環(huán)里,不能只是會解bug,需要共同打造一個可升級、可迭代的研發(fā)體系,其實就是AI時代的基礎(chǔ)建設(shè)。
車企和AI公司深度融合,雙方把研發(fā)流程,研發(fā)體系能夠去對齊,不斷更新和迭代它的產(chǎn)品和服務(wù),將推動雙方的進一步合作。
《遠光燈》:你的意思是說,下一步車廠研發(fā)團隊來把數(shù)據(jù)這一塊做好,絕影發(fā)揮AI優(yōu)勢把算法做好,雙方深度綁定。這么做的原因,更多是考慮技術(shù)落地還是成本?
王曉剛:兩方面都有。比如,現(xiàn)在AI、大模型技術(shù)門檻本身就很高,同時需要持續(xù)投入,也需要演進。雖然現(xiàn)在看到有一些有車廠也做大模型,同時自研自動駕駛,不過你會發(fā)現(xiàn)這種模式一定是不劃算的。因為這些投入和基建設(shè)施只是服務(wù)一家企業(yè),但像商湯這樣的AI平臺公司,基礎(chǔ)設(shè)施和服務(wù)投入不光可以分攤到汽車行業(yè),還有到其他行業(yè),去不斷迭代和共享這些平臺。
我們可以說,無論怎樣,目前自動駕駛還在投入期。每個車廠維護一兩千人的團隊,大量投入和維護基礎(chǔ)設(shè)施,對他來說是不可持續(xù)的。尤其是今天,汽車圈價格戰(zhàn)一直在持續(xù),這對成本的要求是非常高的。
除了特斯拉,很少有車企能夠一家單打獨斗把算力、模型和數(shù)據(jù)幾方面都形成規(guī)模,這既需要持續(xù)的龐大資源投入,還需要強大的技術(shù)實力支撐。
“大家要拼平臺能力,否則給了代碼也跑不起來”
《遠光燈》:假設(shè)絕影有了十家合作伙伴,他們都要把數(shù)據(jù)跟你們分享,那客戶們會愿意嗎?
王曉剛:這里面不是直接的數(shù)據(jù)融合。我們絕影具備商湯大裝置這樣行業(yè)領(lǐng)先的算力儲備、原生垂類汽車大模型、領(lǐng)先的軟硬件架構(gòu)和全棧數(shù)據(jù)生產(chǎn)管線等四大技術(shù)基座,是平臺化能力。
合作過程中,絕影愿意白盒交付,對合作伙伴開源,幫助車企掌握大模型研發(fā)的Know-how,理解絕影的研發(fā)流程,雙方的研發(fā)流程和研發(fā)體系相互對齊,讓數(shù)據(jù)在合作伙伴之間流轉(zhuǎn)起來。
在全新的合作模式下,車企在掌握大模型Know-how、對齊研發(fā)流程和體系之后,能夠理解和放大數(shù)據(jù)的價值,選取不同組合的數(shù)據(jù)來針對性訓(xùn)練專屬于自己的模型,打造差異化的特色。
而絕影作為大模型平臺能力的合作支持方,車企伙伴的數(shù)據(jù)回流,形成數(shù)據(jù)閉環(huán),以量產(chǎn)車輛數(shù)據(jù)來驅(qū)動基礎(chǔ)模型的訓(xùn)練和迭代,打造更有針對性、性能更強大的垂類基礎(chǔ)大模型,形成一個良性循環(huán)的深度合作模式,讓雙方你中有我,我中有你。
以大模型行業(yè)為例,既需要GPT-4這樣的模型,也有基于GPT-4長出來各具特色的面向C端的應(yīng)用或者Agent(智能體)。
《遠光燈》:如果自動駕駛的底層技術(shù)越來越趨同,這個差異化怎么體現(xiàn)?供應(yīng)商去做,還是車企去做這個差異化?
王曉剛:車企主導(dǎo),因為在最終產(chǎn)品交付階段,供應(yīng)商跟車企共同完成。車企要篩選數(shù)據(jù),重點強調(diào)什么樣的場景,什么樣的用戶的體驗,這是由車企來主導(dǎo)來完成。
《遠光燈》: 意思是說,就像傳統(tǒng)燃油車時代的博世一樣,你們給各車廠提供一樣的產(chǎn)品或者部件,讓車企去做面向智能化時代的產(chǎn)品和體驗?
王曉剛: 我們提供的不是一樣的產(chǎn)品,如上面說的,我們提供平臺能力,包括訓(xùn)練模型的能力、處理數(shù)據(jù)的能力,還有一些其他基礎(chǔ)能力,這樣的話,車企不需要從頭開始。
絕影的合作模式跟之前博世跟車廠合作不一樣,之前博世是提供比較標(biāo)準(zhǔn)化的部件,讓車企完成組裝、安裝。我們不一樣,未來人工智能時代,差異點最大的是在于高質(zhì)量數(shù)據(jù),大家都得在這方面去下功夫。但是做這個事,得有一個基矗如果從頭開始做起,別人花一年兩年時間就做好,你要三四年才拿出產(chǎn)品去比拼,這是大家接受不了的。
所以絕影其實就是幫助車企打造一個比較好的起點,在這個起點的基礎(chǔ)上,車企再琢磨怎么把數(shù)據(jù)的質(zhì)量進行提升。
《遠光燈》:剛才說白盒交付,這是多大程度的白盒,你們還是有所保留吧?
王曉剛:在大模型時代,白盒交付不是最大的難題。其實今天各個車廠可能已經(jīng)收集很多套白盒代碼了,但是技術(shù)在飛快的演進的,今天收集到這些東西,明年又是下一套。
解決這樣的問題,核心是要找到一個戰(zhàn)略合作伙伴,雙方共同去打造一套研發(fā)體系,而且這個研發(fā)體系,是能夠不斷快速迭代和進步的,這才是比較關(guān)鍵的。
比如說,車企今天用的是A的研發(fā)體系,供應(yīng)商B來了,給一套白盒,這個白盒也挺好的,但要讓所有的研發(fā)團隊從A切換到B,采用另外一套東西的時候,成本就非常高。就算別人給了你白盒,你都不一定愿意做切換。所以,今天就是大家要能夠形成這種合作的話,是比較關(guān)鍵的。
將來,車端的那些代碼會越來越簡單,越來越復(fù)雜的是后端的平臺化能力,算力基礎(chǔ)設(shè)施、數(shù)據(jù)生產(chǎn)管線這些需要時間沉淀和積累的能力。
《遠光燈》:現(xiàn)在多數(shù)車企都已經(jīng)在喊大模型上車了,這個不能幫助他們解決這個問題嗎?
王曉剛:今天大模型時代好多開源的大模型,也有很多開源的代碼,或者是工具鏈。開源大模型的性能或許不弱,但并不能夠百分之百解決問題,滿足企業(yè)的需求,這也導(dǎo)致不能夠把大模型用到實際的業(yè)務(wù)當(dāng)中,不能完全解決問題。
從這種意義上來說,大模型其實沒太大的用處。車企更需要的是什么?是這套模型背后的數(shù)據(jù)生產(chǎn)管線、訓(xùn)練平臺,通過這些要能夠重新再把這個模型再訓(xùn)練一遍,這個能力是很重要的。把開源大模型再訓(xùn)練一遍的企業(yè),這是非常少的。將來大家要比拼的是平臺能力,否則就是給了代碼,企業(yè)也跑不起來。
比如說,一個模型要幾千塊GPU一起才能訓(xùn)練成功的,一般的集群訓(xùn)練起來的話,每20分鐘就要中斷一次,做一次診斷,又得花一天兩天的時間。這其實根本就跑不起來,只有在一套平臺下面,大模型才能發(fā)揮作用。
《遠光燈》:相比幾年前,車企現(xiàn)在還糾結(jié)白盒黑盒問題嗎,有沒有一些改觀?
王曉剛:我們其實不太糾結(jié)白盒交付,一直以來,我們跟車廠的合作都是一個比較開放的,各種合作方式都是可以談。
現(xiàn)在車企對大模型的認知越來越深刻,行業(yè)本身已經(jīng)有一些標(biāo)桿,同時,各家有的時候自己也嘗試過訓(xùn)練大模型,他會發(fā)現(xiàn)大模型都是金子堆出來的,資源消耗非常高。
想從頭到尾去訓(xùn)練一個大模型,比如類似ChatGPT這樣的一個模型要訓(xùn)練出來,消耗都是上億級的,所以這時候大家也都逐漸明白,大模型時代要分工協(xié)作,最后才能把有競爭力的產(chǎn)品和體驗做出來。
這個行業(yè)里,無論是白盒還是黑盒,在殘酷的市場競爭面前,在快速發(fā)展的技術(shù)面前,只有好的產(chǎn)品和體驗才是最具價值和競爭力的。
《遠光燈》:北京車展你們說過商湯絕影UniAD方案的天花板更高,今天還是這樣嗎?
王曉剛: 因為現(xiàn)在大家采用比較多的還是兩段式的端到端,就是把感知的輸出作為規(guī)控的輸入,過程中信息量已經(jīng)大大縮減。最終的結(jié)果就是感知網(wǎng)絡(luò)加上一個比較小的規(guī)控網(wǎng)絡(luò),它對復(fù)雜場景的理解能力是比較有限的。
絕影的方案是只用一個網(wǎng)絡(luò),輸入感知的信息,直接輸出行駛軌跡。預(yù)測行駛軌跡這件事情是非常難的,要達到這個目標(biāo),就必須得讓這個模型自己能夠理解很復(fù)雜的場景。
絕影的一段式端到端,我們并沒有刻意教它去理解復(fù)雜的道路場景,比如施工路段、潮汐車道,還有一些交通標(biāo)志,但最后它也能夠做出復(fù)雜分析決策和路徑規(guī)劃,它是通過視頻數(shù)據(jù)訓(xùn)練的方式學(xué)會的。
這種訓(xùn)練方式需要一個比較大的模型,充分發(fā)揮模型的能力,這需要像商湯大裝置這樣的豐沛算力。如果要是兩段式,其實對訓(xùn)練算力、車載算力的要求,跟以前沒什么太大差別。
我們在北京車展的時候,特別強調(diào)絕影的方案是一段式,是真端到端,F(xiàn)在一些行業(yè)專家和企業(yè)也認可了這個說法。其他企業(yè)也開始走一段式的路。
《遠光燈》:總結(jié)下來,絕影跟車廠之間有幾種合作模式?
王曉剛:一種是標(biāo)準(zhǔn)化交付,就是針對已經(jīng)比較成熟的基于規(guī)則的自動駕駛方案,我們就進行標(biāo)準(zhǔn)化的交付;另外一種是數(shù)據(jù)驅(qū)動的端到端方案,我們希望跟車企深度合作:我們輸出的是平臺化能力,能夠去實現(xiàn)把商湯絕影的基礎(chǔ)設(shè)施跟車企的量產(chǎn)車連接,這樣能夠給端到端的產(chǎn)品帶來比較好的更新迭代,未來隨著商湯大模型技術(shù)和基礎(chǔ)設(shè)施的不斷演進,絕影會給客戶持續(xù)更新底層的平臺化能力。
特斯拉FSD入華,對絕影來說是機會點
《遠光燈》:你怎么評價特斯拉FSD入華?
王曉剛: 我覺得是好事,行業(yè)標(biāo)桿能夠讓大家感受得到自動駕駛的價值,行業(yè)里面有這樣的一個錨點還是非常好的。
我們兩家都是走感知決策一體化的端到端路徑,從推動一段式端到端落地角度來看,我們都是技術(shù)領(lǐng)先的玩家,以更低成本帶來更高開城效率,同時讓量產(chǎn)智駕有更高性能的天花板。
《遠光燈》:它是“鯊魚”還是“鯰魚”?
王曉剛:無論鯊魚還是鯰魚,特斯拉FSD入華對整個行業(yè)的示范作用還有引領(lǐng)作用,這是比較重要的,害怕也沒有用,要積極的去擁抱新的趨勢,參與競爭。我覺得車廠賣車不是單靠自動駕駛這一個功能,涉及到方方面面,有很多綜合因素。
《遠光燈》:假如,特斯拉FSD入華后的表現(xiàn)真的非常強,做到了技術(shù)上非常領(lǐng)先,是不是反而可能會對絕影這樣的供應(yīng)鏈公司有利?傳統(tǒng)主機廠可能會更著急補齊能力?
王曉剛:這確實是我們的機會點。現(xiàn)在行業(yè)里還有觀望的人,產(chǎn)品、性價比很重要,但時機也很重要,錯過了,可能就沒機會了。這個機會窗口對于車企和我們來說,都是一樣的。
主機廠要補齊能力,追趕甚至超越特斯拉,需要實力深厚且志同道合的戰(zhàn)略合作伙伴。商湯絕影是智能汽車行業(yè)非常稀缺的同時具備“大算力+大模型體系+數(shù)據(jù)閉環(huán)+量產(chǎn)經(jīng)驗”等全棧技術(shù)能力的AI公司,我們相信,車企跟我們進行深度合作,會是在AGI時代取得成功的最佳路徑。
在我看來,自動駕駛技術(shù)的發(fā)展與應(yīng)用是循序漸進的,商湯絕影目前已經(jīng)跟廣汽、哪吒和一汽紅旗等多個品牌實現(xiàn)量產(chǎn)落地。同時,我們商湯絕影的UniAD也是面向量產(chǎn)的端到端技術(shù)方案,預(yù)計明年也會量產(chǎn)落地;此外,絕影還有下一代自動駕駛技術(shù)基于多模態(tài)大模型的 DriveAGI智駕大模型。
這些不同技術(shù)路線的智駕方案,都可以成為我們合作伙伴與特斯拉競爭的“武器”,大家一起抓住這難得的時機。同時,商湯絕影是面向全球布局的,對于車企出海戰(zhàn)略也能夠提供有力的支持。
《遠光燈》: 你們正在研發(fā)的DriveAGI相比UniAD方案有哪些不同?是更多考慮了艙駕結(jié)合嗎?
王曉剛:無論是駕駛還是座艙,其實都是大模型的需求,尤其多模態(tài)大模型的出現(xiàn),它既能服務(wù)智駕也能服務(wù)座艙。DriveAGI,它是基于多模態(tài)大模型對端到端智駕方案進行改進研發(fā),也能服務(wù)座艙,能夠帶來感知和交互的變革。
DriveAGI的交互能力非常強大,在體驗上進一步做到可感知、可交互、可信賴。比如在自動駕駛的狀態(tài)下,導(dǎo)航信息顯示車輛需要在下一個路口調(diào)頭才能到達目的地,但主駕位上的用戶知道可以提前在一個缺口直接拐彎,用戶可以語音命令它“直接左拐”,系統(tǒng)會根據(jù)實時路況對命令進行反饋操作。
我們看到了一些芯片廠商正在推出大算力芯片,像英偉達Thor有1000T、2000T的算力,這么大的算力,駕駛部分占用個幾百T,還有很多算力是空出來的。所以大家在想,那就把座艙的大模型也放到同樣一顆芯片里面去,絕影也在努力實現(xiàn)芯片層面的艙駕融合。現(xiàn)階段我們也是有駕駛跟座艙在產(chǎn)品上一些體驗的融合。
《遠光燈》:艙駕融合行業(yè)內(nèi)說了很多年,一直沒實現(xiàn),你覺得這種真正的艙駕融合什么時候才能落地?
王曉剛: 這已經(jīng)有明確的量產(chǎn)時間表了,明年就會有量產(chǎn)車出現(xiàn)在市場上。
《遠光燈》: 價格會不會很高,高算力芯片都不便宜吧?
王曉剛:它也會分成不同檔次。另外,除了英偉達以外,高通、MTK都在推他們的大模型芯片,核心在于把場景跟體驗做出來,消費者才愿意買單。
《遠光燈》: 有觀點說2027年之前,中國市場有90%的汽車品牌要么會倒下,要么就退出中國市常你怎么看?
王曉剛: 競爭激烈,進入淘汰賽是共識。我覺得是會分成不同的層次,大家在不同的區(qū)間,找到自己的發(fā)展領(lǐng)域。
《遠光燈》:商湯絕影希望是在哪個區(qū)間?
王曉剛:我們絕影不希望只是單純拼性價比,而是一定要依托于商湯的基礎(chǔ)設(shè)施和AI大模型能力的領(lǐng)先性,把通用人工智能、大模型這些平臺能力跟車廠形成一個比較深度的合作。
《遠光燈》: 你說的這個領(lǐng)域會不會出現(xiàn)一家獨大的這種局面?比如華為。
王曉剛: 我覺得行業(yè)里面不太會出現(xiàn)一家獨大的情況,因為它需要有一個更加開放的合作模式。以前,某廠商算是一家獨大,從市場份額來說是絕對的領(lǐng)先者,但隨著產(chǎn)業(yè)的發(fā)展,它的合作模式被發(fā)現(xiàn)是不可持續(xù)的,行業(yè)迎來了新的機會,開放合作是更加長久的模式。