展會(huì)信息港展會(huì)大全

探索 AI 落地場(chǎng)景圖譜:從技術(shù)挑戰(zhàn)到商業(yè)應(yīng)用的多元視角 | 2024T-EDGE
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-13 15:11:32   瀏覽:286次  

導(dǎo)讀:12月7日,在北京市大興區(qū)舉辦的2024T-EDGE創(chuàng)新大會(huì)暨鈦媒體財(cái)經(jīng)年會(huì)上,「AI 落地場(chǎng)景圖譜」圓桌由鈦媒體集團(tuán)聯(lián)合創(chuàng)始人劉湘明主持,TDK InvenSense 副總裁 Pankaj Aggarwal、Traini 創(chuàng)始人孫鄰家、MascotGO 首席技術(shù)官 Peter Avritch、萬魔聲學(xué)董事長(zhǎng)謝冠宏、紅杉中國(guó)合伙人張涵等嘉賓,圍繞 AI 落地應(yīng)用面臨的挑戰(zhàn)、各公司在 AI 領(lǐng)域的進(jìn)展與商業(yè)模式、AI 在不同領(lǐng)域的發(fā)展趨 ......

12月7日,在北京市大興區(qū)舉辦的2024T-EDGE創(chuàng)新大會(huì)暨鈦媒體財(cái)經(jīng)年會(huì)上,「AI 落地場(chǎng)景圖譜」圓桌由鈦媒體集團(tuán)聯(lián)合創(chuàng)始人劉湘明主持,TDK InvenSense 副總裁 Pankaj Aggarwal、Traini 創(chuàng)始人孫鄰家、MascotGO 首席技術(shù)官 Peter Avritch、萬魔聲學(xué)董事長(zhǎng)謝冠宏、紅杉中國(guó)合伙人張涵等嘉賓,圍繞 AI 落地應(yīng)用面臨的挑戰(zhàn)、各公司在 AI 領(lǐng)域的進(jìn)展與商業(yè)模式、AI 在不同領(lǐng)域的發(fā)展趨勢(shì)等話題展開。

Traini公司通過大量視頻標(biāo)注理解寵物行為并選擇模型,與寵物行為專家合作確保數(shù)據(jù)準(zhǔn)確性,公司在共情方向投入研發(fā),產(chǎn)品有 C 端用戶,且在模型端可輸出,與多家硬件公司合作。

孫鄰家表示,Traini未來嘗試在醫(yī)療端輔助診斷、為具身機(jī)器人提供數(shù)據(jù)。目前主要專注于狗狗領(lǐng)域,因北美和歐洲狗狗市場(chǎng)大且狗狗行為與人類交互更直接,未來可能延伸到其他領(lǐng)域。

謝冠宏提到,萬魔聲學(xué)在耳機(jī)降噪(飛機(jī)、火車降噪及通話降噪)、省電方面取得成果,睡眠豆第三代可準(zhǔn)確監(jiān)控心率、呼吸和睡眠狀態(tài)。眼鏡產(chǎn)品也在發(fā)展,雖市場(chǎng)挑戰(zhàn)大但從一開始就注重差異化。

Peter Avritch提到,他的開發(fā)工作圍繞研究如何使用和獲取數(shù)據(jù),為用戶提供個(gè)性化推薦。

Pankaj Aggarwal則表示,AI 發(fā)展需要更多傳感器,傳感器能讓AI變得更智能,如耳機(jī)能判斷發(fā)言者自動(dòng)調(diào)節(jié)聲音,未來機(jī)器人將使用更多傳感器,覆蓋消費(fèi)、工業(yè)設(shè)備等多領(lǐng)域,且需關(guān)注小設(shè)備功能局限、安全及隱私問題。

張涵從投資視角闡述了目前AI應(yīng)用在尋求大規(guī)模落地和商業(yè)化方面面臨的挑戰(zhàn),包括落地場(chǎng)景、Token成本控制、數(shù)據(jù)安全等。他認(rèn)為在應(yīng)用落地的優(yōu)化方向上,創(chuàng)業(yè)者可以尋找和構(gòu)建對(duì)模型以及Agent的輸出結(jié)果要求不太高的使用場(chǎng)景,實(shí)現(xiàn)產(chǎn)品和商業(yè)化更快、更早的落地。

探索 AI 落地場(chǎng)景圖譜:從技術(shù)挑戰(zhàn)到商業(yè)應(yīng)用的多元視角 | 2024T-EDGE

以下是圓桌對(duì)話實(shí)錄,經(jīng)鈦媒體APP編輯整理:

劉湘明:特別高興今天有這樣的機(jī)會(huì)討論落地的問題,這次在美國(guó)參加很多AI會(huì)議,主要是兩個(gè)方向,一是AI落地;二是AI工具,結(jié)合大家在領(lǐng)域里的觀察,目前AI應(yīng)用落地面臨有哪些挑戰(zhàn)和障礙是什么?

Pankaj Aggarwal:數(shù)據(jù)收集的過程應(yīng)該是一大挑戰(zhàn),以及從不同來源收集數(shù)據(jù)并且進(jìn)行整合,這也是挑戰(zhàn)。

過去十年,AI有100萬倍的計(jì)算成本下降,數(shù)據(jù)量增加了1萬倍,在這個(gè)過程中AI不斷地應(yīng)用數(shù)據(jù),將數(shù)據(jù)數(shù)字化。

比如對(duì)于馬拉松長(zhǎng)跑選手,可能配備了不同的傳感器,現(xiàn)在的AI技術(shù)有沒有能力把所有數(shù)據(jù)進(jìn)行收集,并且進(jìn)行符合需求的數(shù)據(jù)分析,這是非常重要的。

很多時(shí)候,AI數(shù)據(jù)沒有很好地被應(yīng)用。比如很多小的設(shè)備,可能在電力或者其它方面有局限,導(dǎo)致沒有辦法在每時(shí)每刻收集數(shù)據(jù)。

智能終端或者智能邊緣也受到行業(yè)關(guān)注,我們需要有不同的傳感器,比如溫度傳感器、水分傳感器,以及其它的像WiFi、藍(lán)牙、云上設(shè)施等,收集并分析數(shù)據(jù)的過程受到電池的限制。

孫鄰家:AI落地應(yīng)用最大的挑戰(zhàn)有三。第一,人們對(duì)大模型的期待非常高,大家期待出現(xiàn)能夠顛覆移動(dòng)互聯(lián)網(wǎng)的大模型應(yīng)用,一般的應(yīng)用大家會(huì)覺得它太薄,不足夠變成殺手級(jí)的應(yīng)用。這會(huì)和實(shí)際有個(gè)gap(差距),這個(gè)gap會(huì)導(dǎo)致做應(yīng)用的公司,去融資或者想拿到足夠的錢,再往前的時(shí)候難度變得更大。

第二,很多做應(yīng)用的公司,認(rèn)為具備工程能力,又對(duì)大模型比較了解,就可以做了,過程中會(huì)使用現(xiàn)有的開源技術(shù)。但實(shí)際上這些公司對(duì)場(chǎng)景、用戶需求的理解,特別是在整個(gè)Workflow(工作流程)上理解比較淺,在做產(chǎn)品或者應(yīng)用的時(shí)候很難切到用戶的痛點(diǎn)。

第三,現(xiàn)在的AI應(yīng)用某種程度上等于AI Agent,需要有自己的模型。建立模型的時(shí)候,不論利用開源技術(shù)還是自己架構(gòu)的技術(shù),最后要形成比較獨(dú)特的技術(shù)優(yōu)勢(shì),這個(gè)技術(shù)優(yōu)勢(shì)上邊要疊加無數(shù)的數(shù)據(jù),在AI應(yīng)用層面,很多數(shù)據(jù)都是非結(jié)構(gòu)性的,怎么樣去處理、采集非結(jié)構(gòu)性的數(shù)據(jù),達(dá)到能夠訓(xùn)練大量模型的程度,把它變成非常獨(dú)特的產(chǎn)品,這對(duì)于一般的團(tuán)隊(duì)而言難度非常大,至少有一件事情大家必須要去做,就得去讀論文,讀英文的論文非常難,對(duì)于小公司而言非常難。

謝冠宏:AI終端存在四個(gè)主要難點(diǎn)。

省電難點(diǎn)。萬魔聲學(xué)幾年來一直在改進(jìn)和克服省電、輕薄、穿戴舒適等問題,AI終端需做到不用時(shí)省電stand by一整天,又能隨叫隨到,使用時(shí)可迅速連接藍(lán)牙、wifi等,且視頻要有高帶寬。

音質(zhì)難點(diǎn)。要提高聲音質(zhì)量、消除噪音,讓使用者既能清楚理解對(duì)方講話,也能清晰聽到自己說話,還能發(fā)出接近人類的聲音給對(duì)方,改變傳統(tǒng)AI一問一答模式,實(shí)現(xiàn)全時(shí)間雙向?qū)崟r(shí)對(duì)應(yīng),能分清不同語(yǔ)言,雙方和動(dòng)作,目前在眼鏡、耳機(jī)上已做到相應(yīng)程度。

APP難點(diǎn)。使用AI需下載APP,但跟Apple、谷歌搶入口較難,未來是萬物互聯(lián)時(shí)代,可通過直接拉群的方式解決,同時(shí)提升使用的便利性。我們使用專利技術(shù)為人,AI與 messager 結(jié)合一物1號(hào),達(dá)成人機(jī)互聯(lián)。

手機(jī)本地agent難點(diǎn)。要清楚分辨其能做和不能做的事,比如訂披薩時(shí)不能放入銀行賬號(hào)和家庭住址等隱私信息,當(dāng)前模型設(shè)有防火墻隔離,但同時(shí)還要充分利用云端的智能跟資訊。

Peter Avritch:談到生成式AI,我的工作就是研究做哪些工具加入到大語(yǔ)言模型當(dāng)中,研究如何使用這些數(shù)據(jù),如何獲取這些數(shù)據(jù),再把這些數(shù)據(jù)給回到大語(yǔ)言模型,實(shí)現(xiàn)個(gè)性化的推薦。

比如對(duì)于某個(gè)人來說,上哪所大學(xué)最合適,這不僅僅是學(xué)術(shù)問題、財(cái)務(wù)問題,它包含各個(gè)方面。對(duì)于16、17歲的孩子來說,做這樣的決策可能是整個(gè)人生最重要的決策,我們希望能夠運(yùn)用到大模型幫助年輕人來做決策。

張涵:大模型這兩年發(fā)展非?欤芰相對(duì)有限,特別是在內(nèi)容準(zhǔn)確度、輸出能否符合預(yù)期等方面,離大規(guī)模商用和到基于Agent做閉環(huán)操作還是有距離的,仍然需要技術(shù)側(cè)、產(chǎn)品側(cè)的人才去不斷想辦法優(yōu)化。

在應(yīng)用優(yōu)化的方向上,可能會(huì)有一批優(yōu)秀的產(chǎn)品經(jīng)理或者創(chuàng)業(yè)者去構(gòu)建更新的場(chǎng)景,比如他們尋找的用戶群體可能對(duì)模型和Agent的輸出結(jié)果預(yù)期沒有那么高。在這種情況下,產(chǎn)品反而變得更容易落地,商業(yè)化也更容易形成。

AI創(chuàng)業(yè)者還會(huì)普遍碰到token的成本問題,這和之前移動(dòng)互聯(lián)網(wǎng)的差別比較大。當(dāng)你做了一個(gè)AI產(chǎn)品,這個(gè)產(chǎn)品在還沒有形成良好盈利狀態(tài)和商業(yè)模式的時(shí)候,在這上面消耗的token以及獲客的成本疊加等等會(huì)使得整體成本變得更高。

最后是數(shù)據(jù)。不同的場(chǎng)景下,企業(yè)側(cè)可能積累了很多私有數(shù)據(jù)。如何在最大化保護(hù)數(shù)據(jù)隱私、數(shù)據(jù)和模型安全的前提下,讓私有數(shù)據(jù)和自己的業(yè)務(wù)側(cè)結(jié)合,與大模型聯(lián)接起來,從而提高工作效率,這可能還是個(gè)挑戰(zhàn)。

劉湘明:?jiǎn)杺(gè)小問題,“Traini”的名字由何而來?商業(yè)模式就是把寵物的語(yǔ)言翻譯成人能聽懂的語(yǔ)言,怎么做到的?

孫鄰家:其實(shí)是training的縮寫,我們想表達(dá)寵物到人類世界被馴化的過程。

我們是全球第一家用生成式AI做寵物行為分析的商業(yè)公司,通過大量視頻的標(biāo)注,系統(tǒng)性地理解寵物行為之后,再去選擇模型。我們目前專注在狗上面,會(huì)和頂級(jí)的寵物行為專家合作,讓他們成為我們的一部分,而且要付出很高的成本,例如股權(quán)給他們,來進(jìn)行專業(yè)數(shù)據(jù)的標(biāo)注,保證Ground truth最后能夠?qū)崿F(xiàn)。

其次我們?cè)诠睬榉较蛏线M(jìn)行大量的研究和開發(fā),例如用語(yǔ)音的方式呈現(xiàn),克隆成狗兒子和狗父母說話的形式,整個(gè)體驗(yàn)對(duì)于產(chǎn)品都起到?jīng)Q定性的作用。我們看起來是C端產(chǎn)品,但做小模型一旦擁有數(shù)據(jù),建立數(shù)據(jù)壁壘,就有很大的能力可以做C2B,這個(gè)模式可以成立,目前在模型端也可以輸出,在硬件上可以用到。像蘋果、華為、尼桑汽車、上汽等等很多大的硬件公司都在找我們合作。

原來做的非常垂直領(lǐng)域的小的事情,是個(gè)芝麻,我們現(xiàn)在已經(jīng)把它變成通用,當(dāng)模型能力變成通用之后,未來我們就可以做成寵物生活的生態(tài),就可以拿到西瓜,這是我們的邏輯。

我們其實(shí)還在探索商業(yè)模式,但基本的想法在C端收取費(fèi)用費(fèi),提供API給這些公司。另外,做寵物可穿戴設(shè)備,實(shí)時(shí)進(jìn)行翻譯。未來嘗試在醫(yī)療端,給寵物醫(yī)生做醫(yī)療輔助診斷,以及給具身機(jī)器人提供數(shù)據(jù),讓具身機(jī)器人在生活中可以和狗狗交互,做成更通用的場(chǎng)景。

我們主要做北美和歐洲,1.6億條的狗狗,市場(chǎng)足夠大。其次是狗狗的行為和人類的交互更突出、更直接,用這樣的解決方案,對(duì)我們的產(chǎn)品突出上會(huì)更大,作為創(chuàng)業(yè)公司我們只能做選擇,在未來的時(shí)候再延伸到其它領(lǐng)域。

劉湘明:其實(shí)音頻耳機(jī)是AI最早用到的領(lǐng)域,我現(xiàn)在的問題是在未來,AI會(huì)給我們帶來哪些驚喜,在硬件方面?

謝冠宏:我們專注在小模型,以前用在降噪、輔助睡眠、輔助聽覺,以及運(yùn)動(dòng)的器材,這些東西來做學(xué)習(xí)的終端,會(huì)越來越多,而且越來越準(zhǔn)確,就像睡眠豆第三代,它對(duì)于心率、呼吸和睡眠狀態(tài)有非常準(zhǔn)確的監(jiān)控。

一是和健康相關(guān),和運(yùn)動(dòng)相關(guān)的,逐漸AI會(huì)提供更多的東西;二是翻譯,我們做的比較大的改變是實(shí)時(shí)雙向?qū)φ劊还苁裁凑Z(yǔ)音都共同做。另外的驚喜是這種硬件會(huì)越來越多,耳機(jī)、眼鏡、戒指、手表、鞋子等,這方面會(huì)提供很多驚喜。

降噪分兩方面,一是飛機(jī)或者火車上的聲音,把聲音降下來,這和世界一流水平可以媲美,部分效果甚至超越,因?yàn)锳I學(xué)習(xí)給到我們很大的幫助;二是通話降噪,我在跟他講話,但是我旁邊吵鬧的聲音不要出來,AI就是要學(xué)習(xí)這是噪音,這是聲音,再傳送完美的原音的時(shí)候,其它噪音不能傳過去,再就是現(xiàn)在的省電越做越好。

劉湘明:簡(jiǎn)單進(jìn)行總結(jié),各個(gè)嘉賓我覺得來自于AI創(chuàng)業(yè)領(lǐng)域不同的環(huán)節(jié),其實(shí)我的感覺就是,AI其實(shí)有兩個(gè)方向,一是提高效率,做好“牛馬”;二是怎么去把生活過慢,提供足夠的情緒價(jià)值,追求效率的最后也是為了追求更美好的生活,所有的落地,所有的應(yīng)用都是期待更好的明天,謝謝大家。

更多精彩內(nèi)容,關(guān)注鈦媒體微信號(hào)(ID:taimeiti),或者下載鈦媒體App

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港