自從 ChatGPT 橫空出世,AI 的熱潮已經(jīng)席卷了兩年。這兩年,普通人對(duì)大語(yǔ)言模型的能力興奮,隨便一條指令就能生成流暢自然的文本,科幻電影里的場(chǎng)景,如今早已經(jīng)成為現(xiàn)實(shí)。
大模型這個(gè)賽道也開(kāi)始進(jìn)入到一個(gè)十字路口,新技術(shù)如何轉(zhuǎn)化為新產(chǎn)品,滿足真需求,發(fā)展成新的商業(yè)生態(tài)。
如同移動(dòng)支付、智能手機(jī)、 LTE 共同點(diǎn)燃了移動(dòng)互聯(lián)網(wǎng)時(shí)代的繁盛,AI 行業(yè)這一年也在尋找這樣的 PMF(Product Market Fit)而焦慮。
新技術(shù)的大航海時(shí)代已經(jīng)開(kāi)啟,到底能不能發(fā)現(xiàn)新大陸,這將決定大模型是不是又一個(gè)燒錢的資本游戲,是 .com 泡沫的加速重演,還是如黃仁勛所言的新工業(yè)革命開(kāi)端,這個(gè)答案會(huì)比 AGI 更快讓我們看到 。
大模型的大問(wèn)題
今天,基座模型的競(jìng)爭(zhēng)基本已經(jīng)形成穩(wěn)定的格局。由 OpenAI 領(lǐng)銜,旗下的 ChatGPT 也是穩(wěn)居市場(chǎng)龍頭。Anthropic,DeepMind,Llama,Grok,也各有各的長(zhǎng)處。
于是,今年最熱鬧的,不是誰(shuí)又多擴(kuò)充了多少參數(shù)、響應(yīng)速度提高了多少秒,而是大模型技術(shù)怎么化身為一個(gè)能用的產(chǎn)品。
大語(yǔ)言模型的技術(shù)怎么落地,從一開(kāi)始就是個(gè)抓肝撓心的問(wèn)題。哈佛商業(yè)評(píng)論曾經(jīng)做過(guò)一個(gè)調(diào)查,發(fā)現(xiàn)生成式 AI 的應(yīng)用種類之繁雜,多達(dá) 100 類。
不過(guò),在大類上就是五種:技術(shù)問(wèn)題解決、內(nèi)容生產(chǎn)及編輯、客戶支持、學(xué)習(xí)和教育、藝術(shù)創(chuàng)作和調(diào)查研究。
知名的投資公司 a16z,給出了他們團(tuán)隊(duì)心中優(yōu)秀的生成式 AI 產(chǎn)品,其中有不少眼熟的,比如通用類的 Perplexity,Claude,ChatGPT。也有更為垂直的,比如筆記類產(chǎn)品 Granola, Wispr Flow,Every Inc.,Cubby 等。還有教育賽道今年最大贏家 NotebookLM,或者是聊天機(jī)器人 Character.ai,Replika 等。
繁花錦繡是對(duì)于普通用戶來(lái)說(shuō)的:上面這些產(chǎn)品,絕大多數(shù)只是免費(fèi)就足夠用了,訂閱版或 pro 版的費(fèi)用,不是必須花的錢。強(qiáng)如ChatGPT,今年的訂閱收入大概在每月 2.83 億美元,與去年相比增長(zhǎng)了兩倍。但在巨大的成本面前,這點(diǎn)收入顯得杯水車薪。
享受科技發(fā)展屬于普通用戶的開(kāi)心事,烈火烹油是留給從業(yè)者的:再怎么激動(dòng)人心的技術(shù)進(jìn)化,也不能停留在實(shí)驗(yàn)室里,而是要進(jìn)入商業(yè)社會(huì)接受檢驗(yàn)。訂閱模式?jīng)]有被廣泛接受,植入廣告的時(shí)機(jī)還沒(méi)有到來(lái)。留給大模型空燒錢的時(shí)間,已經(jīng)很少了。
相比之下,toB 業(yè)務(wù)的走勢(shì)讓人有信心的多。
自 2018 年以來(lái),財(cái)富 500 強(qiáng)財(cái)報(bào)電話會(huì)議中提及 AI 的次數(shù)幾乎翻了一番。在所有財(cái)報(bào)電話會(huì)議中,19.7% 的記錄提到最多的主題,就是生成式人工智能。
這也是整個(gè)行業(yè)的共識(shí)。根據(jù)中國(guó)信通院發(fā)布的《人工智能發(fā)展報(bào)告(2024 年)》藍(lán)皮書,2026 年,超過(guò) 80%的企業(yè)將使用生成式人工智能 API,或者部署生成式的應(yīng)用。
面向企業(yè)側(cè)和消費(fèi)側(cè)的應(yīng)用展現(xiàn)出不同的發(fā)展態(tài)勢(shì):面向消費(fèi)側(cè),大模型應(yīng)用講究低門檻、創(chuàng)意性。而面向企業(yè)側(cè),大模型應(yīng)用更注重專業(yè)定制和效益反饋。
換句話說(shuō),提升效益當(dāng)然是每個(gè)企業(yè)都在追求、都想實(shí)現(xiàn)的,但只有這四個(gè)字太模糊了。大模型需要證明自己能實(shí)實(shí)在在地解決使用場(chǎng)景中的問(wèn)題,真真切切地提升效益。
精準(zhǔn)找到切角,讓技術(shù)降落
無(wú)論是資源的投入,還是對(duì)開(kāi)拓市場(chǎng)的力度,國(guó)內(nèi)的大模型競(jìng)爭(zhēng),在整個(gè) 2024 年稱得上激烈。
根據(jù)工信部數(shù)據(jù),2023 年中國(guó)大語(yǔ)言模型市場(chǎng)規(guī)模增長(zhǎng)率突破 100%,市場(chǎng)規(guī)模達(dá)到 147 億元。各家廠商在商業(yè)化進(jìn)程上積極嘗試,首先打響的是價(jià)格戰(zhàn):以 tokens 計(jì)費(fèi)、API 調(diào)用等方式的成本,正在被不斷拉低。許多主流熱門通用類大模型的價(jià)格,離白用已經(jīng)沒(méi)多遠(yuǎn)。
把價(jià)格打下、降低成本是更好實(shí)現(xiàn)的。而理解業(yè)務(wù)、分析切入場(chǎng)景,是一條更崎嶇的路線。
不過(guò),也不是每一家都在參與價(jià)格戰(zhàn),靠低價(jià)硬卷。
「在這種情況下,更重要的是找到我們的特點(diǎn),發(fā)揮我們的優(yōu)勢(shì)。騰訊內(nèi)部本身有很多場(chǎng)景,這些場(chǎng)景給了我們更多洞察,也進(jìn)一步打磨了我們的能力」騰訊云智能 AI 產(chǎn)品專家、騰訊混元 ToB 產(chǎn)品負(fù)責(zé)人趙新宇這樣認(rèn)為,「往外看,聚焦一個(gè)行業(yè),聚焦在這個(gè)行業(yè)內(nèi)一些特定的場(chǎng)景,再慢慢拓展出去。」
在眾多基座模型中,混元可能不是熱度最高的一個(gè),可在技術(shù)實(shí)力上卻不容忽視。
九月時(shí),混元發(fā)布的通用文生文模型混元 Turbo,采用全新的混合專家模型(MoE)結(jié)構(gòu)。從語(yǔ)言理解和生成、邏輯推理、意圖識(shí)別,到編碼、長(zhǎng)上下文和聚合任務(wù)中,都有相當(dāng)強(qiáng)大的表現(xiàn)。在 11 月的動(dòng)態(tài)更新版本中,已經(jīng)升級(jí)為全系列效果最好的模型。目前,騰訊混元的能力正在通過(guò)騰訊云全面輸出,通過(guò)提供多尺寸、多類型的模型,結(jié)合騰訊云智能其他的AI產(chǎn)品和能力,幫助模型應(yīng)用落地到場(chǎng)景中。
縱觀目前模型應(yīng)用落地形態(tài),大致分為兩種:嚴(yán)肅場(chǎng)景和娛樂(lè)場(chǎng)景。后者類似于聊天機(jī)器人、陪伴類應(yīng)用等等。
而「嚴(yán)肅場(chǎng)景」,則指向企業(yè)核心業(yè)務(wù)運(yùn)營(yíng)中,對(duì)準(zhǔn)確性和可靠性要求較高的應(yīng)用場(chǎng)景。在這些場(chǎng)景中,大模型要承擔(dān)結(jié)構(gòu)化的信息處理,往往需要遵循預(yù)設(shè)的業(yè)務(wù)流程和質(zhì)量標(biāo)準(zhǔn),其應(yīng)用效果,會(huì)直接關(guān)系到企業(yè)的運(yùn)營(yíng)效率和業(yè)務(wù)成果。
騰訊云曾經(jīng)幫助一家外呼服務(wù)商構(gòu)建客服體系,這是一個(gè)典型的嚴(yán)肅類場(chǎng)景。同時(shí),外呼涉及到自然語(yǔ)言對(duì)話能力、內(nèi)容理解和分析能力,看上去天然和大語(yǔ)言模型有極高的適配。
實(shí)際上,挑戰(zhàn)都在細(xì)節(jié)之處。當(dāng)時(shí)團(tuán)隊(duì)面臨核心挑戰(zhàn)有兩個(gè)。一是性能問(wèn)題,由于模型參數(shù)量巨大,達(dá)到 70B 或 300B 規(guī)模,如何在500毫秒內(nèi)完成響應(yīng),并傳遞給下游 TTS 系統(tǒng)成為一個(gè)重要的技術(shù)難題。
二則是對(duì)話邏輯的準(zhǔn)確程度。模型會(huì)在在一些對(duì)話中出現(xiàn)不合邏輯的回復(fù),影響整體對(duì)話效果。為了克服這些挑戰(zhàn),項(xiàng)目團(tuán)隊(duì)采取了密集迭代的策略,在 1-2 個(gè)月的開(kāi)發(fā)周期內(nèi),保持每周一個(gè)版本的快速迭代節(jié)奏。
企業(yè)客戶對(duì)大語(yǔ)言模型技術(shù)展現(xiàn)出興趣,并愿意進(jìn)行創(chuàng)新嘗試,但在技術(shù)與業(yè)務(wù)的深度融合方面,始終存在認(rèn)知鴻溝。這并非源于企業(yè)對(duì)自身業(yè)務(wù)理解的不足,而是需要一個(gè)專業(yè)的技術(shù)團(tuán)隊(duì),通過(guò)深入理解行業(yè)痛點(diǎn)和業(yè)務(wù)場(chǎng)景,找到最恰切的場(chǎng)景,為企業(yè)量身打造 AI 落地的方案,實(shí)現(xiàn)技術(shù)與業(yè)務(wù)的最優(yōu)契合。
「?jìng)鹘y(tǒng)的做法可能需要運(yùn)營(yíng)人員一個(gè)場(chǎng)景一個(gè)場(chǎng)景地搭建(語(yǔ)料庫(kù)),」新宇介紹到,「而大模型,你只需要給一個(gè) prompt,就可以實(shí)現(xiàn)需求了!乖诿宄枨蠛螅煸膱F(tuán)隊(duì)幾乎每周一個(gè)版本更新,「卷」起了迭代速度,一兩個(gè)月下來(lái),準(zhǔn)確度已經(jīng)達(dá)到了 95%。
對(duì)于這家外呼服務(wù)商,生成式技術(shù)完全是新鮮事物。而混元直接讓他們看到了大模型所帶來(lái)的效益,在人力方面的開(kāi)支減少了四分之三。
「最好的做法就是把效果拿出來(lái),」新宇說(shuō),當(dāng)客戶對(duì)生成式技術(shù)的了解有一點(diǎn),但不多的時(shí)候,把效果擺出來(lái)是最有效的。通過(guò)客戶的業(yè)務(wù)經(jīng)歷,找到可以切入的場(chǎng)景,直接去做測(cè)試驗(yàn)證,展示出可以提升的效果。
類似的經(jīng)歷,在體現(xiàn)和小米的合作中,這是一次被稱為「雙向奔赴」的合作。
對(duì)方希望在問(wèn)答互動(dòng)中引入大模型,把AI搜索的能力應(yīng)用到端側(cè)。這踩中了混元的兩個(gè)長(zhǎng)處:一是由騰訊豐富的內(nèi)容生態(tài)所提供的支持;二是混元在 AI 搜索方面的力。對(duì)于問(wèn)答來(lái)說(shuō),準(zhǔn)確率非常關(guān)鍵。
「一開(kāi)始還是有很多困難的,」新宇回顧道,「從他們的角度來(lái)看,業(yè)務(wù)形態(tài)涵蓋了多個(gè)場(chǎng)景,包括閑聊、知識(shí)問(wèn)答等不同類型,其中知識(shí)問(wèn)答場(chǎng)景,對(duì)準(zhǔn)確率有比較高要求!
通過(guò)前期的測(cè)試,混元團(tuán)隊(duì)明確了自己在搜索場(chǎng)景中的優(yōu)勢(shì),雙方一起將廣泛意義上的問(wèn)答互動(dòng),按照不同的話題層級(jí)逐步細(xì)化。這樣的細(xì)分,能夠讓模型更清晰地了解各個(gè)場(chǎng)景的具體需求和效果要求,從而進(jìn)行更有針對(duì)性的優(yōu)化。
知識(shí)問(wèn)答場(chǎng)景,成了那個(gè)降落點(diǎn)。在后續(xù)的實(shí)現(xiàn)上,混元需要攻克的挑戰(zhàn)仍不少:時(shí)延問(wèn)題不必多說(shuō),響應(yīng)時(shí)間一定要快;其次是對(duì)搜索內(nèi)容的整合。
「在整個(gè)鏈路當(dāng)中,我們做了自建搜索引擎,還有一個(gè)意圖分類模型,來(lái)判斷是不是一個(gè)高時(shí)效性的提問(wèn)。比如是不是跟新聞、時(shí)事相關(guān)的話題,然后再判斷是該給到主模型還是 AI 搜索!
只調(diào)用最需要的部分,這樣一來(lái)響應(yīng)速度能夠大大提升。而一個(gè)重要的發(fā)現(xiàn)是, 70% 的問(wèn)詢都會(huì)引到 AI 搜索上,這意味著必須要有足夠豐富的內(nèi)容,作為最基礎(chǔ)的調(diào)用支撐。
而混元背后,站著的是整個(gè)騰訊的內(nèi)容生態(tài)。從新聞、音樂(lè)、金融,甚至醫(yī)療等更具體的領(lǐng)域,都能在騰訊的生態(tài)里找到海量的優(yōu)質(zhì)內(nèi)容。這些都是混元模型在搜索時(shí),可以觸達(dá)和引用的數(shù)據(jù),也是獨(dú)一無(wú)二的壁壘。
經(jīng)過(guò)歷時(shí)兩個(gè)多月的高強(qiáng)度迭代,最終無(wú)論是回答的質(zhì)量、響應(yīng)和性能等方面,都完全實(shí)現(xiàn)了需求,上線到了小米的實(shí)際業(yè)務(wù)中。
toB 業(yè)務(wù)的要義便在于此,能夠?qū)崿F(xiàn)營(yíng)收、能夠贏得信任,需要實(shí)實(shí)在在給客戶的業(yè)務(wù)帶來(lái)價(jià)值。
「卷」泛化,才能走向更多場(chǎng)景
大模型在不同行業(yè)和產(chǎn)品的落地中,實(shí)際上也在促進(jìn)技術(shù)自身的成長(zhǎng)。
對(duì)于一部分大模型產(chǎn)品而言,選擇 toC 的路徑有一個(gè)核心考量:用 C 端的反饋來(lái)優(yōu)化模型。大模型對(duì)調(diào)優(yōu)的需求沒(méi)有盡頭,而 C 端消費(fèi)群的數(shù)量和活躍度,為模型的迭代提供了養(yǎng)料。這樣一來(lái),迭代的飛輪就能跑起來(lái)。
實(shí)際上,這在 toB 業(yè)務(wù)中也會(huì)實(shí)現(xiàn),甚至要求更高。
「少年得到」的 K12 語(yǔ)文作文批改功能,應(yīng)用了混元的多模態(tài)能力。結(jié)合騰訊云智能的 OCR 技術(shù),識(shí)別學(xué)生的作文內(nèi)容,并根據(jù)設(shè)置好的評(píng)分標(biāo)準(zhǔn),由大模型為作文打分。
通常,大模型和真人教師判分,差值在五分內(nèi)就很好了可這并不容易實(shí)現(xiàn)。一開(kāi)始混元的評(píng)分和真人教師的評(píng)分,差值小于五分的情況,只有 80%。
「模型有一定方法和能力,能夠解決一些場(chǎng)景里的問(wèn)題。但是聚焦到一個(gè)具體客戶的業(yè)務(wù)上,對(duì)這個(gè)效果有更高的要求。」新宇說(shuō),「可能 90%的準(zhǔn)確度可以達(dá)成業(yè)務(wù)目標(biāo),但只有 70% 和 80% 的時(shí)候,就有一定距離。」
這意味著還要繼續(xù)「卷」下去。隨著服務(wù)企業(yè)客戶群體的不斷擴(kuò)大,對(duì)技術(shù)本身也提出了新要求:首先是迭代速度的大幅提升面向 C 端用戶時(shí),迭代可能需要一到兩個(gè)月。而現(xiàn)在,每周都能出現(xiàn)一個(gè)版本,這種高頻迭代節(jié)奏極大促進(jìn)了模型的成長(zhǎng)和進(jìn)步。
其次,通過(guò)持續(xù)服務(wù)不同企業(yè)場(chǎng)景,也顯著增強(qiáng)了模型的泛化能力。這表明,深入服務(wù)多元化的企業(yè)需求不僅加快了模型開(kāi)發(fā)迭代的節(jié)奏,也提高了模型的實(shí)用性和適應(yīng)性,可以從嚴(yán)肅場(chǎng)景,拓展到偏娛樂(lè)向的場(chǎng)景中。
剛剛獲得千萬(wàn)級(jí) A 輪融資的角色扮演內(nèi)容平臺(tái)「造夢(mèng)次元」,應(yīng)用到了混元大模型的角色扮演專屬模型Hunyuan-role,定位于服務(wù)年輕用戶,結(jié)合生成式 AI 技術(shù),提供交互式、劇情化的虛擬角色互動(dòng)體驗(yàn)。
Hunyuan-role 開(kāi)創(chuàng)了一種全新的人機(jī)交互方式。通過(guò)塑造豐富多樣的虛擬角色形象,并基于預(yù)設(shè)的劇情背景和人物設(shè)定,與用戶展開(kāi)自然流暢的互動(dòng)對(duì)話。
在技術(shù)層面,這樣的場(chǎng)景應(yīng)用到了 Hunyuan-role 在長(zhǎng)短文本對(duì)話處理、意圖識(shí)別和響應(yīng)等方面都展現(xiàn)出領(lǐng)先優(yōu)勢(shì),能夠勝任多樣化的應(yīng)用場(chǎng)景,并且展現(xiàn)出了出色的內(nèi)容擬人化能力不僅能夠進(jìn)行有溫度的對(duì)話互動(dòng),還可以推進(jìn)故事情節(jié)發(fā)展,營(yíng)造沉浸式的用戶體驗(yàn)。
這些特性使得 Hunyuan-role 成為產(chǎn)品獲客和用戶運(yùn)營(yíng)的有力工具,在提升用戶留存率和使用粘性方面發(fā)揮著重要作用。同樣也反映出,在嚴(yán)肅場(chǎng)景得到鍛煉和提升的混元,從而形成的泛化能力,可以覆蓋到更廣闊的場(chǎng)景,乃至在端側(cè)的應(yīng)用。
從嚴(yán)肅場(chǎng)景,逐步擴(kuò)展到娛樂(lè)、創(chuàng)意,乃至更多的場(chǎng)景,是大模型應(yīng)用必須走上的征程。
隨著技術(shù)的成熟和成本的降低,大模型勢(shì)必要向更廣泛的應(yīng)用場(chǎng)景擴(kuò)展。原先聚焦于嚴(yán)肅的商業(yè)場(chǎng)景,如企業(yè)辦公、數(shù)據(jù)分析、科研等行業(yè),因?yàn)檫@些場(chǎng)景具有明確的需求和較高的支付意愿。
進(jìn)一步拓展到娛樂(lè)、創(chuàng)意、內(nèi)容生產(chǎn)等行當(dāng)中,需要在思路上有一個(gè)錨點(diǎn):始終以解決具體場(chǎng)景中的需求點(diǎn)為核心目標(biāo),錨定融合大模型能力的切入點(diǎn)。
除了與應(yīng)用軟件的合作,也需要有和硬件廠商的合作,讓模型在最靠近消費(fèi)者的端側(cè)有所施展與發(fā)揮,提供更貼近用戶的日常生活,提供更便捷、即時(shí)的服務(wù)體驗(yàn)。
這個(gè)過(guò)程中,市場(chǎng)對(duì)生成式 AI 技術(shù)的認(rèn)知和接受度在不斷提高,用戶基數(shù)也在持續(xù)擴(kuò)大。面對(duì)這種快速變化的市場(chǎng)環(huán)境,模型的迭代能力變得尤為重要。這不僅體現(xiàn)在技術(shù)性能上,還包括對(duì)用戶需求的理解、對(duì)不同場(chǎng)景的適應(yīng)性等多個(gè)維度。只有那些能夠快速學(xué)習(xí)、持續(xù)優(yōu)化、不斷適應(yīng)新需求的模型和團(tuán)隊(duì),才能在競(jìng)爭(zhēng)中保持優(yōu)勢(shì)。
在不斷覆蓋更多場(chǎng)景的時(shí)候,也是在走向更多的終端消費(fèi)者。隨著市場(chǎng)整體對(duì)生成式技術(shù)的接受,潛在用戶量會(huì)持續(xù)增加,一個(gè)能夠快速迭代和自我提升的模型,才可以敏銳地適應(yīng)變化,走得更穩(wěn)、更遠(yuǎn)。
#歡迎關(guān)注愛(ài)范兒官方微信公眾號(hào):愛(ài)范兒(微信號(hào):ifanr),更多精彩內(nèi)容第一時(shí)間為您奉上。
愛(ài)范兒 |原文鏈接 查看評(píng)論 新浪微博