(圖片來源:鈦媒體AGI編輯林志佳拍攝)
“大模型六虎”加速內(nèi)卷,百川智能公布金融垂直領(lǐng)域模型。
12月23日消息,鈦媒體AGI獲悉,王小川創(chuàng)立的通用 AI 公司百川智能今天發(fā)布全鏈路領(lǐng)域增強大模型Baichuan4-Finance。在高質(zhì)量金融數(shù)據(jù)的基礎(chǔ)上,通過行業(yè)首創(chuàng)自約束訓(xùn)練方案,Baichuan4-Finance實現(xiàn)金融能力和通用能力,極大提高金融場景整體可用性。其金融專業(yè)能力和場景應(yīng)用能力大幅領(lǐng)先GPT-4o。
百川智能創(chuàng)立于2023年4月10日,由搜狗公司創(chuàng)始人、前CEO王小川創(chuàng)立,旨在打造中國版的OpenAI,構(gòu)建中國最好的大模型底座,幫助大眾輕松、普惠地獲取世界知識和專業(yè)服務(wù),并在醫(yī)療與行業(yè)領(lǐng)域應(yīng)用落地。截至目前,百川智能已相繼推出16款大模型,涵蓋開源、閉源、學(xué)術(shù)科研、國產(chǎn)算力等多個維度。
今年10月31日,百川智能宣布推出包括Baichuan4-Turbo、Baichuan4-Air兩款模型在內(nèi)的一站式大模型商業(yè)化解決方案,即1+3產(chǎn)品矩陣(全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù),Baichuan4-Turbo、Baichuan4-Air兩款模型和全鏈路領(lǐng)域增強工具鏈)。
如今,百川智能向金融領(lǐng)域提供全新的大模型產(chǎn)品。
具體來說,中國人民大學(xué)財政金融學(xué)院12月17日發(fā)布的金融評測體系FLAME以及國內(nèi)主流開源金融評測基準FinancelQ上,Baichuan4-Finance均登上榜首。其中,F(xiàn)LAME-Cer評測結(jié)果顯示,Baichuan4-Finance在銀行、保險、基金、證券等多個資格認證領(lǐng)域的準確率均突破了95%,整體準確率93.62%,大幅領(lǐng)先金融領(lǐng)域公認的綜合實力最強的通用模型之一GPT-4o、國內(nèi)首個開源中文金融大模型XuanYuan3-70B-Chat,超出GPT-4o近20%。
同時,百川智能打造了一套全鏈路領(lǐng)域增強方案,該方案覆蓋了高質(zhì)量數(shù)據(jù)集構(gòu)建、模型預(yù)訓(xùn)練、微調(diào)、強化學(xué)習(xí)等從模型研發(fā)到場景應(yīng)用的全流程。同時,Baichuan4-Finance還在領(lǐng)域自約束訓(xùn)練過程中引入了更高精的通用數(shù)據(jù),與高質(zhì)量金融數(shù)據(jù)一起進行混合訓(xùn)練,最終實現(xiàn)了模型通用能力不下降,金融能力穩(wěn)定增長的效果。此外,百川智能在后訓(xùn)練環(huán)節(jié)也做了大量增強工作,如:通過合成數(shù)據(jù)、指令數(shù)據(jù)對模型進行有監(jiān)督的微調(diào);在強化學(xué)習(xí)策略中,針對數(shù)學(xué)計算等金融領(lǐng)域特別關(guān)注的場景進行樣本增強等,進一步提升了模型性能。
商業(yè)化層面,目前,百川智能已經(jīng)服務(wù)了數(shù)千家客戶,包括北電數(shù)智、完美世界游戲、愛奇藝、360集團、生學(xué)教育、愛學(xué)堂等各行業(yè)的領(lǐng)軍企業(yè),并且與信雅達、用友、軟通動力、新致軟件、達觀數(shù)據(jù)、華勝天成等多家行業(yè)生態(tài)伙伴,以及華為、中科曙光等硬件廠商,中國移動、中國電信、中國聯(lián)通等運營商達成合作,攜手構(gòu)建百川大模型生態(tài)。
用友表示,Baichuan4-Finance憑借其海量的金融專業(yè)知識儲備,在財稅知識問答場景中,準確率較Baichuan4-Turbo提升了20%,較GPT-4o提升了10%,表現(xiàn)尤為亮眼;軟通動力表示,自部署B(yǎng)aichuan4-Finance以來,其客戶滿意度提升了20%。
事實上,百川智能已經(jīng)轉(zhuǎn)向行業(yè)模型領(lǐng)域。百川智能創(chuàng)始人、CEO王小川早前表示,AGI 正在產(chǎn)生巨大的突破,但目前百川沒有達到世界級的水平,只是有一定成績,對自己來講有 60 分吧。主要今天在現(xiàn)實和理解中得找到自己的一條道路,百川認為自己已經(jīng)打明牌了,有實踐的路徑。
“定義什么是 AGI,其實有很多行業(yè)討論,大家不斷在上面加碼。之前我們討論‘機器怎么才算有智能?’以前是圖靈測試,對話者分辨不出來是人還是機器,這就算智能了。到了今天,機器還要會解數(shù)學(xué)題,還要有主動學(xué)習(xí)的能力。我理解 AGI 是做到“像人一樣”,像一個數(shù)字員工,能夠在多個職業(yè)里產(chǎn)生工作成果。之前和一個技術(shù)大佬交流,他質(zhì)疑當下的大模型,他說大模型七位數(shù)乘法都做不好。我反問‘你會嗎?你拿著科技公司的股份,你也不會七位數(shù)的乘法,你為什么要求 AGI 會?’這是個審美問題,我們以前總是把 AGI 當成一個工具,它是超級計算機,能精確地做計算,或者跑程序跑得很快。但 AGI 本身,我覺得就像人一樣,如果審美沒有建立好,你怎么去評價它呢。AGI 正在產(chǎn)生巨大的突破,它的文章已經(jīng)寫得像最頂尖的文科生了,還可以寫詩,隨著 OpenAI o1 的推出,AI 有了更好的邏輯推理能力,文理雙修。但它并不是上帝,它像一個極其聰明的人,但它現(xiàn)在真的知道宇宙規(guī)律嗎?”王小川表示,AGI 現(xiàn)在還在飛速發(fā)展中。往后還有新的突破,發(fā)展速度并沒有變慢。大家都過高期待這兩年的速度,也許三五年后,就會非常不一樣。而今天我們從互聯(lián)網(wǎng)時代走入到了 AI 時代,他感覺很幸運,沒有錯過每一個時代。
對于 AI 搜索,王小川表示,雖然這能走出百度射程,甚至能夠顛覆百度,但它依然在字節(jié)產(chǎn)品的射程里!皬母偁幗嵌,在大廠的 DAU(日活躍用戶)范疇內(nèi),我們還是處于弱勢地位,在很多地方也搞不過小公司,他們對于需求敏感度的把握,會把腰部公司撕的粉碎,他們有很強的競爭力。反過來,醫(yī)療領(lǐng)域大家都認為是垂類,小公司不一定做的動,雖然上一代已經(jīng)投了 1000 億進去,投資人很多都失去信心了,但投資還在持續(xù)加大。”
王小川強調(diào),醫(yī)療絕不只是垂直方向,它不僅與 AGI 是等價的,還代表著生命科學(xué)的未來想象。
“我們從今天的智能時代走向生命時代,可能會越走越廣闊,醫(yī)療是當下特別好的,獨有的一個卡位,但我相信在三年、五年后,大家會看到它不是個垂直方向,它可能代表更廣闊的未來!蓖跣〈ǚQ。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|胡潤峰)