展會信息港展會大全

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-10-25 08:52:17   瀏覽:2551次  

導(dǎo)讀:進入2024年下半年,生成式人工智能仍然是最引人注目的科技焦點。 從初期對人類指令懵懵懂懂的所謂「人工智能」,到今天聽到一個口令就能老老實實地為我們繪畫、寫稿、生成視頻AI帶來的生產(chǎn)力顯著提升,很多人都希望用它輔助自己的工作學(xué)習(xí),以此提高效率,甚...

進入2024年下半年,生成式人工智能仍然是最引人注目的科技焦點。

從初期對人類指令懵懵懂懂的所謂「人工智能」,到今天聽到一個口令就能老老實實地為我們繪畫、寫稿、生成視頻……AI帶來的生產(chǎn)力顯著提升,很多人都希望用它輔助自己的工作學(xué)習(xí),以此提高效率,甚至偷點小懶。

諾貝爾獎對大模型和神經(jīng)網(wǎng)絡(luò)的認可,進一步激勵著國內(nèi)外,科技龍頭企業(yè)密集推出人工智能大模型,投入資源、潛心研究,業(yè)界呈現(xiàn)出百花齊放、迅猛發(fā)展的態(tài)勢,這場環(huán)繞全球的大模型之戰(zhàn)已然燒得如火如荼。

而在這之中,早早開啟全民測試,并已經(jīng)經(jīng)歷了數(shù)次迭代的訊飛星火,顯然是個特殊的存在。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

10月24日,在這個無比熟悉的日子,第七屆世界聲博會暨2024科大訊飛全球1024開發(fā)者節(jié)正式在合肥奧林匹克體育中心舉辦,小雷也受邀參與了本次開發(fā)者節(jié)的開幕演講。

在今天上午的大會上,訊飛重磅發(fā)布訊飛星火4.0Turbo,底座能力再次升級,特別是數(shù)學(xué)、代碼和長文本能力顯著提升,中英文綜合能力保持業(yè)界領(lǐng)先水平,同時訓(xùn)練推理效率大幅提升,進一步滿足日益增長的規(guī);涞匦枨。

不僅如此,今年流行的多模態(tài)交互及超擬人虛擬人交互能力也來了,諸如教育、醫(yī)療、科研、司法、政務(wù)等領(lǐng)域行業(yè)大模型及更多落地應(yīng)用產(chǎn)品也得到了升級展示,不妨現(xiàn)在就跟著我的腳步,一起去看看吧。

訊飛星火升級“一籮筐”

自從去年五月份發(fā)布以來,訊飛星火大模型在短短一年半內(nèi)經(jīng)歷了數(shù)次迭代,星火認知大模型V4.0的快速落地,更是推動著訊飛大模型能力迅速迫近行業(yè)前列。

那么這次訊飛,又能給我們帶來什么驚喜呢?

首先來看看底座大模型訊飛星火4.0 Turbo的全新升級。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

目前星火在文本知識、語言理解等七大能力全面超過GPT-4 Turbo,在數(shù)學(xué)能力、代碼能力更是超過GPT-4o,當(dāng)前已完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預(yù)計今年底可實現(xiàn)類o1的高難度數(shù)學(xué)能力顯著提升。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

不過劉慶峰坦言,目前星火在邏輯推理和多模態(tài)能力較GPT-4o還有所差距,依然需要持續(xù)追趕。

具體功能上,這次訊飛重點介紹的是全新的多模態(tài)交互和超擬人虛擬人技術(shù)。

今年上半年,OpenAI更新的GPT-4o震驚了不少業(yè)內(nèi)人士,這種實時對音頻、視覺和文本進行推理的效果,向更自然的人機交互(甚至是人-機器-機器交互)邁出了重要一步。

五個月后,科大訊飛也在本次大會上首度公開展示自家的星火極速多模態(tài)交互技術(shù)。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

簡單來說,多模態(tài)交互就是通過結(jié)合多種感知形式(如視覺、聽覺、觸覺等)來實現(xiàn)更自然、更高效、更準(zhǔn)確、更靈活的人機交互。

在我看來,這種技術(shù)的核心在于融合來自不同模態(tài)的數(shù)據(jù),大模型需要準(zhǔn)確判斷出輸入數(shù)據(jù)的類型,獲得意圖信息,這樣才能在更廣泛的上下文中理解和處理任務(wù)。

所以現(xiàn)場展示,也得從信息的輸入開始。

負責(zé)現(xiàn)場演示的,依然是我們的老朋友訊飛研究院院長劉聰,帶著大伙一起探索全新的實時語音對話。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

在對話過程中,星火會主動捕捉到用戶當(dāng)前所處的狀態(tài)并積極發(fā)問。例如在劉聰表示最近航班延誤太多,超擬人數(shù)字人就會主動噓寒問暖,甚至還會對現(xiàn)場的大伙賣萌,挺有趣的。

再看看視覺交互,現(xiàn)在星火也可以根據(jù)攝像頭感知周圍世界的信息了。

拍攝桌上的手辦,星火能夠正確識別出孫悟空和奧特曼的角色信息,甚至還能根據(jù)劉聰擺出的姿勢推斷兩名角色之間究竟發(fā)生了什么,還會對此添油加醋融入自己的理解。

這個功能,讓你在海外出游時也能獲得實時語音翻譯和旅游助手,手機可以拿來當(dāng)翻譯機來回翻譯中文和英語,甚至還能夠幫你辨識出不同規(guī)格的海外產(chǎn)品,并給出合適的購買建議。

想更個性化一點?

搭配上既有的仿聲功能,現(xiàn)在僅需一張照片就能生成數(shù)字人,實現(xiàn)更加立體的個性化多維表達,就現(xiàn)場劉聰和自己的分身劉小聰對話的畫面,看起來非常有意思。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

不僅如此,今天還有驚喜。

訊飛還發(fā)布了星火多語音大模型,首批支持中英之外的八個語種,官方稱多語言大模型效果整體達到了GPT-4o的96%,多行業(yè)任務(wù)場景效果甚至超過GPT-4o。

從官方的演示來看,星火多語音大模型主要是用于助力產(chǎn)業(yè)出;蚴琴x能外貿(mào)產(chǎn)業(yè)的,讓使用其他語言的消費者,也能體驗到星火大模型的會議記錄摘要、知識檢索推理、復(fù)雜場景意圖理解等一系列功能,無需依賴海外大模型的加持。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

全國產(chǎn)算力加持的大模型,邁出了走向海外市場的第一步。

星火走向場景,落地千行百業(yè)

當(dāng)然,和我們普通人不同,比起這些生活化的應(yīng)用,很多業(yè)內(nèi)人士更關(guān)心的是這樣的大模型究竟會如何影響行業(yè)動向。

比如說,今天首發(fā)的汽車端側(cè)星火大模型。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

劉慶峰介紹,很多車主應(yīng)該都試過在開車經(jīng)過山洞隧道,或在其他特殊場景下,遇到無網(wǎng)的情況;也有些用戶出于保護個人隱私需求,不希望將個人數(shù)據(jù)同步至云端。

為了解決這個問題,就必須將大模型部署在汽車端本地,為此訊飛推出了參數(shù)量約1.3B的端側(cè)大模型,相比云端效果損失≤1%,端側(cè)首次響應(yīng)40ms,實用效果幾乎沒有差異。

從今年第四季度開始,奇瑞、廣汽、長城等多款車型將會陸續(xù)集成端側(cè)星火大模型上線并開售,用戶很快就能體驗到。

在教育領(lǐng)域上,這次科大訊飛AI學(xué)習(xí)機發(fā)布了“AI作業(yè)過濾器”,用大模型幫學(xué)生科學(xué)減負。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

據(jù)官方介紹,AI學(xué)習(xí)機通過OCR能力識別出練習(xí)題目后,可根據(jù)學(xué)生歷史學(xué)習(xí)情況和本地化考情,將題目分出“必做題”“選做題”“建議不做題”三個等級,學(xué)生可以快速排出學(xué)習(xí)優(yōu)先級,避免重復(fù)無效刷題。

當(dāng)年我要能有這么一臺機子,浪費的無用功起碼得少個50%吧。

當(dāng)然,也有針對教師側(cè)的賦能,除了常規(guī)升級的訊飛智能黑板2.0外,訊飛聯(lián)合中國教科院首發(fā)“基于問題鏈的高中數(shù)學(xué)智能教師系統(tǒng)”也即將正式上線。

具體來說,這項技術(shù)就是把常規(guī)的問題拆解成多步驟的問題鏈,通過這種方式帶領(lǐng)學(xué)生深入理解學(xué)科概念,提升學(xué)習(xí)效果。官方稱試點應(yīng)用顯示,學(xué)生的參與感與興趣明顯增強,教師的教學(xué)效率也得到了提升,評估反饋均相當(dāng)積極。

對了,這次星火醫(yī)療大模型也更新了,來到了2.0版本。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

這次更新中,最重量級的肯定是全新的訊飛星火醫(yī)學(xué)影像大模型,訊飛通過大量醫(yī)療影像實例訓(xùn)練,可實現(xiàn)各類影像自動質(zhì)控,支持同一影像多病種識別診斷。

此外,訊飛還展出了能夠?qū)崟r翻譯漢語和德語等多種語言的多語種AI翻譯透明屏;能協(xié)助政務(wù)機構(gòu)辦公的星火智辦一體機,以及能夠測試智能座艙人機交互效果的VIAS評測機器人。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

據(jù)科大訊飛董事長劉慶峰在演講時透露,今年1月至9月,訊飛星火智能硬件GMV同比提升50%,截至10月23日,雙十一大促全渠道GMV同比增長280%,訊飛的軟硬協(xié)同之路已然走上正軌。

訊飛要讓大模型更好用、更實用

整個發(fā)布會看下來,科大訊飛正在做的事情還挺好理解的:

“讓大模型更好用、更實用。”

在我看來,大模型要想在行業(yè)規(guī);瘧(yīng)用,像水電一樣輸送給千家萬戶,必然需要更多企業(yè)和開發(fā)者的共同參與,僅靠一家公司是難以完成的。而構(gòu)建人工智能“星火”生態(tài),正是訊飛持續(xù)努力的目標(biāo)。

在訊飛介紹的落地實例中,我們不僅看到了政企逐漸實現(xiàn)智能化轉(zhuǎn)型的畫面,還有教育、醫(yī)療、科研等多個行業(yè)的穩(wěn)步推進,越來越多的企業(yè)希望通過引入大模型技術(shù)來“解放生產(chǎn)力,釋放想象力”。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

穩(wěn)住消費者、教育、醫(yī)療、汽車等“根據(jù)地”,切入運營商、金融、能源、交通等“新領(lǐng)域”,還要在企業(yè)市場的規(guī);茝V中扎根,這就是訊飛星火的商業(yè)化路徑。

誠然,現(xiàn)階段OpenAI的產(chǎn)品或許在多模態(tài)、推理能力上依然有優(yōu)勢,但是說斷供就斷供,說切斷就雷厲風(fēng)行地切斷了國內(nèi)廠商和開發(fā)者們繞開限制使用OpenAI的路徑,這種做法使得國內(nèi)企業(yè)根本不能放心使用。

相比國外科技企業(yè),中國科技企業(yè)更善于做“接地氣”的落地。更加豐富的硬件品類、更快落地的技術(shù)應(yīng)用、更加蓬勃的產(chǎn)業(yè)生態(tài)還有優(yōu)勢明顯的視頻生成領(lǐng)域,都是科大訊飛們在持之以恒后取得的出色進展。

沒錯,訊飛星火的這次底座更新,正是對未來可能性的一次探索。

它展示了科大訊飛在人工智能領(lǐng)域的深厚積累,也展示了中國在人工智能領(lǐng)域的強大實力,證明在自主創(chuàng)新的算力底座上,通過領(lǐng)先的算法和數(shù)據(jù)構(gòu)建世界一流的大模型并不是一場夢。

訊飛星火4.0 Turbo發(fā)布!對標(biāo)GPT-4o,多模態(tài)能力大升級

(圖源:雷科技)

不僅如此,在本次大會上,國產(chǎn)超大規(guī)模智算平臺“飛星二號”正式啟動,該國產(chǎn)算力平臺將帶來新模型新算法的持續(xù)適配和智算集群規(guī)模的再次躍遷,持續(xù)探索無人區(qū),并給國內(nèi)外產(chǎn)業(yè)提供第二種選擇。

屬于國產(chǎn)大模型的時代,或許已經(jīng)不遠了。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港