展會(huì)信息港展會(huì)大全

谷歌發(fā)布量子芯片Willow,OpenAI還在擠牙膏式發(fā)布會(huì)
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-16 10:09:26   瀏覽:220次  

導(dǎo)讀:文 | 首席商業(yè)評(píng)論就在OpenAI舉行連續(xù)12天的發(fā)布會(huì)時(shí),谷歌震撼性地發(fā)布了量子芯片Willow,震驚世界,其聲稱(chēng)在一個(gè)標(biāo)準(zhǔn)基準(zhǔn)計(jì)算任務(wù),Willow用時(shí)不到5分鐘(300秒)神速完成。而原來(lái)世界上最快超算Frontier要完成同樣任務(wù),則需要10億億億年,也就是10,000,000,000,000,000,000,000,000年。這是一個(gè)天文數(shù)字,甚至超過(guò)了宇宙的年齡(138億年)!不過(guò)大家也不用恐慌量子計(jì)算會(huì)馬 ......

文 | 首席商業(yè)評(píng)論

就在OpenAI舉行連續(xù)12天的發(fā)布會(huì)時(shí),谷歌震撼性地發(fā)布了量子芯片Willow,震驚世界,其聲稱(chēng)在一個(gè)標(biāo)準(zhǔn)基準(zhǔn)計(jì)算任務(wù),Willow用時(shí)不到5分鐘(300秒)神速完成。

而原來(lái)世界上最快超算Frontier要完成同樣任務(wù),則需要10億億億年,也就是10,000,000,000,000,000,000,000,000年。這是一個(gè)天文數(shù)字,甚至超過(guò)了宇宙的年齡(138億年)!

不過(guò)大家也不用恐慌量子計(jì)算會(huì)馬上顛覆一切,原來(lái)量子計(jì)算的挑戰(zhàn)主要是精確度,簡(jiǎn)單理解就是,計(jì)算快,但誤差也高,如今終于克服了近30年的糾錯(cuò)問(wèn)題,芯片的計(jì)算誤差也呈指數(shù)級(jí)下降,有很大進(jìn)步了,但離真正的概念中的量子計(jì)算機(jī)還有一段距離。

芯片的發(fā)布無(wú)疑在硅谷引發(fā)了一場(chǎng)科技海嘯,還在發(fā)布會(huì)中的OpenAI CEO 山姆奧特曼第一時(shí)間送上祝賀。谷歌CEO劈柴對(duì)此回應(yīng):量子計(jì)算+AI的多重宇宙即將帶來(lái),也恭喜o1大模型發(fā)布!

谷歌發(fā)布量子芯片Willow,OpenAI還在擠牙膏式發(fā)布會(huì)

此外,劈柴還和馬斯克聯(lián)動(dòng)了起來(lái),他說(shuō)未來(lái)可以借助星艦在外太空搞一個(gè)量子計(jì)算集群。馬斯克回復(fù)說(shuō)這是有可能的,并提到了要實(shí)現(xiàn)卡爾達(dá)舍夫第二型文明所需的能源。

如果說(shuō)量子計(jì)算機(jī)還有點(diǎn)遙遠(yuǎn),但AI大模型的更新是離我們很近的,我們來(lái)看看OpenAI連續(xù)幾天的發(fā)布會(huì)到底發(fā)布了什么?OpenAI未來(lái)是要徹底商業(yè)化運(yùn)作了嗎?

意外但不夠驚艷的發(fā)布會(huì):

01 模型仍然是常規(guī)更新

OpenAI好像很久都沒(méi)有大動(dòng)作了,距離Sora的第一次亮相已經(jīng)過(guò)去了294天,距離ChatGPT語(yǔ)音版發(fā)布已經(jīng)過(guò)去了205天,o1前瞻版的發(fā)布也已經(jīng)是九月的事了。不是說(shuō)好的AI元年嗎?怎么熱度反倒是倒過(guò)來(lái)的?

今年上半年Claude 3.5 Sonnet 儼然已經(jīng)成為目前評(píng)價(jià)最好的模型、谷歌正式上架 Veo 視頻生成模型,還有剛發(fā)布的 Genie 2 世界模型,以及李飛飛的世界模型都走上臺(tái)前獲得了不低的關(guān)注度。

OpenAI這個(gè)時(shí)候自然需要“反擊”,來(lái)證明自己“AI一哥”的身份,OpenAI不是老了只是大招還在后面。

谷歌發(fā)布量子芯片Willow,OpenAI還在擠牙膏式發(fā)布會(huì)

Sam Altman指出新版o1在處理復(fù)雜問(wèn)題時(shí)的重大錯(cuò)誤率降低了34%,而且能根據(jù)題目的難易程度調(diào)節(jié)處理時(shí)間,困難的題可能做幾分鐘,但簡(jiǎn)單題目?jī)H需幾秒。這使得用戶(hù)等待時(shí)間下降超過(guò)50%。Sam Altman緊接著給出了它的表現(xiàn)數(shù)據(jù)。o1在國(guó)際數(shù)學(xué)奧林匹克預(yù)選賽題目(AIME 2024)中拿到了83%的正確率,把GPT-4o那可憐巴巴的13%甩得連尾燈都看不見(jiàn)了,比起o1 -preview的56.7%也提升了將近一半!

如下圖所示,o1 Pro 僅用時(shí) 6 分 48 秒就成功解答了 2006 年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽(IMO)的第三題當(dāng)年公認(rèn)難度最高的題目。

谷歌發(fā)布量子芯片Willow,OpenAI還在擠牙膏式發(fā)布會(huì)

2006 年全球約 500 名 19 歲以下的頂尖數(shù)學(xué)學(xué)生中,僅有 28 人能夠完全解答此題……他們擁有 4 個(gè)半小時(shí)的時(shí)間來(lái)攻克……而 6 名美國(guó)隊(duì)成員中無(wú)一人能夠解決這個(gè)問(wèn)題……網(wǎng)友們嘗試使用其他所有模型(包括 o1)來(lái)解決這個(gè)問(wèn)題,結(jié)果 o1 Pro 是唯一一個(gè)大語(yǔ)言模型給出了正確答案,也是目前推理最強(qiáng)的大語(yǔ)言模型。

ChatGPT Pro 訂閱計(jì)劃將允許用戶(hù)無(wú)限制訪(fǎng)問(wèn) o1、o1-mini、GPT-4o 以及高級(jí)語(yǔ)音模式,還包括一個(gè)僅供 Pro 用戶(hù)使用的 o1 版本,也就是o1 pro 模式。但200美元一個(gè)月的價(jià)格也足以勸退大部分普通用戶(hù),有業(yè)內(nèi)人士指出想過(guò)很漲價(jià)但沒(méi)想到會(huì)漲這么多,如果你提不出專(zhuān)業(yè)的問(wèn)題和具體且特別的需求,買(mǎi)這個(gè)會(huì)員就是在浪費(fèi)錢(qián)。

不斷細(xì)分的GPT模型往好處說(shuō)是為了更好滿(mǎn)足不同需求的用戶(hù),但經(jīng)歷過(guò)國(guó)內(nèi)互聯(lián)網(wǎng)手機(jī)和車(chē)圈大戰(zhàn)的人,應(yīng)該能很快明白這是什么意思。更多產(chǎn)品對(duì)應(yīng)具體需求這不假,但本質(zhì)上是在爭(zhēng)取已經(jīng)存量化的細(xì)分市場(chǎng),以至于要出各種不同名頭的產(chǎn)品。這并非不行,但這跟OpenAI宣稱(chēng)的未來(lái)是屬于A(yíng)I的世界,距離恐怕有點(diǎn)遠(yuǎn)。

02 Sora Turbo正式上線(xiàn)

谷歌發(fā)布量子芯片Willow,OpenAI還在擠牙膏式發(fā)布會(huì)

在OpenAI 12天發(fā)布會(huì)的第三天,終于放出了一個(gè)像樣的大招。OpenAI 在 X 平臺(tái)表示,自 2 月份以來(lái),他們一直在構(gòu)建 Sora Turbo,后者是一個(gè)速度明顯更快的模型版本,今天也將其作為獨(dú)立產(chǎn)品向Plus 和 Pro 用戶(hù)開(kāi)放。

在 Sora Turbo「Library」中,用戶(hù)可以保存自己喜歡或有用的提示詞,以便未來(lái)使用。并且保存的提示詞可以按需查看或修改,對(duì)于需要重復(fù)創(chuàng)作相似內(nèi)容的用戶(hù),無(wú)疑能大大提高效率。在工作流方面,Sora 的編輯功能是區(qū)別于其它競(jìng)品的重要亮點(diǎn)。比如說(shuō),在 Remix 功能中,用戶(hù)可以利用純自然語(yǔ)言提示詞對(duì)視頻進(jìn)行編輯,并通過(guò)簡(jiǎn)單的「strength(強(qiáng)度)」選項(xiàng)和滑塊來(lái)控制生成的變化程度。

在技術(shù)規(guī)格上,Sora Turbo支持 5-20 秒的視頻生成,并兼容 1:1、9:16 等主流寬高比。相比早期版本,現(xiàn)在的生成速度有了顯著提升。

有趣的是,由于 Sora Turbo熱度太高,大批用戶(hù)涌入體驗(yàn)網(wǎng)站,導(dǎo)致該網(wǎng)站一度崩潰,停止注冊(cè)登錄。不給力的服務(wù)也讓 Altman 連連在 X 平臺(tái)安撫用戶(hù):由于需求超出預(yù)期,我們將不得不間歇性地關(guān)閉新用戶(hù)注冊(cè),并且生成內(nèi)容的速度會(huì)在一段時(shí)間內(nèi)減慢。我們正在全力以赴!

生成視頻貴這是行業(yè)內(nèi)的普遍共識(shí),但沒(méi)想到這次Sora Turbo貴的超乎想象,連兩百美元的會(huì)員都不能自由生成。對(duì)于訂閱用戶(hù)而言,20 美元的 ChatGPT Plus 計(jì)劃提供 50 個(gè)優(yōu)先視頻額度(1000 積分),支持最高 720p 分辨率和 5 秒時(shí)長(zhǎng)。而200 美元的 ChatGPT Pro 計(jì)劃則提供最多 500個(gè)優(yōu)先視頻(10000 個(gè)積分),支持最高 1080p 分辨率、20 秒時(shí)長(zhǎng)、5 個(gè)并發(fā)生成和無(wú)水印輸出。

雖然官方博客中提到,Sora Turbo用了一種新的擴(kuò)散模型,它通過(guò)從一段看起來(lái)像靜態(tài)噪聲的基礎(chǔ)視頻開(kāi)始,逐步去除噪聲并轉(zhuǎn)變?yōu)樽罱K的視頻。通過(guò)同時(shí)處理多個(gè)幀,模型成功解決了一個(gè)難題:即使目標(biāo)暫時(shí)脫離視野,也能確保其在視頻中始終保持一致。

谷歌發(fā)布量子芯片Willow,OpenAI還在擠牙膏式發(fā)布會(huì)

比如畫(huà)面中門(mén)的開(kāi)向各開(kāi)各的

但生成視頻共有的一些毛病他還是有的,在物理模擬方面,模型對(duì)物體運(yùn)動(dòng)的理解還不夠深入,常常出現(xiàn)動(dòng)作不自然、物體突然消失等問(wèn)題。特別是在處理帶有腿部運(yùn)動(dòng)的對(duì)象時(shí),經(jīng)常出現(xiàn)前后腿位置混亂的情況,導(dǎo)致動(dòng)作看起來(lái)不自然。

谷歌發(fā)布量子芯片Willow,OpenAI還在擠牙膏式發(fā)布會(huì)

又或者,某些視頻生成結(jié)果看起來(lái)像是慢動(dòng)作,而視頻的其他部分則以正常速度播放,肉眼很容易察覺(jué)這種「別扭」。簡(jiǎn)言之,Sora 還是沒(méi)能解決老毛病,缺乏對(duì)物理世界規(guī)律的理解。另外,Sora 沒(méi)能解決文字生成的問(wèn)題,導(dǎo)致經(jīng)常出現(xiàn)文字混亂的現(xiàn)象。

筆者認(rèn)為這次Sora Turbo最大更新恐怕是對(duì)產(chǎn)權(quán)的明晰,官方博客中寫(xiě)道,未經(jīng)他人許可使用他人肖像,并禁止描繪真實(shí)未成年人;禁止創(chuàng)建非法內(nèi)容或侵犯知識(shí)產(chǎn)權(quán)的內(nèi)容;禁止生成有害內(nèi)容,例如未經(jīng)同意的親密影像、用于欺凌、騷擾或誹謗的內(nèi)容,或旨在傳播暴力、仇恨或使他人痛苦的內(nèi)容;創(chuàng)建并傳播用于欺詐、詐騙或誤導(dǎo)他人的內(nèi)容。

谷歌發(fā)布量子芯片Willow,OpenAI還在擠牙膏式發(fā)布會(huì)

所有 Sora Turbo生成的視頻都帶有 C2PA 元數(shù)據(jù),這些元數(shù)據(jù)能夠標(biāo)識(shí)視頻的來(lái)源,從而提高透明度,并可用于驗(yàn)證其來(lái)源。這些動(dòng)作或許可以應(yīng)對(duì)一些新聞媒體和藝術(shù)家對(duì)OpenAI的侵權(quán)起訴,可能有助于A(yíng)I視頻和內(nèi)容快速走向商業(yè)化。

03 OpenAI也要把商業(yè)化放在第一位了

正如我們這次的標(biāo)題所言O(shè)penAI最新發(fā)布會(huì),很意外、很昂貴、很著急。論技術(shù)力OpenAI仍然是行業(yè)第一這沒(méi)有問(wèn)題,但技術(shù)和美好的愿景并不足以解決所有問(wèn)題,能夠正常商業(yè)運(yùn)作且有盈利可能的產(chǎn)品才能活得更久。

OpenAI在接受FT財(cái)經(jīng)網(wǎng)采訪(fǎng)時(shí)表示,他們制定了明年沖擊 10 億活躍用戶(hù)的目標(biāo),現(xiàn)在 ChatGPT 的周活在 2.5 億左右;完全不線(xiàn)性的增長(zhǎng)預(yù)期,建立在和蘋(píng)果的合作上,iPhone 的全球活躍設(shè)備超過(guò) 20 億臺(tái),這會(huì)是成為搭便車(chē)的最好機(jī)會(huì);OpenAI 給投資者畫(huà)大餅時(shí)也表示,達(dá)到 10 億活躍用戶(hù),才能拿到和 Meta、Google 上同一張牌桌的入場(chǎng)券;OpenAI 今年的收入突破了 40 億美金,但同時(shí)創(chuàng)造了 50 億美金以上的成本,虧損壓力難以忽視;API 業(yè)務(wù)對(duì)收入貢獻(xiàn)很大,但利潤(rùn)很低,來(lái)自 C 端用戶(hù)的直接訂閱才是最賺錢(qián)的,這也是 OpenAI 對(duì)提高活躍用戶(hù)規(guī)模興趣甚高的原因。

OpenAI 首席財(cái)務(wù)官 Sarah Friar 在接受《金融時(shí)報(bào)》采訪(fǎng)時(shí)表示:"到 2025 年,我們將從一家服務(wù)數(shù)百萬(wàn)用戶(hù)的研究實(shí)驗(yàn)室,發(fā)展成為服務(wù)全球數(shù)十億消費(fèi)者的科技巨頭。"這家成立九年的創(chuàng)業(yè)公司正在向全球科技巨頭轉(zhuǎn)型,為公司創(chuàng)始人兼 CEO Sam Altman 所描繪的"智能時(shí)代"做好準(zhǔn)備。

OpenAI從非盈利組織轉(zhuǎn)向盈利的大公司幾乎是可以確定的事,改變世界很美好但在這之前他們要先活下來(lái)。

不過(guò)OpenAI的大餅真的能這么順利實(shí)現(xiàn)嗎?

OpenAI 新任政策主管 Chris Lehane 透露,公司計(jì)劃在美國(guó)中西部和西南部地區(qū)建設(shè)數(shù)據(jù)中心集群,以支持未來(lái)發(fā)展。這一自建 AI 基礎(chǔ)設(shè)施的戰(zhàn)略,與 Google 和 Amazon 等科技巨頭的做法如出一轍。Lehane 指出,在 AI 競(jìng)爭(zhēng)中,"芯片、數(shù)據(jù)和能源"是取得成功的三大關(guān)鍵要素。但問(wèn)題在于OpenAI并不比這些大公司在芯片、數(shù)據(jù)和能源上擁有太多優(yōu)勢(shì)。

iPhone用戶(hù)雖然全球有20億活躍設(shè)備,但支持AI功能的只有最近兩年的產(chǎn)品,AI本地化是蘋(píng)果一直倡導(dǎo)的,未必會(huì)支持用戶(hù)去購(gòu)買(mǎi)功能更為復(fù)雜成本更高01模型或者Sora Turbo。而且蘋(píng)果自家AI也一直在追趕,能用自己的未來(lái)肯定會(huì)用自己的,搭便車(chē)可沒(méi)想象中那么容易。

OpenAI對(duì)AGI五個(gè)階段定義如下:1)L1:聊天機(jī)器人(Chatbots),具備對(duì)話(huà)能力的AI;2)L2:推理者(Reasoners),具備人類(lèi)的推理水平能解決很多復(fù)雜難題;3)L3:智能體(Agents),不只是推理,還能執(zhí)行全自動(dòng)化業(yè)務(wù)的智能體;4)L4:創(chuàng)新者(Innovators),能協(xié)助人類(lèi)完成新發(fā)明的AI;5)L5:組織(Organizations),可以自動(dòng)執(zhí)行組織全部業(yè)務(wù)的AI。

據(jù)新浪科技,2024年中旬,OpenAI評(píng)估自己處于L1階段,而這次超長(zhǎng)發(fā)布會(huì)后,筆者認(rèn)為OpenAI有望在此次發(fā)布會(huì)后進(jìn)入L2階段和L3初級(jí)階段,01模型的推理能力已經(jīng)毋庸置疑,智能體(Agents)也有望在這次發(fā)布會(huì)出現(xiàn)。

Agent可幫忙尋找營(yíng)銷(xiāo)線(xiàn)索、推送潛在客戶(hù)、進(jìn)行初期產(chǎn)品溝通等,帶來(lái)實(shí)際收入,所以大家愿意買(mǎi)單。Agent的核心是大模型的推理能力(鏈?zhǔn)酵评、多步推理能力),它能把?fù)雜事情拆解成多步,若多步推理能力不足,AI成功率很低。國(guó)內(nèi)已經(jīng)有大模型在推送Agent服務(wù),或許OpenAI這次能提供不一樣的東西。

寫(xiě)在最后

目前OpenAI模型的真正使用者更多是專(zhuān)業(yè)開(kāi)發(fā)者和領(lǐng)域?qū)<已芯繂T,普通大眾用于聊天不需要這么大算力需求。而專(zhuān)業(yè)人士對(duì)人類(lèi)科技進(jìn)步和生產(chǎn)力提升有很大幫助,也會(huì)反推大家能力提升。所以這個(gè)時(shí)候,就不要談生成式AI是偽需求了。

但AI也走過(guò)了早期教育市場(chǎng)的階段,需要回答如何在性能、效果、成本之間實(shí)現(xiàn)平衡了。Agent算是眼下不多的AI熱點(diǎn),但從算力上來(lái)講,Agent模式的成本開(kāi)支較大,是GPU的5到10倍左右,算力消耗大,是AI應(yīng)用的瓶頸之一。有時(shí)候或許要做的不是另辟蹊徑,而是先在成本上合理性可靠性,再來(lái)談商業(yè)化的事。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港