新智元報道
編輯:編輯部
【新智元導讀】谷歌CEO劈柴在年度戰(zhàn)略會議上放出狠話,2025年將是AI領(lǐng)域生死存亡之年。一場足以改變AI未來走向的巔峰對決,即將在2025年全面打響。
2025年還未開始,硅谷的戰(zhàn)鼓已經(jīng)擂響。
在這場AI巨頭之間的角力中,谷歌CEO劈柴放出了一記重磅炸彈。
在谷歌山景城總部舉行的年度戰(zhàn)略會議上,身著節(jié)日毛衣的劈柴語氣凝重地對員工們說道
2025年將是關(guān)鍵的一年!
我們必須認識到當下時刻的緊迫性,公司需要以更快的速度前進。這是一個顛覆性時刻,賭注從未如此之高。
這番話背后,是谷歌與微軟OpenAI之間愈演愈烈的較量。
自ChatGPT橫空出世以來,這家搜索引擎巨頭一直在努力追趕。過去兩年,谷歌的努力幾乎總被愛搶風頭的OpenAI蓋了過去。
直到12月,Gemini 2.0 Flash、Veo 2、「谷歌版o1」Gemini 2.0 Flash Thinking等輪番轟炸,一展超越領(lǐng)先模型的潛力。僅用了90天的時間,谷歌終于逆風翻盤。
這意味著,這場AI競賽終于迎來了轉(zhuǎn)折點。
會議現(xiàn)場,劈柴展示了一張大模型的對比圖,Gemini 1.5傲然領(lǐng)先于OpenAI等其他競爭對手的模型。
當被問及ChatGPT正成為AI的代名詞時,劈柴坦言道,「在歷史長河中,你不必總是第一個,但必須出類拔萃,必須在同類產(chǎn)品中保持第一梯隊。這就是2025年的意義所在」。
谷歌開發(fā)者關(guān)系負責人Logan Kilpatrick多次暗示,明年谷歌真的要發(fā)力了。
預計1月份的目標,完整版Gemini 2.0正式上線。
甚至,在谷歌DeepMind CEO Hassabis年度總結(jié)下面,他稱這些都只是開胃菜,好戲?qū)⒃?025年開始。
有網(wǎng)友預測道,明年谷歌將會把很多強大模型免費推向所有人,而且還會發(fā)布直擊o3的競爭模型。
為了在這場AI革命中占據(jù)制高點,谷歌正全力以赴。
Gemini,下一個5億級用戶爆款應用
對谷歌而言, 可能更糟糕的是競爭對手OpenAI在搜索業(yè)務的挑戰(zhàn)。
雖然谷歌仍主導搜索市場,但GenAI為人們提供了各種訪問在線信息的新方式。
而OpenAI正在被更多人看作是AI的代名詞,如同國外把谷歌看作搜索的代名詞一樣。
谷歌背負著巨大的壓力,正通過重金投資Gemini,來鞏固其在AI領(lǐng)域的領(lǐng)先優(yōu)勢。
Gemini應用程序允許用戶訪問許多工具,包括谷歌的聊天機器人。
劈柴表示,「建立大型新業(yè)務」是重中之重。
谷歌目前擁有15個用戶超過五億的應用, 而高管們普遍認為Gemini應用將是下一個。
劈柴認為Gemini應用具有「強勁勢頭」,但也不得不承認「在2025年還有一些工作要做,以縮小差距并建立領(lǐng)導地位」。
劈柴后來補充道:「明年最大的重點是在消費者方面擴展Gemini。」
此外, 谷歌在美國還被法律纏身,包括其在壟斷搜索的法律裁定,以及非法主導在線廣告技術(shù)的指控。
英國監(jiān)管機構(gòu)則暫時認定谷歌的廣告技術(shù)行為影響了該國的競爭力。
對此,劈柴表示:「這是我們的規(guī)模和成功所帶來的。這是科技正在大規(guī)模影響社會的大趨勢的一部分。因此,此時此刻,我們要比以往任何時刻都要確保自己不會分心!
谷歌,「后來者」居上?
OpenRouterAI的數(shù)據(jù)顯示,谷歌旗下的Gemini在開發(fā)者中的市場份額從9月份的約5%,直接飆升至>50%市場份額,遙遙領(lǐng)先,連帶股價也上漲了14%。
而此時,距離OpenAI發(fā)布ChatGPT的2022年11月30日,已經(jīng)整整過去了2年。
早在2017年,Sam Altman在一次郵件交流中就明確表示,谷歌DeepMind是在AGI競爭中最強大的對手,但令他沒想到的是,曾經(jīng)公認的「AI巨頭」谷歌卻是個「花架子」。
ChatGPT發(fā)布以來,幾乎成了「AI的代名詞」,不僅迅速征服了市場,還連帶著微軟起飛,在Edge瀏覽器中嵌入Copilot AI搜索助手,直接斷崖式領(lǐng)先。
被寄予厚望的谷歌,反倒是昏招頻出,先是Bard難產(chǎn),又經(jīng)歷AI Overview總結(jié)能力大翻車,建議孕婦吸煙、自殺跳橋等等。
在AI順風車下,股價不漲反降,谷歌一時間淪為笑柄,被OpenAI打的毫無還手之力,更準確的說,連同臺競技的資格都沒有。
讓人費解的是,谷歌和DeepMind擁有世界上最好的硬件、最多的訓練數(shù)據(jù)、最頂尖的人才,也發(fā)過很多具有劃時代意義的論文,如AlphaFold、GenCast等,但為什么就連Anthropic這樣的創(chuàng)業(yè)公司都打不過?
網(wǎng)友分析的細節(jié)原因不勝枚舉,一句話來說,就是「船大難掉頭」。
從安全性上考慮,谷歌作為世界級獨一檔的科技巨頭,不論發(fā)布什么產(chǎn)品,其用戶群體都不會小,會涉及到各個種族、不同的意識形態(tài),一點小問題就會被無限放大,而文本生成又是非常主觀的,很容易受到訓練材料的偏見影響,所以谷歌需要更長的時間進行合規(guī)檢查。
23年初,谷歌受輿論裹挾,急急忙忙發(fā)布Bard,在發(fā)布會上關(guān)于問題「關(guān)于詹姆斯韋伯太空望遠鏡,我可以告訴我9歲的孩子它有哪些新發(fā)現(xiàn)?」,Bard給出錯誤答案。
這直接導致公司股價暴跌8%,市值縮水1000多億美元,讓投資群體和用戶大失所望。
但其實OpenAI的產(chǎn)品也經(jīng)常胡說八道、張冠李戴,不過因為是創(chuàng)業(yè)公司,所以大眾的容忍度會高很多,產(chǎn)品標注為beta測試,還可以不斷迭代修改。
作為大公司的谷歌,也受到更多法律上的限制,比如用戶數(shù)據(jù)的版權(quán)問題。
谷歌曾因在AI訓練過程中違反歐盟版權(quán)法被罰款2.5億歐元,也是全球首個因AI訓練數(shù)據(jù)被罰款的案例,坐擁金山,卻無法使用,無異于自斷雙臂。
谷歌的產(chǎn)品線龐大,想要在所有產(chǎn)品中都加入AI驅(qū)動,需要非常細致的產(chǎn)品管理能力,而去年末發(fā)布的Gemini 1.0,因其過度「多樣化」的策略,再次導致股價下跌。
不過,「成功者說什么都是對的」,谷歌重新以王者之姿橫掃AI,未來還計劃繼續(xù)引領(lǐng)「智能體」發(fā)展,攜手瀏覽器和手機端,全自動實現(xiàn)用戶任務。
谷歌年度AI大事件
谷歌并非沒有看到AI市場的巨大潛力, 但2024年才算是開始「發(fā)力」的一年。
很多有名氣的產(chǎn)品基本都是在今年發(fā)布的,比如各種版本的Gemini,NotebookLM,Pixel手機上的AI功能等等。
傳送門:https://blog.google/technology/ai/google-ai-news-recap-2024/
谷歌宣稱在2024年有「60條重大AI發(fā)布」, 不妨看看其中幾條主要的基礎(chǔ)能力。
Gemini模型
去年12月,谷歌推出首個原生多模態(tài)模型Gemini 1.0,打響了谷歌的AI反擊戰(zhàn)。
它可以同時處理文本、視頻、圖像、音頻和代碼等數(shù)據(jù),結(jié)合了包括數(shù)學、物理、歷史、法律、醫(yī)學和倫理在內(nèi)的 57 個學科,也是第一個在MMLU(大規(guī)模多任務語言理解)基準上超越人類專家的模型。
今年2月,谷歌將Gemini 升級到1.5,把上下文窗口從32k提升到100萬個token,超越了同時期所有大模型。
在推理性能上也有大幅提升,Bard也正式更名為Gemini
7月,免費版Gemini 1.5 Flash發(fā)布,支持40多種語言,覆蓋230多個國家和地區(qū),質(zhì)量和延遲都有大幅提升,尤其是在推理和圖像理解方面。
12月推出的Gemini 2.0 Flash集成了多模態(tài)和原生工具使用能力,標志著大模型正式邁入「智能體」時代。
基于Gemini 2.0, 谷歌構(gòu)建了原型項目Mariner,從瀏覽器出發(fā)探索全新的人機交互方式:訓練Gemini來理解并推理瀏覽器屏幕上的信息,包括像素和文本、代碼、圖像和表單等元素,然后通過實驗性的Chrome擴展程序自主完成復雜任務。
在產(chǎn)品方面,谷歌于今年5月基于Gemini推出Ask Photos功能,用戶可以通過輸入關(guān)鍵詞,如地點、人物和日期,或是類似「主題生日派對」等自然語言概念對照片庫進行檢索。
NotebookLM
去年7月,谷歌推出了一款AI驅(qū)動的科研和寫作助手NotebookLM。
一年后,其底層模型切換為Gemini 1.5 Pro,用戶可以上傳研究筆記、訪談記錄或公司文件,然后提出相關(guān)問題以理解和探索復雜材料,支持幻燈片、pdf等多種格式。
9月,NotebookLM發(fā)布重磅Audio Overview功能,模型可以針對用戶材料生成兩位AI主持人互相討論的音頻,可以幫助用戶對材料進行「總結(jié)」和「深入討論」。
不過該功能目前仍然處于實驗階段,比如只會英語,無法打斷等問題。
AlphaFold 3
今年5月,谷歌的AlphaFold 3論文在Nature上發(fā)表,在預測蛋白質(zhì)與其他分子類型相互作用上性能提升了至少50%,在某些重要的相互作用類別,其準確率甚至能翻倍。
論文鏈接:https://www.nature.com/articles/s41586-024-07487-w
2020年發(fā)布的AlphaFold 2實現(xiàn)了蛋白質(zhì)結(jié)構(gòu)預測的根本性突破,在包括瘧疾疫苗、癌癥治療和酶設(shè)計等領(lǐng)域輔助數(shù)百萬科研人員進行新發(fā)現(xiàn),引用超過2萬次。
AlphaFold 3則跳出蛋白質(zhì),進入廣泛的生物分子領(lǐng)域,有可能解鎖更多變革性科學成果,比如開發(fā)生物可再生材料和更具彈性的作物,加速藥物設(shè)計和基因組學研究。
11月,研究人員發(fā)布了AlphaFold 3模型代碼和權(quán)重,以供學術(shù)使用。
Pixel移動端
1月份,谷歌宣布為新款Galaxy S24系列的錄音、筆記等軟件基于Gemini Pro提供摘要能力;基于文生圖模型Imagen 2,為Galaxy S24圖庫提供生成式照片編輯功能。
八月,谷歌發(fā)布自家手機Pixel 9,使用全新的定制芯片Tensor G4提供AI計算能力,整合了大量AI能力,包括生成定制天氣報告、整理截圖信息、本地文生圖等多種功能。
其中最重要的Gemini Live,能夠以更直觀、自然的方式幫助用戶計劃旅行攻略、解決家庭維修問題、構(gòu)思禮物等等。
期待明年谷歌即將帶來的禮物。
參考資料:
https://x.com/tsarnick/status/1872927162757726475
https://www.cnbc.com/2024/12/27/google-ceo-pichai-tells-employees-the-stakes-are-high-for-2025.html
https://techcrunch.com/2024/12/28/google-ceo-says-ai-model-gemini-will-the-companys-biggest-focus-in-2025/
https://www.cnbc.com/2024/12/27/how-googles-sundar-pichai-navigated-a-pressure-filled-year.html