展會信息港展會大全

DeepSeek亂殺一通后,OpenAI們終于坐不住了
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-08 07:59:46   瀏覽:182次  

導讀:今年過年,年味濃不濃俺不好說,但 AI 味肯定是夠夠的了。小到年夜飯桌,大到熱搜新聞,哪哪都是 DeepSeek ,就連世超家族群里平時不咋關注科技的親戚,也在說中國的人工智能這次勝了老美一籌。這么說吧, DeepSeek 憑一己之力,拉高了全國對 AI 的認知程度。至于 DeepSeek 到底有多厲害,想必這段時間哥幾個也已經(jīng)上手體驗過了,說它是目前最懂中文互聯(lián)網(wǎng)的 AI 模型,應該沒人 ......

DeepSeek亂殺一通后,OpenAI們終于坐不住了

今年過年,年味濃不濃俺不好說,但 AI 味肯定是夠夠的了。

小到年夜飯桌,大到熱搜新聞,哪哪都是 DeepSeek ,就連世超家族群里平時不咋關注科技的親戚,也在說中國的人工智能這次勝了老美一籌。

這么說吧, DeepSeek 憑一己之力,拉高了全國對 AI 的認知程度。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

至于 DeepSeek 到底有多厲害,想必這段時間哥幾個也已經(jīng)上手體驗過了,說它是目前最懂中文互聯(lián)網(wǎng)的 AI 模型,應該沒人有意見吧?

反正從身邊人統(tǒng)計學來看,這段時間什么 Claude 、 ChatGPT 通通都不香了。

不過大伙兒也先別急著開香檳,這次 DeepSeek 一冒頭,對手們就從四面八方吻了上來。

OpenAI 大年初四發(fā) o3 推理模型,今天又免費開放了搜索功能,谷歌的 Gemini2.0 全量開放,還有阿里的 Qwen2.5-Max 也發(fā)力打榜 DeepSeek 。。。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

要我說,這些科技公司還是得逼一把,不然你都不知道他們的實力到底有多少。

先說 OpenAI 的 o3 ,去年底的發(fā)布會就傳出了消息,說今年 1 月份要上線。

但奧特曼估計也沒想到,被 DeepSeek 狙了一手,現(xiàn)在這個發(fā)布的時間節(jié)點,多少就有點耐人尋味了。包括世超也覺著, o3-mini 的發(fā)布是為了反擊 DeepSeek 。

當然回到正題啊,這次的 o3-mini ,號稱是他們的推理系列中最具成本效益的模型,還尤其擅長科學、數(shù)學和編碼,響應的速度也更快。

一句話總結, o3-mini 就像一個家庭條件一般,但智商很高的理科學霸。

就拿編程來說,除了 o3-mini ( low )打不過 o1 以外, o3-mini 三個檔位的模型,基本亂殺前輩 o1 系列。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

競賽數(shù)學也不在話下, o3-mini ( high )的表現(xiàn)都要好過 o1 系列。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

就連博士級別的題目, o3-mini 也能跟 o1 系列打得有來有回。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

x 上有老哥用同一組 prompt 測試了 o3-mini 和 DeepSeek R1 ,得出的結論是 “ o3-mini ( 編程能力 )碾壓 DeepSeek R1 ” 。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

說實話,光看視頻的話,確實是 o3-mini 的效果更逼真。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

另外一位老哥也測試了一把 o3-mini 的物理理解能力( prompt :編寫一個球在超立方體內(nèi)彈跳的 Python 腳本 ),直接夸 o3-mini 可能是物理學得最好的模型。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

反正看了一波大伙兒的測試,世超覺著 o3-mini 似乎更接近咱們一直在說的,能夠理解物理世界、模擬物理規(guī)律的世界模型。

重點是, o3-mini 現(xiàn)在免費就能用上,可比之前的 o1 要大方的多了。

而且, o3-mini 只是 o3 系列的第一個版本,后面還會有滿血版的 o3 出來。我的建議是讓 DeepSeek 再整個大活,給奧特曼上點強度,到時候指不定還會有大升級。

這不,除了發(fā)布 o3-mini 外, OpenAI 又趁著咱們開工的這兩天,免費開放了 ChatGPT 搜索。

現(xiàn)在你甚至都不需要注冊,就能直接用。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

過年那陣,微軟也讓所有的 Copilot 用戶免費用上了 o1 推理模型,要不說還得謝謝 DeepSeek 呢。

另外一邊,谷歌也有點坐不住了。

同樣是去年 12 月發(fā)布 Gemini 2.0 ,但那會兒只有開發(fā)者和一部分測試者能用,一直咕咕咕也不見有動靜。

結果被 DeepSeek 這么一激,一口氣發(fā)了三個版本的 Gemini2.0 模型。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

基準測試中,各方面性能也都優(yōu)于前代模型。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

但相比 DeepSeek 和 OpenAI 的熱度,谷歌這邊多少就顯得有些無人在意了。

再來看國內(nèi)的情況,阿里云算是第一個對 DeepSeek 發(fā)起 “ 進攻 ” 的公司。

根據(jù)阿里云官方的說法, Qwen2.5-Max 在多個基準測試中,超越 DeepSeek V3 、 o1-mini 等多個模型。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

并且在 Chatbot Arena 的大模型盲測排行榜上, Qwen2.5-Max 沖到了第七的位置。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

具體看模型的數(shù)學和編程能力,甚至還能拿第一。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

所以 Qwen2.5-Max 在發(fā)布后,國內(nèi)有不少媒體都出來捧了一波。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

反正世超看下來,這次由 DeepSeek 掀起的新一輪 AI 軍備競賽,領頭的這一批公司已經(jīng)掏出了不少真家伙。

不過說實在的, DeepSeek 這出后來者居上的戲碼,的確給咱上了一課。

指不定后邊兒還會有更加出色的模型出現(xiàn),畢竟有 DeepSeek R1 的珠玉在前,如果再不拿出點實力相當,或者足夠炸場的東西來,那就沒啥意思了。

咱們坐著等就成,今年的模型大戰(zhàn)肯定有的看了。

DeepSeek亂殺一通后,OpenAI們終于坐不住了

贊助本站

相關熱詞: openai 世超 seek deep 奧特曼

相關內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港