劃重點
01人工智能領(lǐng)域競爭對手Anthropic挖走OpenAI聯(lián)合創(chuàng)始人杜爾克金馬,加入其團隊。
02金馬在AI領(lǐng)域具有很高的學(xué)術(shù)造詣和影響力,曾領(lǐng)導(dǎo)多項研究項目。
03除了金馬,Anthropic還招募了OpenAI前安全主管揚萊克和聯(lián)合創(chuàng)始人約翰舒爾曼。
04OpenAI在2024年度開發(fā)者大會上發(fā)布了多項新工具,如提示詞緩存、視覺微調(diào)等。
05然而,此次開發(fā)者日并未宣布新的AI模型,GPT-5或視頻生成模型Sora仍需等待。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
最近,人工智能(AI)領(lǐng)域的人員流動和大動作十分頻繁,尤其是兩家明星公司 OpenAI 和 Anthropic。
就在 OpenAI 召開 DevDay 開發(fā)者大會之時,Anthropic 宣布了 OpenAI 聯(lián)合創(chuàng)始人杜爾克金馬(Diederik Kingma)入職的消息。
兩家公司在 AI 發(fā)展方向和安全理念上的差異,似乎正在重塑行業(yè)格局。
金馬的職業(yè)生涯橫跨學(xué)術(shù)界和產(chǎn)業(yè)界。他于 2017 年以優(yōu)異成績獲得荷蘭阿姆斯特丹大學(xué)博士學(xué)位,研究方向為深度學(xué)習(xí)和生成模型。
早在 2015 年,尚未拿到博士學(xué)位的金馬就成為了 OpenAI 的創(chuàng)始團隊成員,后來在 2018 年 6 月離職并加入谷歌。
此后他一直是谷歌大腦(DeepMind)的研究科學(xué)家,領(lǐng)導(dǎo)了多項研究項目,主要集中在文本、圖像和視頻生成模型。
金馬還是深度學(xué)習(xí)領(lǐng)域極具影響力的 Adam 算法的發(fā)明者之一。此外,他在該領(lǐng)域的貢獻還包括開發(fā)了變分自編碼器、Glow 生成模型和變分?jǐn)U散模型等等。
在 AI 領(lǐng)域,無論是學(xué)術(shù)造詣還是影響力,金馬都排得上號。毫無疑問,他的加入讓 Anthropic 的團隊如虎添翼。
圖 | 金馬在自己主頁上發(fā)布的個人經(jīng)歷(來源:金馬)
“Anthropic 的 AI 開發(fā)方法與我的理念高度契合。”金馬在 X 平臺上寫道,“我期待為 Anthropic 負(fù)責(zé)任地開發(fā)強大 AI 系統(tǒng)的使命做出貢獻,迫不及待地想與這個才華橫溢的團隊合作,其中包括來自 OpenAI 和谷歌的許多優(yōu)秀的前同事。”
他將主要在荷蘭遠程工作,但會偶爾前往美國舊金山灣區(qū)。
這是兩家公司最新的“人才大戰(zhàn)”。金馬的加入延續(xù)了高層人才從 OpenAI 流向 Anthropic 的趨勢。
今年早些時候,Anthropic 招募了 OpenAI 前安全主管揚萊克(Jan Leike)和聯(lián)合創(chuàng)始人約翰舒爾曼(John Schulman)。
此外,Anthropic 還在 5 月份任命 Instagram 和 Artifact 聯(lián)合創(chuàng)始人邁克克里格(Mike Krieger)為首位產(chǎn)品負(fù)責(zé)人。
事實上,Anthropic 的創(chuàng)始人達里奧阿莫代(Dario Amodei)和丹妮拉阿莫代(Daniela Amodei)也曾是 OpenAI 的員工,但于 2019 年因?qū)景l(fā)展方向的分歧(尤其是與微軟日益加深的關(guān)系)而離開。
在他們的領(lǐng)導(dǎo)下,Anthropic 樹立了更注重安全的品牌形象。
OpenAI技術(shù)創(chuàng)新:2024 年開發(fā)者日亮點
盡管在過去的幾周里,OpenAI 經(jīng)歷了高層動蕩和重大融資變動,但它仍如期召開了 2024 年度開發(fā)者大會(DevDay)。
在會上,該公司發(fā)布了多項新工具,包括提示詞緩存、視覺微調(diào)、模型蒸餾和實時應(yīng)用程序編程接口(API,Application Programming Interface) 的公測版,可用于構(gòu)建具有低延遲、AI 生成語音響應(yīng)的應(yīng)用程序。
沒有新模型,也沒有新產(chǎn)品,略顯單調(diào)的發(fā)布會背后是 OpenAI 轉(zhuǎn)移戰(zhàn)略重心的努力:它希望構(gòu)建更成熟的 AI 開發(fā)基礎(chǔ)設(shè)施和開發(fā)者生態(tài)。
圖 | OpenAI 宣布的一些新產(chǎn)品(來源:OpenAI 官網(wǎng))
OpenAI 首席產(chǎn)品官凱文韋爾(Kevin Weil)表示,首席技術(shù)官米拉穆拉蒂(Mira Murati)和首席研究官鮑勃麥格魯(Bob McGrew)的離職不會影響公司的發(fā)展進程。
韋爾說:“我想說的是,鮑勃和米拉是出色的領(lǐng)導(dǎo)者,我從他們身上學(xué)到了很多,他們也是我們到達今天這個地位的重要功臣。但與此同時,我們也不會放緩腳步。”
OpenAI 表示,已有超過 300 萬開發(fā)者使用其 AI 模型進行開發(fā)。公司在過去兩年里將開發(fā)者訪問 API 的成本削減了 99%。
不過,這很可能是受到了 Meta 和谷歌等競爭對手不斷降價的壓力。
最抓人眼球的新工具是實時 API。它允許開發(fā)者在其應(yīng)用中構(gòu)建近乎實時的語音對話體驗,可選擇 OpenAI 提供的六種聲音。
這些聲音與 ChatGPT 提供的聲音不同,并且開發(fā)者不能使用第三方聲音,以避免版權(quán)問題。
OpenAI 開發(fā)者體驗主管羅曼于埃(Romain Huet)展示了一個使用實時 API 構(gòu)建的旅行計劃應(yīng)用程序。
該應(yīng)用允許用戶與 AI 助手對話,討論即將開始的倫敦之旅并規(guī)劃行程。在演示中,用戶獲得回應(yīng)的速度確實很快。
值得注意的是,盡管這些 AI 生成的聲音聽起來相當(dāng)真實,但 OpenAI 并沒有添加 AI 識別聲明,讓 AI 在通話中表明自己的身份。
OpenAI 還在其 API 中引入了視覺微調(diào)功能,允許開發(fā)者使用圖像和文本來微調(diào) GPT-4V 的應(yīng)用。這理論上應(yīng)該有助于開發(fā)者提高 GPT-4V 在涉及視覺理解任務(wù)中的性能。
OpenAI 的 API 產(chǎn)品負(fù)責(zé)人奧利維爾戈德芒(Olivier Godement)表示,開發(fā)者將不能上傳受版權(quán)保護的圖像、有暴力元素的圖像或其他違反 OpenAI 安全政策的圖像。
最后,今年的開發(fā)者日沒有宣布任何新的 AI 模型。等待 GPT-5 或視頻生成模型 Sora 的開發(fā)者還需要再等一段時間。
參考資料:
https://techcrunch.com/2024/10/01/openais-devday-brings-realtime-api-and-other-treats-for-ai-app-developers/
https://techcrunch.com/2024/10/01/anthropic-hires-openai-co-founder-durk-kingma/
http://dpkingma.com/
運營/排版:何晨龍