生成式AI是否能為云計(jì)算帶來新的發(fā)展機(jī)遇?作為全球頭部企業(yè),亞馬遜云科技也在思考這一問題。
在今年年底的亞馬遜云科技年度大會(huì)re:Invent 2024上,這家公司發(fā)布了一整套面向AI時(shí)代的新產(chǎn)品,包括自研大模型Amazon Nova系列、新一代AI訓(xùn)練芯片Trainium 3、新一代Amazon SageMaker(數(shù)據(jù)分析和AI的一站式平臺(tái))、AI助手Amazon Q新功能等。
圖:亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建
過去一年,亞馬遜云科技通過自研、投資、生態(tài)打造等多種方式夯實(shí)AI護(hù)城河,重塑IaaS(基礎(chǔ)設(shè)施)、PaaS(平臺(tái)軟件)、SaaS(應(yīng)用軟件)、MaaS(模型服務(wù))層的產(chǎn)品,以期在全球AI技術(shù)競(jìng)爭(zhēng)中搶得先發(fā)優(yōu)勢(shì)。到年底,亞馬遜云科技對(duì)外展示了其AI加持的計(jì)算、存儲(chǔ)、數(shù)據(jù)庫等基礎(chǔ)云產(chǎn)品。
“就生成式AI整個(gè)行業(yè)而言,目前的突破點(diǎn)在于如何快速從技術(shù)原型走向生產(chǎn)!痹诮邮苡浾卟稍L時(shí),亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建認(rèn)為,在生成式AI的發(fā)展上,企業(yè)正在從思考階段轉(zhuǎn)向?qū)嵺`階段,進(jìn)行大量場(chǎng)景試驗(yàn),預(yù)計(jì)2025年將有更多的客戶從原型驗(yàn)證階段轉(zhuǎn)化為生產(chǎn)階段。
而云計(jì)算不僅是提供產(chǎn)品和技術(shù),更重要的是幫助企業(yè)取得業(yè)務(wù)上的成功。
加碼生成式AI 新品密集發(fā)布
2023年,亞馬遜云科技推出了嵌入式模型Amazon Titan,而今年則進(jìn)一步豐富了產(chǎn)品組合,發(fā)布了Amazon Nova系列一套包含六個(gè)針對(duì)不同應(yīng)用場(chǎng)景優(yōu)化的模型。此外,亞馬遜還計(jì)劃在未來推出speech to speech和any to any等新型模型。
陳曉建介紹,這些新模型的開發(fā)遵循了“逆向工作法”的原則,即首先深入了解客戶的實(shí)際需求,然后根據(jù)這些需求定制相應(yīng)的解決方案。例如,針對(duì)用戶在Micro、Lite、Pro以及即將推出的Premier等不同級(jí)別上的具體要求,亞馬遜設(shè)計(jì)了各有側(cè)重的模型,以確保它們能夠無縫集成到客戶現(xiàn)有的產(chǎn)品和服務(wù)中,并提供最佳性能。
通過這種方式,亞馬遜不僅為客戶提供了一個(gè)廣泛的選擇范圍,而且保證了每個(gè)模型都能精確地滿足特定業(yè)務(wù)場(chǎng)景的需求。
而在芯片方面,亞馬遜云科技的自研芯片策略不僅強(qiáng)調(diào)技術(shù)先進(jìn)性和性能優(yōu)化,同時(shí)也關(guān)注能效和環(huán)境影響,旨在為客戶提供高效且可持續(xù)的解決方案。
目前,Amazon Trainium(訓(xùn)練芯片)專注于提供極致的計(jì)算性能,支持大規(guī)模分布式計(jì)算任務(wù),適用于復(fù)雜的模型訓(xùn)練。
Amazon Inferentia(推理芯片)主要針對(duì)推理任務(wù),相比訓(xùn)練芯片,多機(jī)協(xié)同的需求較低,在設(shè)計(jì)過程中充分考慮了能效和碳排放等因素,確保高性能的同時(shí)也注重環(huán)保。
陳曉建透露,亞馬遜云科技與Anthropic合作,正在構(gòu)建名為Project Rainier的EC2 UltraCluster。該集群包含數(shù)十萬顆Trainium2芯片,能夠提供比當(dāng)前一代領(lǐng)先AI模型訓(xùn)練所需算力高出5倍以上的超級(jí)算力。
此外,亞馬遜云科技大中華區(qū)數(shù)據(jù)分析與生成式AI產(chǎn)品總監(jiān)崔瑋強(qiáng)調(diào),公司的整體策略是以客戶需求為導(dǎo)向,利用Amazon Bedrock平臺(tái)部署第一方(內(nèi)部開發(fā))和第三方(外部合作)的模型,從而為客戶提供更加多樣化的選擇和支持。
事實(shí)上,在此次新推出的模型中,為了實(shí)現(xiàn)低延時(shí)和低成本的目標(biāo),亞馬遜云科技在其逆向工作過程中不僅專注于模型本身的優(yōu)化,還在多個(gè)技術(shù)層級(jí)進(jìn)行了創(chuàng)新。例如,正式推出的Trainium2自研芯片是關(guān)鍵組件之一,旨在提高性能同時(shí)降低成本;基于Trainium2芯片構(gòu)建的這兩款實(shí)例和服務(wù)器提供了強(qiáng)大的計(jì)算能力,特別適用于訓(xùn)練大型語言模型等任務(wù);Aazon Bedrock層包含了“優(yōu)化的低延遲推理選項(xiàng)”等功能,專門設(shè)計(jì)用來加速生成式AI應(yīng)用的部署,并確保高效的運(yùn)行效率。
據(jù)崔瑋透露,通過上述各層級(jí)的技術(shù)創(chuàng)新,亞馬遜云科技能夠顯著降低客戶在部署生成式AI應(yīng)用或Nova系列模型時(shí)的成本,與同等級(jí)別的其他模型相比,成本可降低約70%。
從嘗試到生產(chǎn) 技術(shù)落地深入應(yīng)用場(chǎng)景
隨著生成式AI的發(fā)展,越來越多的客戶正將其業(yè)務(wù)從嘗試階段推進(jìn)到生產(chǎn)階段。這一轉(zhuǎn)變帶來了多種任務(wù)需求,包括開發(fā)、訓(xùn)練和推理等不同類型的作業(yè)。面對(duì)這些多樣化的需求,如何選擇合適的集群和資源管理方式以實(shí)現(xiàn)最高效的資源利用成為了關(guān)鍵問題,尤其是在GPU成本高昂的情況下。
“當(dāng)進(jìn)入到生產(chǎn)階段時(shí),就不可避免地要考慮如何將數(shù)據(jù)和AI一體化管理!贝蕃|說道,這也是亞馬遜云科技在新產(chǎn)品應(yīng)用升級(jí)方面考慮的主要問題。
據(jù)崔瑋介紹,SageMaker 致力于幫助客戶充分利用已經(jīng)預(yù)訂的云資源,確保每個(gè)GPU和其他計(jì)算資源都能得到最大程度的應(yīng)用。這是通過優(yōu)化資源配置和調(diào)度來達(dá)成的,從而直接助力客戶的生產(chǎn)過程,減少浪費(fèi)并降低成本。
在前期探索階段,客戶往往專注于評(píng)估模型和技術(shù)是否適合其業(yè)務(wù)需求。然而,當(dāng)進(jìn)入生產(chǎn)階段時(shí),就需要考慮更復(fù)雜的問題,如如何將數(shù)據(jù)管理和AI開發(fā)整合起來,確保數(shù)據(jù)流、數(shù)據(jù)治理及安全性等方面的一體化管理。
為此,亞馬遜云科技推出了Amazon SageMaker Unified Studio(統(tǒng)一工作室)和Amazon SageMaker Lakehouse(數(shù)據(jù)湖倉)。這兩個(gè)工具旨在為客戶提供一個(gè)統(tǒng)一的工作環(huán)境,使他們能夠在同一平臺(tái)上完成從數(shù)據(jù)準(zhǔn)備到模型部署的所有步驟,簡(jiǎn)化工作流程,提高效率,并確保數(shù)據(jù)的安全性和合規(guī)性。
“新一代Amazon SageMaker提供數(shù)據(jù)和AI的統(tǒng)一,去應(yīng)對(duì)訓(xùn)練、推理、MLOps等場(chǎng)景。同時(shí),Amazon SageMaker AI也有很多新的功能來加強(qiáng)用戶的體驗(yàn)!贝蕃|說道。
出海仍是重要場(chǎng)景需求
實(shí)際上,從生成式AI的應(yīng)用場(chǎng)景選擇來看,不同行業(yè)的客戶需求和痛點(diǎn)各異,難以找到一個(gè)統(tǒng)一的應(yīng)用起點(diǎn)。在陳曉建看來,“作為中國(guó)區(qū)的生成式AI團(tuán)隊(duì),首要任務(wù)是與客戶合作,識(shí)別最適合的應(yīng)用場(chǎng)景。”
而代表性的應(yīng)用場(chǎng)景,包括,利用知識(shí)庫、代碼生成工具等提高員工工作效率;通過集成知識(shí)庫和其他AI能力,顯著改善客服響應(yīng)速度和服務(wù)質(zhì)量;幫助中國(guó)企業(yè)出海時(shí)解決多語言翻譯難題,特別是小語種的支持問題,而這在過去是一個(gè)非常大的挑戰(zhàn)。
目前,出海是中國(guó)市場(chǎng)的重要需求之一。據(jù)陳曉建觀察,生成式AI興起后,出現(xiàn)了生成式AI原生創(chuàng)新企業(yè),它們借助生成式AI開展之前無法從事的業(yè)務(wù),發(fā)展速度迅猛,且很多在出海時(shí)選擇亞馬遜云科技作為承載云平臺(tái)!拔覀冾A(yù)測(cè),隨著生成式AI能力逐步完善,這類生成式AI原生企業(yè)創(chuàng)造的應(yīng)用會(huì)越來越多。從海外榜單來看,在教育、陪伴等諸多領(lǐng)域,很多頭部企業(yè)都是中國(guó)企業(yè),這是一個(gè)我們看到的趨勢(shì)。”
而從2024年來看,許多企業(yè)從思考階段進(jìn)入實(shí)踐階段,進(jìn)行了大量場(chǎng)景試驗(yàn)。陳曉建預(yù)測(cè),2025年肯定會(huì)發(fā)生變化,很多客戶有望從原型驗(yàn)證階段轉(zhuǎn)化為生產(chǎn)階段,“這是必經(jīng)之路!痹谶@一過程中,企業(yè)的需求將更加復(fù)雜,不僅是選擇模型,還需要各種技術(shù)支持。這也是亞馬遜云科技在開發(fā)Amazon Bedrock等產(chǎn)品時(shí),不僅提供模型市場(chǎng),更重要的是提供能讓模型推理運(yùn)行時(shí)所需的各種生產(chǎn)力工具和生產(chǎn)環(huán)境工具。
“中國(guó)有很多優(yōu)秀的初創(chuàng)企業(yè)已經(jīng)成功應(yīng)用生成式AI,這在不同的行業(yè)清晰可見。相對(duì)而言,傳統(tǒng)企業(yè)進(jìn)展較慢,但也在朝著應(yīng)用生成式AI于生產(chǎn)的方向穩(wěn)步邁進(jìn),我們期待明年能看到更多傳統(tǒng)企業(yè)在這方面取得進(jìn)展!标悤越ㄕf道。(古雨)