展會信息港展會大全

云計算一哥的生成式AI之道:Choice Matters
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-19 19:52:11   瀏覽:333次  

導讀:允中 發(fā)自 凹非寺量子位 | 公眾號 QbitAI引言:AI大模型,并不是一個贏家通吃的市場。自O(shè)penAI在2022年發(fā)布ChatGPT以來,無論是科技巨頭還是初創(chuàng)公司,各個玩家可以說是紛紛加大投入,試圖在模型性能上超越彼此。似乎追求單一、性能卓越的AI大模型已然成為一種趨勢,各類Benchmark上的奪冠也好似一張得到市場認可的入場券。然而在如此打法成為主流的同時,一個在AI大模型時代以 ......

允中 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

引言:AI大模型,并不是一個贏家通吃的市場。

自O(shè)penAI在2022年發(fā)布ChatGPT以來,無論是科技巨頭還是初創(chuàng)公司,各個玩家可以說是紛紛加大投入,試圖在模型性能上超越彼此。

似乎追求單一、性能卓越的AI大模型已然成為一種趨勢,各類Benchmark上的奪冠也好似一張得到市場認可的入場券。

然而在如此打法成為主流的同時,一個在AI大模型時代以來一直看似低調(diào),也鮮有大聲量地高喊“大模型性能第一”的科技巨頭,卻在時隔兩年多之久,以截然不同的方式在大模型市場里驚艷亮相。

它就是云計算一哥亞馬遜云科技。

云計算一哥的生成式AI之道:Choice Matters

值得一提的是,Llama 405B和Llama 70B低延遲優(yōu)化版本,在亞馬遜云科技上展現(xiàn)出超越其他云提供商的出色表現(xiàn)。

最后,通過自動推理檢查功能和多智能體協(xié)作等創(chuàng)新,進一步增強AI安全性并推動智能體發(fā)展。

Amazon Q Developer則是引入了三款先進的智能體。

它們能夠自動執(zhí)行單元測試、生成文檔和進行代碼審查,同時通過與GitLab的深度整合,拓寬了應(yīng)用范圍。

此外,它還推出了新的轉(zhuǎn)型特性,旨在加快Windows.NET、VMware和大型機工作負載的遷移與現(xiàn)代化進程,有效減少轉(zhuǎn)型周期和成本。

同時,Amazon Q Business和Amazon Q in QuickSight的洞察力得到了加強,簡化了復(fù)雜工作流程自動化的實現(xiàn)方法。

云計算一哥的生成式AI之道:Choice Matters

云計算,也全面升級說完大模型,我們再來看下亞馬遜云科技的“老本行業(yè)務(wù)”云計算。

這次升級主要圍繞三大核心領(lǐng)域展開:計算(Compute)、存儲(Storage)數(shù)據(jù)庫(Database)

每一項都可以說是展現(xiàn)出了前所未有的性能提升與成本優(yōu)化。

計算(Compute)層面,亞馬遜云科技推出了性能全面升級的Amazon EC2 Trn2實例。

Trn2實例搭載第二代Trainium芯片(Trainium2),相比上一代Trn1,性能提升如下:

訓練速度提升4倍,顯著縮短模型訓練時間,助力企業(yè)更快落地AI應(yīng)用;

內(nèi)存帶寬提升4倍,滿足復(fù)雜模型對于數(shù)據(jù)高并發(fā)處理的需求;

內(nèi)存容量提升3倍,為大規(guī)模參數(shù)模型提供強大支持。

更重要的是,Trn2實例的性價比提升顯著,相比傳統(tǒng)GPU實例(P5e和P5en)高出30-40%,大幅降低了算力成本。

對于超大規(guī)模計算需求,亞馬遜云科技還推出了Trn2 UltraServer

每臺UltraServer集成了64顆Trainium2芯片,并通過NeuronLink高速互聯(lián)實現(xiàn)2TB/s帶寬和1微秒級延遲。

這款產(chǎn)品為超大規(guī)模AI模型訓練提供了理想的算力平臺。

除此之外,在芯片層面上,亞馬遜云科技宣布將在2025年推出Trainium3芯片。

據(jù)悉,Trainium3將采用3納米工藝制造,提供兩倍于Trainium2的計算能力,并提升40%的能效。

云計算一哥的生成式AI之道:Choice Matters

存儲(Storage)層面,亞馬遜云科技發(fā)布了專為表格數(shù)據(jù)設(shè)計的Amazon S3 Tables,性能和效率再次升級。

Amazon S3 Tables引入了一種創(chuàng)新的存儲解決方案,專門針對表格數(shù)據(jù)優(yōu)化,并兼容Amazon Athena、Amazon EMR以及Apache Spark等主流查詢工具,以便用戶能夠便捷地執(zhí)行數(shù)據(jù)查詢操作。

作為S3的第三種存儲類別,表存儲桶與通用存儲桶和目錄存儲桶相輔相成,它被設(shè)計為一個分析型數(shù)據(jù)倉庫,適合存放多種模式的Iceberg格式表格。

S3 Tables在性能上相較于傳統(tǒng)的自管理表格存儲有顯著提升,查詢速度可提高至3倍,事務(wù)處理速率可達10倍,且享有全面托管的服務(wù)帶來的操作便利。

在數(shù)據(jù)管理中,元數(shù)據(jù)的作用日益凸顯,例如,手機中存儲的大量照片能夠通過元數(shù)據(jù)快速定位,使用自然語言即可迅速檢索到特定照片。

為滿足此類需求,亞馬遜云科技推出了Amazon S3 Metadata的測試版,旨在提供更加智能和高效的元數(shù)據(jù)管理功能。

Amazon S3 Metadata 提供了一種智能化、便捷的元數(shù)據(jù)管理方案,實現(xiàn)了近乎實時的元數(shù)據(jù)更新,幫助用戶高效地組織、識別和利用S3數(shù)據(jù),支持業(yè)務(wù)分析和實時推理等應(yīng)用場景。

該功能支持對象元數(shù)據(jù)管理,既涵蓋系統(tǒng)生成的詳細信息(如文件大小和來源),也允許用戶自定義元數(shù)據(jù)。用戶可以通過標簽為對象附加額外信息,如產(chǎn)品SKU、交易ID或內(nèi)容評級,進一步提升數(shù)據(jù)的分類與檢索效率。

此外,這些元數(shù)據(jù)信息被無縫整合到 S3 Tables 中,進一步強化了數(shù)據(jù)的管理與分析能力。

最后一層,便是數(shù)據(jù)庫(Database)了。

亞馬遜云科技發(fā)布了新型無服務(wù)器分布式數(shù)據(jù)庫Amazon Aurora DSQL,旨在解決傳統(tǒng)數(shù)據(jù)庫在擴展性和性能方面的挑戰(zhàn),目前可以實現(xiàn):

跨區(qū)域強一致性和低延遲;

無限擴展,可輕松處理TB至PB級數(shù)據(jù);

超高可用性,達到99.999%的可靠性。

與此同時,Amazon DynamoDB global tables也增加了多區(qū)域強一致性支持,進一步增強了其分布式數(shù)據(jù)庫服務(wù)能力。

數(shù)據(jù)分析能力也是Up Up Up此次發(fā)布的最后一部分,便是分析板塊。

亞馬遜云科技所發(fā)力的點,便是其一站式數(shù)據(jù)、分析與AI解決方案中心新一代Amazon SageMaker

新一代SageMaker的核心是SageMaker Unified Studio。

這是一個單一的數(shù)據(jù)和AI開發(fā)環(huán)境,它整合了Amazon Athena、Amazon EMR、AWS Glue、Amazon Redshift、Amazon Managed Workflows for Apache Airflow (MWAA)以及現(xiàn)有的SageMaker Studio中的工具和功能。

其次是Amazon SageMaker Lakehouse,可以統(tǒng)一Amazon S3數(shù)據(jù)湖、Amazon Redshift數(shù)據(jù)倉庫和第三方及聯(lián)合數(shù)據(jù)源。

除此之外,還包括Amazon SageMaker HyperPod的新訓練配方功能、靈活訓練計劃和任務(wù)治理功能,以及在Amazon SageMaker中使用亞馬遜云科技合作伙伴的熱門AI應(yīng)用。

這些功能將幫助客戶更快開始訓練流行模型,通過靈活訓練計劃節(jié)省數(shù)周時間,并將成本降低高達40%。

云計算一哥的生成式AI之道:Choice Matters

以上就是今年亞馬遜云科技給予大模型時代客戶們的種種新的選擇了。

而這種“以客戶為中心,逆向工作(work backward)”為基因的云計算巨頭,還將以“提供選擇權(quán)”的方式在這個時代給我們帶來怎樣的驚喜,是值得期待一波。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港