每經AI快訊,中信建投研報稱,1)DeepSeek在保持模型優(yōu)異性能指標的同時大幅降低訓練和推理成本。DeepSeek-V3使用2048塊H800GPU完成了6710億參數的訓練,訓練成本為557.6萬美元,DeepSeek-R1模型的每百萬輸出tokens為16元,均顯著低于同等水平的模型成本。利用DeepSeek模型生成的數據樣本實現小參數量的模型蒸餾,提升模型性能。2)高性能、輕量化、低成本的模型能力將顯著推動端側AI產業(yè)發(fā)展。端側硬件設備是將大模型能力進行實物化輸出落地的關鍵環(huán)節(jié),近日OpenAI的CEO Sam Altman在接受媒體采訪時也透露OpenAI將開發(fā)可替代手機的生成式AI專用終端。國內物聯(lián)網模組廠商在端側AI領域具備先發(fā)優(yōu)勢,并積極進行產業(yè)布局。
每日經濟新聞