展會(huì)信息港展會(huì)大全

微軟OmniParser最新版本可將DeepSeek等模型轉(zhuǎn)化為計(jì)算機(jī)智能體
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-17 08:14:06   瀏覽:294次  

導(dǎo)讀:2月17日,根據(jù)微軟官網(wǎng),微軟日前發(fā)布視覺(jué)Agent解析框架OmniParser最新版本V2.0,可將OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,轉(zhuǎn)化為“計(jì)算機(jī)使用智能體”(Computer Use Agent)。相比前代版本,OmniParser V2在檢測(cè)更微小可交互元素時(shí)精度更高、推理速度更快。具體而言,V2通過(guò)使用更大規(guī)模的交互元素檢測(cè)數(shù)據(jù)集和圖標(biāo)功能描 ......

2月17日,根據(jù)微軟官網(wǎng),微軟日前發(fā)布視覺(jué)Agent解析框架OmniParser最新版本V2.0,可將OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,轉(zhuǎn)化為“計(jì)算機(jī)使用智能體”(Computer Use Agent)。相比前代版本,OmniParser V2在檢測(cè)更微小可交互元素時(shí)精度更高、推理速度更快。具體而言,V2通過(guò)使用更大規(guī)模的交互元素檢測(cè)數(shù)據(jù)集和圖標(biāo)功能描述數(shù)據(jù)進(jìn)行訓(xùn)練,并通過(guò)縮小圖標(biāo)描述模型的輸入圖像尺寸,推理延遲較前代降低60%。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港