IT之家 10 月 26 日消息,谷歌公司于 10 月 24 日發(fā)布博文,宣布推出 SAIF 風(fēng)險評估工具,旨在幫助人工智能開發(fā)者和組織評估其安全態(tài)勢,識別潛在風(fēng)險,并實施更強的安全措施。
SAIF 簡介IT之家注:谷歌去年發(fā)布了安全人工智能框架(SAIF),旨在幫助用戶安全、負責(zé)任地部署 AI 模型,SAIF 不僅分享了最佳實踐,還為行業(yè)提供了一個安全設(shè)計的框架。
為了推廣這一框架,谷歌與行業(yè)伙伴共同成立了安全人工智能聯(lián)盟(CoSAI),以推動關(guān)鍵的 AI 安全措施。
SAIF 風(fēng)險評估工具谷歌目前已經(jīng)在新網(wǎng)站 SAIF.Google 上提供 SAIF 風(fēng)險評估工具,該工具以問卷形式運行,用戶回答后會生成定制化的檢查清單,指導(dǎo)他們確保 AI 系統(tǒng)的安全。
工具涵蓋多個主題,包括:
AI 系統(tǒng)的訓(xùn)練、調(diào)優(yōu)和評估
對模型和數(shù)據(jù)集的訪問控制
防止攻擊和對抗性輸入
生成性 AI 的安全設(shè)計與編碼框架
用戶在回答問題后,工具會立即生成一份報告,突出 AI 系統(tǒng)面臨的具體風(fēng)險,如數(shù)據(jù)中毒、提示注入和模型源篡改等。
每個風(fēng)險都附有詳細解釋及建議的緩解措施,此外用戶還可以通過互動 SAIF 風(fēng)險地圖了解在 AI 開發(fā)過程中如何引入與緩解不同的安全風(fēng)險。