亚洲乱码日产精品bd在线看 ,日本插插视频

權(quán)威AI開源標(biāo)準(zhǔn)1.0版發(fā)布：Llama也不算開源

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-29 15:25:17 瀏覽：811次

導(dǎo)讀：機(jī)器之心報(bào)道編輯：澤南、小舟大模型開源的口號(hào)，不是隨便說說的。該來的終于來了。本周，人工智能領(lǐng)域迎來了對(duì)于「開源」的官方定義。開放源代碼促進(jìn)會(huì)（Open Source Initiative，OSI）發(fā)布了「開源 AI 定義」的 1.0 正式版。此舉旨在澄清 Open Source 這一術(shù)語在快速發(fā)展的科技領(lǐng)域中，經(jīng)常出現(xiàn)的模糊用法。值得關(guān)注的是在此機(jī)制下，一直以來開源大模型的標(biāo)桿 Llama 3 也不符 ......

機(jī)器之心報(bào)道

編輯：澤南、小舟

大模型開源的口號(hào)，不是隨便說說的。

該來的終于來了。

本周，人工智能領(lǐng)域迎來了對(duì)于「開源」的官方定義。開放源代碼促進(jìn)會(huì)（Open Source Initiative，OSI）發(fā)布了「開源 AI 定義」的 1.0 正式版。此舉旨在澄清 Open Source 這一術(shù)語在快速發(fā)展的科技領(lǐng)域中，經(jīng)常出現(xiàn)的模糊用法。

值得關(guān)注的是在此機(jī)制下，一直以來開源大模型的標(biāo)桿 Llama 3 也不符合本規(guī)則。

權(quán)威AI開源標(biāo)準(zhǔn)1.0版發(fā)布：Llama也不算開源

長(zhǎng)期以來，OSI 一直為開源軟件的構(gòu)成設(shè)定行業(yè)標(biāo)準(zhǔn)，但人工智能系統(tǒng)包含傳統(tǒng)許可未涵蓋的元素，例如模型訓(xùn)練數(shù)據(jù)。現(xiàn)在，要使 AI 系統(tǒng)被視為真正的開源系統(tǒng)，它必須提供：

可訪問用于訓(xùn)練 AI 的數(shù)據(jù)的詳細(xì)信息，以便其他人可以理解和重新創(chuàng)建；

用于構(gòu)建和運(yùn)行 AI 的完整代碼；

訓(xùn)練中的設(shè)置和權(quán)重，幫助 AI 產(chǎn)生相應(yīng)的結(jié)果。

這一定義直接直擊 Meta 推動(dòng)的 Llama 大模型。雖然在生成式 AI 領(lǐng)域里，Llama 一直被廣泛宣傳為最大的開源 AI 模型，Llama 的使用條款中支持公眾下載和使用，但其商業(yè)用途受到一定限制（對(duì)于擁有超過 7 億用戶的應(yīng)用程序），且不提供對(duì)訓(xùn)練數(shù)據(jù)的訪問，這導(dǎo)致其不符合 OSI 的無限制使用、修改和共享自由標(biāo)準(zhǔn)。

對(duì)此，Meta 發(fā)言人 Faith Eischen 對(duì)此表示，雖然「在很多事情上都同意合作伙伴 OSI 的觀點(diǎn)」，但 Meta 不同意這一定義。不應(yīng)該設(shè)置單一的開源 AI 定義，人們此前對(duì)于開源的定義沒有涵蓋當(dāng)今快速發(fā)展的 AI 模型的復(fù)雜性。

不過，無論技術(shù)的定義如何，Meta 表示仍將繼續(xù)與 OSI 和其他行業(yè)組織合作，以負(fù)責(zé)任的方式推動(dòng) AI 朝著可訪問和免費(fèi)的方向發(fā)展。

在「開源」這件事上，非營利組織 OSI 一直扮演著重要的角色。OSI 維護(hù)了一個(gè)被業(yè)內(nèi)認(rèn)可的許可證列表，其定義的開源包括十余個(gè)關(guān)鍵條款，如自由再分發(fā)、源代碼可獲得、允許修改和衍生作品等。自 1998 年定義「開源」標(biāo)簽并成立以來，OSI 對(duì)開源軟件的定義已被開發(fā)人員廣泛接受。

如今，隨著人工智能重塑格局，科技巨頭們面臨著一個(gè)關(guān)鍵選擇：是接受這些既定原則，還是拒絕它們。Linux 基金會(huì)最近也試圖定義「開源人工智能」，這表明關(guān)于傳統(tǒng)開源價(jià)值觀如何適應(yīng)人工智能時(shí)代的爭(zhēng)論已日益激烈。

權(quán)威AI開源標(biāo)準(zhǔn)1.0版發(fā)布：Llama也不算開源

獨(dú)立研究員和開放源代碼創(chuàng)建者 Simon Willison 說：「既然我們已經(jīng)有了一個(gè)強(qiáng)有力的定義，也許我們可以更積極地抵制那些『開源洗白（open washing）』并宣稱自己的工作是開源的公司。」

Hugging Face 首席執(zhí)行官 Clément Delangue 稱：「 OSI 的定義對(duì)于圍繞人工智能開放性展開討論有巨大幫助，特別是在涉及訓(xùn)練數(shù)據(jù)的關(guān)鍵作用時(shí)�！�

OSI 執(zhí)行董事 Stefano Maffulli 表示，該公司花了兩年時(shí)間咨詢?nèi)驅(qū)＜�，通過與機(jī)器學(xué)習(xí)和自然語言處理的學(xué)界專家、哲學(xué)家、Creative Commons 的內(nèi)容創(chuàng)作者等合作完善了這一定義。

OSI 對(duì)于開源 AI 的定義

OSI 表示，「開源」的人工智能系統(tǒng)需要滿足以下幾點(diǎn)：

可將系統(tǒng)用于任何目的，無需征得許可；

允許人們研究系統(tǒng)的工作原理并檢查其組件；

允許人們?yōu)槿魏文康男薷脑撓到y(tǒng)，包括更改其輸出；

人們可以出于任何目的，將系統(tǒng)共享給他人，無論是否經(jīng)過修改。

這些自由既適用于功能齊全的系統(tǒng)，也適用于系統(tǒng)的離散元素。行使這些自由的先決條件是能夠?qū)ο到y(tǒng)進(jìn)行修改。

再進(jìn)一步，對(duì)于機(jī)器學(xué)習(xí)系統(tǒng)可修改的形式，OSI 也進(jìn)行了定義。必須包含以下所有元素：

數(shù)據(jù)信息：用于訓(xùn)練系統(tǒng)的數(shù)據(jù)的足夠詳細(xì)的信息，以便技術(shù)人員可以構(gòu)建基本等效的系統(tǒng)。數(shù)據(jù)信息應(yīng)根據(jù) OSI 批準(zhǔn)的條款提供。特別是，必須包括：

用于訓(xùn)練的所有數(shù)據(jù)的完整描述，包括（如果使用）不可共享的數(shù)據(jù)，披露數(shù)據(jù)的來源、其范圍和特征、數(shù)據(jù)的獲取和選擇方式，標(biāo)簽程序、數(shù)據(jù)處理和過濾方法；

所有公開可用的訓(xùn)練數(shù)據(jù)的清單以及獲取這些數(shù)據(jù)的方式；

可從第三方獲得的所有訓(xùn)練數(shù)據(jù)的列表以及從何處獲�。òǜ顿M(fèi)）。

代碼：用于訓(xùn)練和運(yùn)行系統(tǒng)的完整源代碼。該代碼應(yīng)展示出如何處理和過濾數(shù)據(jù)以及如何進(jìn)行訓(xùn)練的完整規(guī)范。代碼應(yīng)在 OSI 批準(zhǔn)許可下提供。

例如，如果使用，則必須包括用于處理和過濾數(shù)據(jù)的代碼、用于訓(xùn)練的代碼（包括使用的參數(shù)和設(shè)置）、驗(yàn)證和測(cè)試、支持庫（如分詞器和超參數(shù)搜索代碼）、推理代碼和模型架構(gòu)。

參數(shù)：模型參數(shù)，例如權(quán)重或其他配置。參數(shù)應(yīng)根據(jù) OSI 批準(zhǔn)條款提供。

例如，訓(xùn)練中間階段的檢查點(diǎn)以及優(yōu)化器狀態(tài)。

對(duì)于機(jī)器學(xué)習(xí)系統(tǒng)，模型權(quán)重也是一個(gè)重要因素。OSI 在開源定義中表述道：

AI 模型由模型架構(gòu)、模型參數(shù)（包括權(quán)重）和運(yùn)行模型的推理代碼組成。

AI 權(quán)重是一組學(xué)習(xí)參數(shù)，以根據(jù)給定輸入生成輸出。

對(duì)機(jī)器學(xué)習(xí)系統(tǒng)進(jìn)行修改的范圍也包括權(quán)重�！搁_源模型」和「開源權(quán)重」必須包括用于導(dǎo)出這些參數(shù)的數(shù)據(jù)信息和代碼。

最后，OSI 表示，開源 AI 定義不需要特定的法律機(jī)制來確保模型參數(shù)可供所有人免費(fèi)使用。它們可能本質(zhì)上是免費(fèi)的，或者可能需要許可證或其他法律文書來確保它們的可用。預(yù)計(jì)隨著時(shí)間的推移，法規(guī)對(duì)于 AI 開放的定義也將變得更加清晰。

參考內(nèi)容：

https://opensource.org/ai/open-source-ai-definition

https://lfaidata.foundation/blog/2024/10/25/embracing-the-future-of-ai-with-open-source-and-open-science-models/

https://www.theverge.com/2024/10/28/24281820/open-source-initiative-definition-artificial-intelligence-meta-llama

相關(guān)熱詞： llama osi 開源軟件開源模型

權(quán)威AI開源標(biāo)準(zhǔn)1.0版發(fā)布：Llama也不算開源
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-29 15:25:17 瀏覽：811次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

權(quán)威AI開源標(biāo)準(zhǔn)1.0版發(fā)布：Llama也不算開源 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-29 15:25:17 瀏覽：811次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

權(quán)威AI開源標(biāo)準(zhǔn)1.0版發(fā)布：Llama也不算開源
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-29 15:25:17 瀏覽：811次