隨著人工智能領(lǐng)域的迅猛增長(zhǎng),業(yè)界對(duì)大模型數(shù)據(jù)集的勞動(dòng)力需求正在攀升,尤其是對(duì)文本、圖像、視頻和音頻進(jìn)行標(biāo)注的領(lǐng)域。為了降低成本,這類崗位往往被外包到不發(fā)達(dá)國(guó)家。
11月24日,哥倫比亞廣播公司(CBS)《60分鐘》欄目報(bào)道稱,盡管數(shù)據(jù)標(biāo)注行業(yè)為肯尼亞創(chuàng)造了大量就業(yè)機(jī)會(huì),但這類工作因?yàn)樾劫Y過低、工作時(shí)間過長(zhǎng)以及審查內(nèi)容涉及大量仇恨言論和暴力畫面等問題,對(duì)當(dāng)?shù)貏趧?dòng)者的身心健康造成了極大影響。
數(shù)據(jù)標(biāo)注是人工智能技術(shù)研發(fā)中不可或缺的一環(huán),指對(duì)圖片、語(yǔ)音、文本、視頻等數(shù)據(jù)進(jìn)行處理,標(biāo)記對(duì)象的特征,生成滿足機(jī)器學(xué)習(xí)訓(xùn)練要求的可讀數(shù)據(jù)編碼。科技專家表示,松懈的法律規(guī)定和低廉的收入已經(jīng)成為該行業(yè)的常態(tài)從業(yè)人員從事最繁瑣和高負(fù)荷的工作,但幾乎無法得到法律保障。
“數(shù)據(jù)貼標(biāo)”引發(fā)爭(zhēng)議
CBS報(bào)道稱,雖然人工智能技術(shù)日漸強(qiáng)大,但仍無法完全脫離人工的介入,原因是需要數(shù)據(jù)標(biāo)記的新設(shè)備和新發(fā)明正在不斷涌現(xiàn),比如汽車和醫(yī)療等行業(yè)!皵(shù)據(jù)貼標(biāo)員”如今需要給汽車和行人貼上標(biāo)簽,訓(xùn)練自動(dòng)駕駛汽車避讓障礙物的技能;圈出CT(計(jì)算機(jī)斷層掃描)、核磁共振成像(MRI)和X光片中的異常情況,讓人工智能學(xué)習(xí)如何識(shí)別異常情況。
出于降低勞動(dòng)力成本的考慮,Meta和OpenAI等大型公司近年來將這類工作崗位轉(zhuǎn)給勞務(wù)外包公司。在肯尼亞,一家名為Sama的公司為上述公司招聘超過3000名員工,時(shí)薪為2美元(折合人民幣14.5元)。然而,《60分鐘》欄目獲取的文件則顯示,OpenAI向Sama支付的時(shí)薪實(shí)為每名工人12.5美元(折合人民幣90.5元)。面對(duì)質(zhì)疑,這家總部位于加州的公司表示,相對(duì)于肯尼亞當(dāng)?shù)氐墓べY水平,該公司向肯尼亞員工支付的薪酬“相對(duì)公平”。
一些負(fù)責(zé)內(nèi)容貼標(biāo)和篩查有害信息的肯尼亞員工表示,他們?nèi)站?個(gè)小時(shí)坐在屏幕前研究照片和視頻,在物體周圍畫框并貼上標(biāo)簽,讓人工智能算法學(xué)習(xí)如何識(shí)別內(nèi)容。除此之外,他們必須每天查看色情、仇恨言論和過度暴力內(nèi)容,幫助人工智能強(qiáng)化識(shí)別和過濾有害信息的功能。
有受訪者表示,在肯尼亞失業(yè)率高企的情況下,他們不得不接受這類工作。目前,肯尼亞的青年失業(yè)率高達(dá)67%,該國(guó)政府一直在爭(zhēng)取微軟、谷歌、蘋果和英特爾等科技巨頭的投資。
除了Sama,澳大利亞數(shù)據(jù)服務(wù)公司澳鵬(Appen)也在委內(nèi)瑞拉和巴基斯坦等國(guó)家招募了大量數(shù)據(jù)標(biāo)注員。據(jù)美國(guó)《連線》雜志(Wired)報(bào)道,澳鵬的客戶包括亞馬遜、臉書、谷歌和微軟等公司。一名移居至哥倫比亞的委內(nèi)瑞拉受訪者向該媒體表示,若每天的工作時(shí)間達(dá)到18個(gè)小時(shí)或以上,他們每周收入或可達(dá)到280美元(人民幣2028元),接近哥倫比亞285美元(人民幣2065元)的最低工資標(biāo)準(zhǔn)。
咨詢公司Grand View Research的數(shù)據(jù)顯示,2022年全球數(shù)據(jù)標(biāo)注的市場(chǎng)價(jià)值為22.2億美元,預(yù)計(jì)到2030年將增長(zhǎng)到171億美元。在這股AI浪潮下,數(shù)據(jù)標(biāo)注在一些國(guó)家成為一個(gè)新興產(chǎn)業(yè)!度毡緯r(shí)報(bào)》報(bào)道稱,印度已成為全球最大的數(shù)據(jù)標(biāo)注勞動(dòng)力市場(chǎng)之一。信息技術(shù)行業(yè)機(jī)構(gòu)NASSCOM表示,到2030年,印度數(shù)據(jù)標(biāo)注勞動(dòng)力規(guī)模(包括全職和兼職)預(yù)計(jì)將達(dá)到100萬(wàn)人。
印度研究機(jī)構(gòu)“數(shù)字未來”實(shí)驗(yàn)室主任烏爾瓦希阿內(nèi)賈(Urvashi Aneja)表示,盡管數(shù)據(jù)標(biāo)注行業(yè)為那些有居家工作需求的人創(chuàng)造了新的機(jī)會(huì),但這類人群處于人工智能價(jià)值鏈的底端!昂芏喙ぷ鞫己懿环(wěn)定……有了ChatGPT和其他生成式人工智能,內(nèi)容審核的問題將變得更加復(fù)雜,我們將看到更多低薪工人陷入其中!卑(nèi)賈分析道。
AI訓(xùn)練尋求激增
路透社報(bào)道稱,人工智能模型發(fā)展的早期階段需要大量低成本勞動(dòng)力,幫助人工智能模型區(qū)分基本事實(shí),例如圖像是汽車還是胡蘿卜。然而,隨著人工智能技術(shù)發(fā)展日趨成熟,人工智能模型進(jìn)行更復(fù)雜的更新則需要擁有專業(yè)知識(shí)的人類訓(xùn)練師這類人群包括歷史學(xué)家和科學(xué)家以及擁有博士學(xué)位的人員。
總部位于法國(guó)巴黎的凱捷管理顧問公司2024年發(fā)布的一份報(bào)告顯示,近七成商業(yè)領(lǐng)袖認(rèn)為,生成式人工智能領(lǐng)域的興起將催生出新的勞動(dòng)力需求,包括人工智能審計(jì)師、人工智能倫理學(xué)家和快速工程師!拔覀兛吹饺斯ぶ悄芄芾砗蛿(shù)字化轉(zhuǎn)型中出現(xiàn)了一些新角色,這些角色專注于治理、戰(zhàn)略指定以及協(xié)助利益相關(guān)方整合人工智能政策等!眲P捷公司旗下公司索蓋蒂(Sogeti)副總裁兼美國(guó)生成式人工智能部門負(fù)責(zé)人道格羅斯(Doug Ross)向商業(yè)技術(shù)網(wǎng)站ZDNet表示。
路透社報(bào)道稱,初創(chuàng)公司智研創(chuàng)科(Invisible Tech)雇傭了數(shù)千名遠(yuǎn)程工作的人工智能內(nèi)容培訓(xùn)師,協(xié)助AI21Labs和微軟等主要客戶訓(xùn)練人工智能模型,以減少錯(cuò)誤。智研創(chuàng)科為AI訓(xùn)練師開出的最高時(shí)薪為40美元,具體取決于員工的職位和工作的復(fù)雜程度。其創(chuàng)始人弗朗西斯佩德拉澤(Francis Pedraza)表示:“我們?cè)谌?00多個(gè)國(guó)家擁有至少5000名員工,他們都是博士、碩士學(xué)位持有者和知識(shí)專家!
有公司甚至將受雇人群轉(zhuǎn)用戶。新加坡《海峽時(shí)報(bào)》報(bào)道稱,一家新加坡初創(chuàng)企業(yè)打出“賺取零花錢”的名號(hào),招募公眾執(zhí)行錄制聲音和標(biāo)記圖片等任務(wù),用戶無需具備技術(shù),僅需要一部手機(jī),便可通過一款名為“Tictag”的應(yīng)用程序執(zhí)行任務(wù),例如用閩南語(yǔ)錄制單詞或以不同的音量說“Bixby”(三星移動(dòng)設(shè)備AI助手的名稱),獲取幾美分到幾美元的報(bào)酬。
此外,用戶被分配的任務(wù)還包括圖像注釋,如圈出圖片中汽車的品牌標(biāo)識(shí)或標(biāo)記物品顏色,進(jìn)而為人工智能模型提供準(zhǔn)確的訓(xùn)練數(shù)據(jù)。報(bào)道還稱,該公司將收集到的數(shù)據(jù)用于訓(xùn)練語(yǔ)音和語(yǔ)言、安全監(jiān)控、AI語(yǔ)音助手和圖像識(shí)別技術(shù)。