DeepSeek(圖片來源:Anna Barclay/Getty Images)
編輯註:本文2024年10月14日發表於關注中國基層勞動者的媒體平臺「工勞小報」
工勞小報編者前言:這是一位來自英國的研究者Bea Lind的投稿,Ta在今年初曾實地在中國多個地方的職業學校、數據標注公司進行田野調查,瞭解中國AI行業背後的勞動狀況。Ta與小報分享了自己的研究初步發現,並計畫再次前往中國進行更深入的研究。工勞小報很感謝Ta的分享,並且,如果作為讀者的你曾在數據標注行業打過工或瞭解該行業,我們也想邀請你填寫文末的問卷,或者與Bea Lind直接聯繫,成為受訪者。AI行業背後基層打工者的聲音需要被聽到!
基於我的博士研究,以下文章描述了人工智慧供應鏈中最勞動密集的部分——數據標注行業的勞動條件。今年早些時候,我從英國前往中國,研究了中國數據標注行業的發展及其工人的經歷。世界各地的數據標注員的聲音大多未被聽見,他們的勞動條件也基本未被公開審查。一些學者,如瑪麗.格雷(Mary Gray)和錫達特.蘇裡(Siddharth Suri)在2019年稱這些工人為「幽靈工人」。我希望我的研究能揭示導致這一行業勞動條件惡化的驅動因素,並展現勞動抗爭的廣闊可能性。只要這種抗爭得到釋放,便能加強工人團結,迫使資方改善條件,最終讓「幽靈工人」這個學術表達不再有任何意義。
AI背後的數據標注員是誰?
數據標注員整天坐在電腦前,在像澳鵬(Aopeng)和數據堂(Datatang)這樣的平台上標記大量數據。這些任務可以是簡單的,比如識別圖片中的人物或車輛;也可以是複雜的,比如標注醫療掃瞄中的疾病。這些標注為AI應用的開發奠定了基礎,如聊天機器人、自動駕駛汽車、智能安防系統和醫療診斷工具等。
數據標注行業的外包市場始於2011年,並在2015年開始迅速增長。大約在這一時期,網際網路公司開始與內陸省份的地方政府合作,如山西、河南、四川和貴州,建立數據標注基地。如今,這些省份擁有最多的數據標注公司,從小型工坊(員工少於20人)到擁有數千名員工的大型企業不等。
Viola Zhou和Caiwei Chen在2023年的研究中發現,學生佔據了數據標注行業20%至30%的勞動力。然而,在我訪問的公司中,這一比例高達90%。對於這些學生來說,在數據標注公司實習是畢業的必要條件。百度等公司利用實習生作為廉價勞動力來源。比如,2022年,百度與甘肅酒泉的一所職業學校合作,建立了一個數據標注中心,迫使160多名學生參加數據標注實習(Zhou&Chen,2023)。
嚴峻的就業市場和創記錄的青年失業率導致許多學生在學期期間自願從事數據標注工作,以豐富簡歷和賺取額外收入。我在田野調查中遇到的許多學生選擇這個行業是因為它的靈活性(兼職學生工通常可以選擇自己的工作時間)。一位曾經從事建築行業的工人解釋道,雖然工資低,但這份工作沒有那麼費體力,工人們也可以更頻繁地休息。
然而,兼職數據標注工作的靈活性付出了沈重的代價。由於公司不需要為兼職工人提供穩定的標注任務,他們可以在需要時招募這些工人,並在不需要時將他們拋棄。由於這種工作不穩定性,學生們常常感到有壓力,在工作旺季時不得不加班加點。一些公司經理告訴我,兼職數據標注員通常在家工作,他們可以連續工作,甚至包括夜班。換句話說,靈活的勞動制度使公司能夠增加勞動強度,並延長工作時間。
雖然全職工人(大多是應屆畢業生)通常能獲得穩定的工作任務,但他們也受到更嚴格的紀律約束。通常要求每天至少工作8-10小時,每週工作6天,並且工作速度由數據標注公司決定。如果他們未能達到標準,就會被要求加班,但沒有加班費。加班的情況經常發生,因為工人被要求完成額外的無償任務。例如,如果客戶認為他們的工作質量不佳,工人必須重新標注數據,但不會因此獲得額外報酬。此外,在公司接受一個項目之前進行的試用通常也是無償的,意味著工人必須無償工作。此外,工人還被要求進行新的任務培訓,這些培訓也是無償的。由於大多數項目都相對較短(平均1-2個月),工人們通常每月都要接受培訓。我採訪的一位正式工人解釋說,她有時為一個僅持續一個月的項目進行了30小時的無償培訓。她估算自己每週的工作時間(包括有償和無償的任務)約為72小時。
無論是學生工人還是全職工人,通常都沒有受到《勞動合同法》的保護。因此,他們無法享受社會保障、加班工資或公平工資的權利——工人們的工資經常低於最低工資標準。
惡性循環的工資下降
大多數數據標注員按件計酬,即他們的月薪取決於完成的標注任務數量,學生的單件任務工資通常比正式工人低。我採訪的經理和工人估算,行業中全職工人的平均月工資在2000到2600元之間。然而,如Zhou&Chen(2023)和Xu Shuang(2024)所示,許多工人的工資甚至低於這一平均水平,即使他們全職工作。
正式工人的工資曾經高得多——Xiaojun Feng(2020)估算,2018年時,行業的平均月薪在4000至5000元之間。隨著更多學生和應屆畢業生湧入行業,數據標注員之間的競爭加劇,使公司得以壓低所有工人的工資。我採訪的一位全職工人解釋說,儘管他的工作時間保持不變,但他的月薪從2021年的5000元降到了今天的3500元。
隨著工資的下降,工作速度卻在加快,在某些情況下幾乎令人難以承受。通過平臺追蹤工人的動作並不斷提高工作要求,公司推動工人增加每日完成的標注數量。在某些情況下,平臺甚至會將效率較低的工人踢出,從而加劇了工人之間的競爭,進一步加劇了失業的恐懼。
在短時間內完成任務的壓力增加了工人的壓力。一位工人告訴我,「壓力很大,我總是覺得自己沒有時間」。一位數據標注公司的經理也證實了這一情況,解釋道,「工作量非常非常大。工作非常不健康……這工作越來越難了!但工資卻一直在下降!」
危機中的抗爭新機遇
人工智慧行業的投資最近有所下降,這反過來推動了AI公司延遲支付數據標注供應商的款項;許多項目已經完成了一年,仍未結算。這導致了數據標注行業的危機,企業破產和工資拖欠達到頂峰。我採訪的一位公司老闆估計,今年有成千上萬的數據標注員未能按時(或根本沒有)收到工資。
此外,企業難以留住技術工人,這進一步加劇了危機。工人不願忍受低薪和惡劣的工作條件,導致了高流動率。事實上,工人們通常在行業中工作3-6個月後便離開。這影響了公司的利潤,因為招聘和培訓成本增加了,新員工的工作效率較低,進一步降低了許多公司的整體效率。根據我與一些業內人士的交談,勞動力不足,特別是能夠使用高級技術工具高效完成複雜任務的工人短缺,導致行業停滯不前。
這展示了工人的結構性力量,他們拒絕忍受惡劣工作條件對行業產生了不利影響。如果工人們能夠利用這種力量向資方施壓,集體行動或許能夠迫使AI公司改善工資和工作條件。
肯尼亞的數據標注員說「不」!
由數據標注員Richard Mathenge(2024)共同製作的一部近期記錄片表明,在非洲的數據標注員中,一場激勵人心的運動正在興起,推動科技巨頭改善工作條件並保護工人權利。2023年初,美國外包公司Sama的肯尼亞內羅畢分公司工人開始抗議,要求提高工資和減少工作時間。抗議者還與肯尼亞其他公司的數據標注員交流,並成立了一個WhatsApp小組,討論他們惡劣的工作條件以及如何應對。2023年年中,小組成員在內羅畢見面,決定成立工會以爭取他們的訴求。該組織迅速擴展到肯尼亞以外的地區,吸引了約500名非洲各地的成員。隨著工人組織力量的增強,公司老闆和肯尼亞政府的反應也愈發強硬:Sama解雇了抗議工人,而肯尼亞政府則拒絕法律承認該工會。然而,這並未阻止數據標注員繼續組織,爭取改善工作條件。這場鬥爭仍在進行,儘管科技巨頭努力壓制,但該行業的第一個工會正在不斷壯大。
在爭取改善工作條件的鬥爭中,不同國家的數據標注員面臨獨特的挑戰。比如,中國的數據標注員必須找到方法克服全職工人與兼職學生工人之間的分化。在我的田野調查中,我發現學生工人往往與正式工人分開工作,要麼在家,要麼在不同的辦公空間,而且分配的任務也不同。換句話說,公司將勞動力分散開來,消除了工人之間建立聯繫的需求(除了小工作組內的溝通)。在這種情況下,組織工人的任務困難重重,但並非不可能。中國特有的另一個挑戰是高度發達的外包系統,它通過多層中介公司隱藏了上游企業(如百度和比亞迪)。往往,數據標注公司的直接負責人將工資拖欠和工作條件惡化歸咎於上游僱主。由於上游公司被隱藏,工人們經常不知道向哪裡提出投訴,就像我採訪的一位試圖向勞動局投訴的工人一樣。
通過我的研究,我希望進一步揭示數據標注行業的結構和工作條件,以及潛在的抗爭力量。如果您是或曾經是數據標注員,並希望為深化我們對這一行業的理解做出貢獻,請考慮填寫以下匿名調查。如果您願意提供更深入的見解並與我分享您的經歷,歡迎通過[email protected]與我聯繫,我們可以在線上或線下進行訪談。所有數據都會完全匿名處理,您將不會在我未來的寫作中被識別。
填寫問卷:https://forms.office.com/r/936ALTKPpL
来源:工勞小報
短网址: 版權所有,任何形式轉載需本站授權許可。 嚴禁建立鏡像網站。
【誠徵榮譽會員】溪流能夠匯成大海,小善可以成就大愛。我們向全球華人誠意徵集萬名榮譽會員:每位榮譽會員每年只需支付一份訂閱費用,成為《看中國》網站的榮譽會員,就可以助力我們突破審查與封鎖,向至少10000位中國大陸同胞奉上獨立真實的關鍵資訊, 在危難時刻向他們發出預警,救他們於大瘟疫與其它社會危難之中。
