探访非洲数据标注工厂:贫民为硅谷人工智能打工赚钱

近日BBC记者Dave Lee的一篇文章讲述了人工智能背后不为人知的贡献者——生活在肯尼亚贫民窟的一群人。
人工智能如人们预期工作时,硅谷企业总喜欢说一切“好似魔法”。

但实则不然。魔法的背后是布兰达(Brenda),一位26岁的单身母亲。她目前居住在非洲最大的贫民窟基贝拉(Kibera),或许这里也是全球生活最艰难的社区。在这里,成千上万人住在一个比伦敦海德公园大不了多少的地方。

每一天,布兰达坐着公交车前往肯尼亚首都内罗毕东部。在那里的一栋大楼内,她和其他1000多名同事为人工智能的另一面——我们所知甚少,所见更少的一面——辛勤付出。在八小时的工作时间内,她需要负责创建训练数据,即把数据——大多数为图像——加工成计算机可以理解的形式。


布兰达先是上传一张图片,然后用鼠标跟踪里边的所有物体。人、车辆、路牌、车道标记——甚至天空,还要特别说明是晴朗的还是阴霾的天空。将数百万张这样的图片输入到人工智能系统中,意味着(比方说)一辆自动驾驶汽车可以开始“识别”现实世界中的物体。数据越多,理论上机器越智能。

在狭小的办公室里,她紧挨着身边的同事,紧盯着显示屏,放大图像,防止标错哪怕是一个像素。一名上级人员会检查他们的工作,若没有达到要求,就需要返工。速度最快、准确率最高的训练员的名字可以出现在办公室的多台电视机屏幕上以作鼓励。而最受欢迎的奖励则是:购物券。

“你可以做一些与众不同的事情,”当我拜访她时,布兰达告诉我说。她和自己的女儿,兄弟还有母亲一起蜗居在一间拥挤的小房子里。“我现在的工作,让我相信我的努力正为未来的某些人提供帮助。”

贫民窟学校
布兰达的雇主是Samasource。这是一家总部位于旧金山的公司,客户包括谷歌、微软、Salesforce和雅虎等。这些客户大多数都不会希望讨论他们与Samasource合作的细节本质——因为大多与未来项目有关——但可以说,在贝罗毕这栋大楼里准备的数据,构成了硅谷一众大公司在人工智能领域得以开展研究的重要一部分。

布兰达在标注数据。

这种技术进步或许永远都不可能出现在基贝拉这样的地方。作为非洲最大的贫民窟,这里有太多亟需解决的问题,比如缺少清洁淡水,以及众所周知的卫生危机。但这不代表人工智能不会在这里产生积极的影响。当我们在这个下雨天驱车前往基贝拉少有的几栋永久性建筑之一时,我们发现,这栋位于铁路线附近的建筑虽残破不堪,但显然自殖民以来经常性为人们所使用。

大约一年前,这栋建筑是扔石头的暴徒与军队之间的分界线。今天,它已经成了一个蓬勃发展的活动中心,里边有一个媒体学校和工作室,有一个自助餐厅;而在楼上的一个房间里,满满当当的都是台式机电脑。在这里,吉迪恩·恩尼欧(Gideon Ngeno)教授向25名左右学生传授个人计算机的基础使用知识。

在这个过程中有趣的一点是:哪怕是在基贝拉这样的地方,人们的数字化素养其实不低。这里,智能手机十分普遍,其它所有商店都有充电器和手机配件等出售,并且人们会使用移动支付系统MPesa来购买这些东西。


但非洲的大多数地区都没有经历过台式机电脑的年代。键盘和鼠标的组合对他们来说完全是一种新奇陌生又复杂的体验。一名Samasource的团队成员告诉我说,在被要求搜索互联网上的信息时,她经常观察到有学员不是看着电脑,而是拿起他们的手机。

在这里教授的课程则是为那些希望继续在Samasource等数字经济公司工作的人专门设计的。学费为500肯尼亚先令(5美元左右)。对那些经常生活在贫困线以下的人来说,这个费用也还可以承受。公司一开始是免费提供课程的,但我后来得知,由于没有经济上的付出,考勤(和上课认真程度)都不太理想。

恩尼欧教授说,目前上课最大的困难是噪音——就在我们说话的间隙,一群小孩子发生阵阵吵闹声。而在外边,又是一个人来人往十分嘈杂的集市。

相关评论