非物质劳动和数据收集:Facebook 的算法工厂 (第1部) —— 关于数字极权是如何剥削你的
【2019年5月21日存档】这是 Facebook 调查三部曲的第二个故事,名为 Facebook 算法工厂,旨在揭示、绘制和可视化隐藏在世界上最大的社交网络黑匣子后面的复杂而隐蔽的东西,关于你我如何被利用的真相。尤其,希望这些演示能为中国民间的独立调查人员提供参考(第一个故事在这里《深层政治:Facebook金字塔的人形肌理》)
Facebook 在 2018 年前三个月的月活跃用户数量已经达到22亿,第一季度收入达到 119.6 亿美元。扎克伯格的愿景正在变为现实,地球上的大多数人通过一个应用程序(社交网络 APP)相互连接。公平地说,这个社交网络真的连接起了数十亿人的生活,更同时剥夺了数十亿人的隐私权。我们每个人都是这一过程的见证人。
更重要的是,Facebook 平台本身远非公开透明。在这个复杂的算法机器的无形墙内发生的事几乎无人知晓,掌控数十亿人生活的是一种神秘的黑匣子。
我们应该对这些记录、分析、利用我们的互动、最深入的个人交流、我们的行为和私密活动的黑匣子感兴趣的原因必需有很多。在那些看不见的高墙内,每时每刻都是算法在决定哪些信息会出现在我们的信息圈中、有多少朋友和哪些朋友会看到你的帖子,什么样的内容将成为你现实的一部分,什么会被审查或删除。是这个黑匣子在定义全球几十亿人的认知。这就是我们在《定制人将终结民主》一文中所强调的灾难 — — 当公民没有自由的认知时,唯有操纵者能赢得最终胜利和最大的霸权。
另一方面,这个黑匣子为这个看不见的非物质工厂的所有者定义了新形式的劳动力,新型剥削和巨额财富以及巨大权力的产生,这些工厂创造了新的和深刻的经济差距,形成了新的阶层。
在算法机器深层的某个地方,存在隐藏的新形式的侵犯人权行为,新的剥削、和大规模操纵机制,每天影响数十亿人。
老大哥经济和与非物质劳动相遇的地方
在创造一种商品时,人们在劳动主体上运作,运用劳动工具,创造一种产品。生产资料对象包括两大类:劳动工具(刀具,工厂,基础设施,等等)和劳动对象(自然资源和原材料)。例如,在农业社会中,生产资料是土壤和铲子。在工业社会中,它们是矿山和工厂,在知识经济中是办公室和计算机。
现在我们所有人都在上图的最下面:算法社会。算法在决定我们这些人类的基本认知、算法在决定我们能找到什么样的男女朋友、算法在决定我们可以获得什么样的“民主”、算法告诉当权者我们中哪个人会“在将来某个时刻犯罪”,我们会因此提起被捕。
关联:《政治的未来:当机器决定“民主”?》
如果我们试图在这个背景下了解 Facebook 工厂的生产过程和产品创造,我们得出的结论是,这里有一个重要的区别:劳动过程中的主要原材料(数据、内容和元数据)才是劳动对象,它们是由人类 — 用户 — 你我 — 创造的,但劳动本身是由算法执行的。
(在早期的 2000S TIZIANA TERRANOVA 规定用户的免费劳动是数字经济中经济价值的来源。用户的数字劳动也可以被描述为工作中没有被特意查看的影响和社会活动,例如在社交媒体网站上更新您的个人资料、撰写评论或在照片上标记人物等等)
因此,基本上根据我们在 Facebook 等这类社交媒体上做的事可以被描述为某种形式的免费数字劳动力。根据 Trebor Scholz 和 Laura Y. Liu 的说法,“数字劳动的工具确实无处不在; 它们是快速变化的和隐形的。甚至我们的地理位置、投入和跟踪的流动性都不会被视为劳动力,而是成为可以直接转化成经济价值的资产。“ 是 Facebook 的经济价值。
超过10亿 Facebook 用户中的每一个,都是数字工作者,如果平均每天工作 20 多分钟,点赞、评论和滚动状态更新。那就是每天超过 300,000,000 个工作小时的免费数字劳动力。
看看你我被 Facebook 剥削了多少?等下,你真的只工作了 20 分钟吗?我能想象得到你没事就去打开它、滑动它,浏览和互动……
我们早就应该清楚的是,Facebook 工厂的主要产品并不是数十亿的文本、更新、上传的照片或视频。正如我们将在下面的调查中探索的那样,它们只是算法社交网络分析、分类和算法分析的资源。
从人类中心的角度来看,我们希望将自己和我们的劳动放在主要焦点上,但是在这种情况下,劳动的主要形式是由算法完成的。这个非物质工厂的产品有超过十亿种不同的用户配置文件,被分类并准备出售。该系统的细节是,被用作原材料的用户 — 你我 — 不断地对自己进行微调,为该系统提供越来越多的关于你我的私密信息。
在 Facebook 算法工厂里
在第一部分调查中,我们将尝试阐明你我的行为、动作和信息如何通过被收集、存储、分析并最终转化为产品,帮助 Facebook 赚钱。当然,同样的状况也在帮助:腾讯、新浪、谷歌、亚马逊、阿里巴巴 ……赚钱。
我们绘制这个不可见系统的方法是找到所有输入和输出,然后尝试描述在两者之间执行的操作类型。
这里的方法包括在可公开访问的资源上使用不同的调查工具,也就是开源调查。本研究的三个主要部分涉及 Facebook 数据收集、存储和分析以及应用于用户的定位类型:
— — 以下是调查工具和资源 — —
1、数据收集
Facebook 数据政策分析:https://www.facebook.com/full_data_use_policy
绘制 Facebook 平台上的所有输入:
https://www.facebook.com/
第三方网站上的 Cookie 和像素追踪技术分析: https://www.facebook.com/help/cookies/update
Facebook 的所有政策分析:https://www.facebook.com/help/111814505650678
研究 Facebook 供应商、服务提供商和其他合作伙伴:
https://facebookmarketingpartners.com/
Facebook Ireland Ltd 审计报告(2011):http://www.europe-v-facebook.org/Facebook_Ireland_Audit_Report_Final.pdf
2、存储和数据分析
Facebook 专利数据库研究:https://www.google.rs/search?tbm=pts&hl=en&q=inassignee%3A%22Facebook%2C+Inc.%22+
Facebook API:https://developers.facebook.com/docs/graph-api/reference/
3.定位
Facebook 广告制作流程:https://www.facebook.com/ads/manager/creation/
数据收集:从生命体中提取数据
数据收集,从人类领域的生命体中提取数据是必不可少的操作,是 Facebook 帝国的基础之一。
根据调查,Facebook 在利用不同的方式从我们在 Facebook 内外的行为和活动中提取数据,我们可以在以下分头研究它们:
A.Within Facebook
你的每一个行为、你上传的每张照片、你参加的每一个活动,都会被 Facebook 记录并存储在他们的数据库中。我们可以将 Facebook 收集的两大类信息分开。首先是所有交互,创建或上传的内容,访问的页面以及您在 Facebook 上所做的一切 — 活动和行为。(在这里看大图)
我们可以将第二组视为你我自愿提供的内容 — — 您在个人资料信息部分中提供的有关您自己的所有信息。(在这里看大图)
这两组信息之间存在显著的差异。配置文件信息基本上是静态信息,很少更新,取决于您(可以自由)给出的直接输入;而另一方面,活动和行为输入是动态的,代表您点赞、分享、创建和实时交互。个人资料信息通常包含误导性或错误信息,但中国的实名制就不同了,甚至微信公众号那种东西要求您“手持身份证拍照”,居然还有人注册它,甚至是很多人注册它……
B. Digital Footprint
从您的设备中收集的数字足迹是 Facebook 拥有的第二大信息资源。在这种情况下,我们还需要区分两个主要类别:可以从您的移动设备收集的信息、以及可以从您用于访问 Facebook 的笔记本电脑或台式计算机上收集的数字足迹。
与可从移动设备收集的信息相比,可从台式计算机上收集的信息并不多样化。但是,它们仍然可以透露很多关于你的信息。其中一些信息包括您的 IP 地址、操作系统、浏览器类型和其他可用作唯一标识符的信息,并结合通过 cookie 和像素追踪技术收集的信息,揭示了每个人不同的行为模式。
Cookies
Facebook 并没有仅仅限于在 Facebook 内部收集信息,它数以千计的隐形数据收集触角几乎达到了万维网的一半。我们对在线跟踪器的研究显示,在我们使用的欧洲排名前 50 位的网站中,有 46% 的网站都嵌入了 Facebook Cookie :(在这里看下面的大图)
“使用 Facebook 的服务,包括我们的网站和应用程序(无论您是否已注册或登录)或只是访问使用 Facebook 服务的其他网站和应用程序(包括 Like 按钮或我们的广告工具),我们都收集 cookies。“ — — Facebook Cookies 政策 (在这里看下面大图)
根据对欧洲访问量排名前五十的网站进行的研究,我们检查的每个网站平均嵌入了7种不同的第三方 cookie。总共, 在365 次检测中查到 174 种不同类型的 Cookie。这 174 个独特的 cookie 属于 87 个不同的公司。美国 4 大公司占据主导地位:❗️谷歌(90%),Facebook(46%),推特(24%)和亚马逊(10%)以及 Infomediaries Gemius SA(36%),Httpool(7%)
每当你我访问其中一些网站时,Facebook 都会收到有关我们访问的信息,这些信息将成为分析过程中不可或缺的一部分,这是一个永无止境的过程,可以创建一个关于您是谁,您喜欢什么、以及您的行为特征是什么的清晰全景图。
手机权限
Facebook 能够获得有关您的在线行为的信息,这只是信息的一小部分,与他们从智能移动设备获得的信息相比。
我们以前介绍过一些防御办法,见《您真的理解应用权限都授予了什么吗?》其中一些权限允许 Facebook 提取可能非常侵入性的不同形式的信息,例如设备标识符、设备的精确位置、联系人的身份、SMS 消息的内容、您的通话记录、录制音频、获取有关您的 WiFi 连接的信息、没有通知的下载文件等等。(在这里看大图)
其他 Facebook 公司
除了主要公司,Facebook 还拥有和经营至少其他7家公司:Facebook Payments Inc.,Atlas,Instagram LLC,Onavo,Parse,Moves,Oculus,LiveRail,WhatsApp Inc.和 Masquerade。
据他们自己说的,他们可以在他们的公司家族中分享有关您的隐私信息,声称“改善服务”。其中一些“公司家族”成员也是数据收集巨头。仅 WhatsApp 就有超过10亿全球月活跃用户数量(截至2016年2月)。2016 年6月,另一位 Facebook 家庭成员 Instagram 的月活跃用户达到5亿。
这些应用程序、特别是 WhatsApp,正在收集有关用户行为和活动的更多信息。简要介绍一下WhatsApp 隐私政策或移动电话权限列表,揭示了一个类似于我们对 Facebook 本身正在调查的数据收集操作。这就是为什么我们强烈建议您不要使用它。
具体到这些公司提供的服务,数据收集已经扩展到新的领域。在 Oculus Rift 的情况下,根据他们的隐私政策,当您使用虚拟现实耳机时,他们可以收集并向 Facebook 提供有关您的身体动作的信息。 Facebook Payments Inc. 是一家在 Facebook 上提供支付服务的公司,同时收集不同的信息集,主要与您的交易、信用卡号码等有关。(在这里看下面大图)
Facebook 可以通过 Facebook 以外的公司收集的所有数据类型的详细调查将需要进行扩展分析,遗憾的是本文只能做其中一部分。
Facebook 的合作伙伴
根据 FB 隐私政策,他们会从第三方合作伙伴那里收到有关您和您在 Facebook 内外活动的信息。2013 年 4 月,Facebook 推出了“合作伙伴类别”,并整合了数据经纪人 Acxiom(企业数据和分析),Datalogix(数字媒体和离线采购数据服务)以及 Epsilon(直接面向消费者营销)的离线和第三方数据。Axciom Corporation 服务器每年处理超过 50 万亿次数据“交易”。该公司高管表示,其数据库包含全球约5亿活跃消费者的信息,每人约有1,500个数据点。
这些公司通过商店会员卡、邮件列表、公共记录信息(包括家庭或汽车所有权)、浏览器 cookie 等信息收集有关您的数据。因此,如果您在 Safeway 购买,并使用您的 Safeway 忠诚卡,其他 Facebook 合作伙伴公司 Datalogix 就收集并保存这些信息。2014 年12月,Oracle 公司以12亿美元的价格收购了 Datalogix。根据他们的声明,Datalogix 汇总并提供了超过2万亿美元的消费者支出,并拥有超过 650 家客户,包括美国顶级广告商和数字媒体出版商。
据他们介绍,通过 Datalogix,Oracle 数据云将根据人们的工作、人们所说的内容、以及人们所购买的产品,为消费者提供对数字和传统渠道的最丰富的了解,使领先的品牌能够个性化和衡量每个客户的互动。
除了市场上最大的数据收集者和经销商,Facebook 还通过他们的 Facebook 合作伙伴计划与数百家其他数据交易商、广告技术开发商、数据和营销分析公司交换数据。
另一组可以访问 Facebook 数据的组织是供应商、服务提供商和其他所谓的合作伙伴,他们提供技术基础设施服务,分析我们所有人使用 Facebook 服务的方式,Facebook 声称这些合作伙伴必须遵守“严格的保密义务”。
但是 Facebook 自己呢?至少在剑桥分析公司事件被曝光后你应该知道,他们如何通过操纵你我来操纵民主。这个黑匣子里面究竟都有什么,真的需要等着一个个剑桥分析公司被曝光吗?
现在该公司和谷歌、亚马逊等老大哥一样,想要把监视器塞进你的卧室。Facebook 正推出由人工智能驱动的新型视频通话设备,想要更为深入地侵犯你的私生活。上周推特正在刷屏抵制该产品。◾️
预告,下一篇:《Facebook 算法工厂 (2): 人类数据库和算法劳工》
— — 未完待续 — —
更多详见分类目录“关于Facebook”