Lentis/社交媒体挖掘
社交媒体挖掘是指从社交媒体平台收集和分析用户生成的数据以识别模式的过程。它通常用于进行研究或为广告商提供信息。社交媒体挖掘可以揭示关于主题的常见观点,将大型群体分开,并识别个人和群体随时间的变化。全球社交媒体使用预计将继续增长 [1] ,用户生成的数据也是如此。随着更多数据被生成、收集和分析,不同的利益群体将做出更明智的决策。
Facebook 是一款社交媒体网站,允许用户在网上连接和分享内容。虽然它是在 2004 年为大学生创建的,但 Facebook 发展成为世界上最大的社交媒体平台,截至 2018 年,每月活跃用户超过 22 亿 [2] 2008 年,总统候选人开始使用 Facebook 来宣传他们的竞选活动,通过高效地与大量选民建立联系。
剑桥分析是一家总部位于伦敦的数据分析和咨询公司,拥有政治和商业部门。它成立于 2013 年,并于 2018 年 5 月停止运营。该公司声称使用数据来改变受众行为,并拥有超过 8700 万美国人超过 5000 个数据点 [3] 。剑桥分析最广为人知的是它在特朗普 2016 年总统竞选中的作用。它有争议的数据收集方法在它停止运营之前不久公之于众。
到 2015 年底,Facebook 发现超过 5000 万用户的资料已被一个应用程序收集。该应用程序名为“这就是你的数字生活”,由剑桥大学研究员亚历山大·科根开发。通过这个应用程序,超过 50 万用户被付费参加性格测试。Facebook 的平台政策允许收集朋友的数据以改善应用程序中的用户体验。得益于这样的政策,该应用程序还能够收集测试者的 Facebook 朋友的信息。在得知此事后,Facebook 通过将朋友的信息限制在第三方应用程序之外,改变了其平台政策。他们还禁止了该应用程序并要求并获得了该数据已被销毁的认证。然而,科根仍然拥有这些数据并将它们卖给了剑桥分析。 [4]
在 2016 年总统大选共和党初选中,特德·克鲁兹严重依赖剑桥分析的服务,花费了 58 亿美元。克鲁兹竞选活动表示,剑桥分析向他们保证,他们所有的数据都是合法获取的,并且在法规范围内,并且 2015 年媒体做出的说法是错误的。 [5] 不久之后,特朗普竞选活动获得了剑桥分析的服务。该公司使用各种算法针对不同的受众群体投放 10,000 个不同的广告。这些广告被确定在大选前几个月获得了数十亿次观看。剑桥分析后来报告称,其中一个广告,一个互动图形,详细说明了“关于克林顿基金会的 10 个令人不快的事实”,平均参与时间为 4 分钟,并将其称为“我们推出的最成功的广告”。 [6]
2018 年 4 月,扎克伯格在国会面前露面,花费了 10 个小时回答 91 位参议员关于 Facebook 的数据隐私实践和与剑桥分析的关系的问题。扎克伯格虽然谨慎地没有将这些事件称为数据泄露,但他对所发生的事情负起责任并为他的处理方式道歉。他还为 Facebook 辩护,称用户拥有自己的数据,并完全控制他们与 Facebook 共享哪些信息 [7] 。听证会结束后,立法者因缺乏基本的社交媒体知识和不愿跟进棘手问题而受到批评。
一个月后,扎克伯格出现在欧洲议会面前,有 22 分钟的时间回答许多详细的问题。虽然欧洲议会议员被认为是提出更难的问题,但调查的格式不允许扎克伯格提供深入的答案。扎克伯格在回答国会听证会未涉及的许多问题之前时间用尽了 [8] 。
虽然 Facebook 最初是为大学生创建的学生名录,但它迅速发展成为一个“将世界连接在一起”的平台。 [9] [10] 然而,在公司上市之后,马克·扎克伯格和其他高管有责任为股东赚钱。公司价值的增长直接与 Facebook 的公众形象相关。虽然 Facebook 可能声称重视社会公益和慈善事业,但它允许各种公司收集用户数据的议程变得越来越清晰,这往往以牺牲用户隐私为代价。由于 Facebook 的价值部分来自用户意见,Facebook 高管在用户信息的挖掘程度上遇到了两难境地。
剑桥分析公司高管
[edit | edit source]与 Facebook 的高管不同,剑桥分析公司的高管没有表现出对个人隐私权的同等尊重和重视。由于他们是由公司直接雇用以“改变受众行为”的,因此他们天生对自身公众形象不太关心,而是更关心法律后果。剑桥分析公司创始人克里斯托弗·怀利在 2014 年离开该公司后公开表示,“对他们来说,规则无关紧要。对他们来说,这是一场战争,一切都是公平的。”这进一步表明了剑桥分析公司高管以金钱为驱动的议程。 [11]
美国 Facebook 用户
[edit | edit source]此案揭示了隐私对普通美国 Facebook 用户的重要性。用户从 Facebook 中获得的价值通常是娱乐驱动的。他们重视他们在网上发布的信息,并希望 Facebook 能够提供一定程度的隐私。一些 Facebook 用户依靠 Facebook 作为新闻来源。当向每个用户展示的新闻旨在影响而不是告知时,Facebook 用户就失去了从公正来源做出自己明智决定的能力。
2016 年特朗普总统竞选
[edit | edit source]特朗普竞选团队完全受选举唐纳德·特朗普入主白宫的驱动。这项努力以牺牲美国人民的隐私为代价,当竞选团队为剑桥分析公司的服务付费并了解剑桥分析公司拥有可用于改变选民行为的用户数据时,这一点便得到了证明。
可推广的教训
[edit | edit source]了解服务条款
[edit | edit source]根据德勤 (2017) 的数据,91% 的美国人同意法律条款和服务条件,而没有阅读它们。 [12] 语言的复杂性和条款的长度是最大的阻碍,因为美国人每年需要花费 244 个小时才能阅读他们同意的一年内所有隐私政策 (麦克唐纳和克莱诺尔,2008)。 [13] 因此,可以推断,大多数 Facebook 用户在剑桥分析公司丑闻曝光时没有阅读 Facebook 的使用条款。用户没有意识到他们的信息可能会被第三方收集和挖掘以追求其议程。这种缺乏知识导致了公众的强烈抗议,导致 Facebook 在几天内股票价值损失了 1000 亿美元。
公众看法与法律能力
[edit | edit source]丑闻曝光后,保罗·格里沃 (2018) 声称没有发生数据泄露,因为“亚历山大·科根请求并获得了对选择加入其应用的用户的访问权限,并且所有相关人员都同意了”。 [14] 一周后,在负面公众反应之后,扎克伯格 (2018) 发布了一份声明,对丑闻负起责任,并假定“Facebook 与分享其数据并期望我们保护其数据的人之间发生了信任危机”。 [15] 公司必须将公众反应作为其服务条款的潜在后果的一部分,并了解这样一个事实,即相当一部分用户没有阅读服务条款。
虽然用户在“喜欢”资料中可能没有什么需要直接隐藏的东西,但他们仍然是广告的目标并受到广告的影响。他们的数据被用于帮助政治候选人追求许多美国人强烈反对的议程。很明显,公众的强烈反应发挥了重要作用,但这种反应是由于用户数据被挖掘这一单一因素引起的,还是由于其被用于追求的议程引起的?根据德勤 (2017) 的数据,“超过 80% 的消费者认为公司使用他们的个人数据,78% 的消费者认为他们的个人数据与第三方共享”。 [12] 因此,可以推断出,大多数用户认为他们的数据已经被使用,公众的不适感是由人们对数据使用方式的恐惧引起的,而不是由数据可能说明的个人信息引起的。
Facebook 用户和科根应用程序的参与者接受了服务条款,这些条款允许不同程度地挖掘他们的个人信息。尽管接受了这些条款,剑桥分析公司丑闻还是引起了公众的强烈抗议,导致#DeleteFacebook 成为 Twitter 上的热门话题。2018 年 3 月 26 日,当消息传出超过 8700 万用户的个人信息被收集时,Facebook 的股价暴跌了 24%,相当于超过 1340 亿美元。 [16] 从这次事件中,我们可以更好地了解到,虽然公司可能通过其服务条款获得法律保护来执行某些行为,但公众舆论和反弹造成的损失可能远大于公司价值损失,远大于几场败诉造成的损失。
进一步的研究和章节扩展
[edit | edit source]监管
[edit | edit source]1988 年,联合国人权委员会预见到数字信息隐私问题,并指出,收集和存储数字个人信息“必须受法律监管”。 [17] 然而,直到 30 年后的 2018 年 5 月,联合国的通用数据保护条例 (GDPR) 才生效。GDPR“旨在更新保护个人个人信息的法律”。在 GDPR 出台之前,美国在很大程度上没有对数字个人信息空间进行监管,而欧洲的一些监管机构一直在努力跟上技术进步。 [18]
其他国家/地区的社交媒体挖掘
[edit | edit source]英国立法者公布了证据,证明“脱欧”的官方竞选活动“Vote Leave”受益于剑桥分析公司的运作。这一说法得到了揭露特朗普竞选活动和剑桥分析公司丑闻的举报人克里斯托弗·怀利(Christopher Wylie)的证实。Vote Leave 在一家名为“Aggregate IQ”的公司身上花费了 390 万英镑,该公司是由 SLC 成立的,SLC 是剑桥分析公司的母公司。AIQ 和剑桥分析公司否认两家公司在脱欧运动期间有合作。然而,怀利(2018 年)确认,两家公司在欧盟公投期间共享了数据库和软件。[19]
参考文献
[edit | edit source]- ↑ Statista (2017). 全球社交网络用户数量,从 2010 年到 2021 年(十亿)。https://www.statista.com/statistics/278414/number-of-worldwide-social-network-users/
- ↑ Statista (2018). 截至 2018 年第三季度,全球每月活跃 Facebook 用户数量(百万)。https://www.statista.com/statistics/264810/number-of-monthly-active-facebook-users-worldwide/
- ↑ 剑桥分析公司 (2018). CA 政治。 https://webcache.googleusercontent.com/search?q=cache:uSCCZ4p2O4UJ:https://cambridgeanalytica.org/+&cd=12&hl=en&ct=clnk&gl=us
- ↑ 守护者 (2018). 5000 万 Facebook 个人资料在重大数据泄露中被剑桥分析公司获取。 https://www.theguardian.com/news/2018/mar/17/cambridge-analytica-facebook-influence-us-election
- ↑ Svitek, P. 和 Samsel, H. (2018 年 3 月 20 日). 特德·克鲁兹表示,剑桥分析公司告诉他的总统竞选团队,其数据使用是合法的。
- ↑ Lewis, P. 和 Hilder, P. (2018 年 3 月 23 日). 剑桥分析公司为特朗普获胜制定的蓝图。
- ↑ 华盛顿邮报 (2018 年 4 月 10 日). 马克·扎克伯格参议院听证会记录。 https://www.washingtonpost.com/news/the-switch/wp/2018/04/10/transcript-of-mark-zuckerbergs-senate-hearing/
- ↑ BBC (2018 年 5 月 22 日). 扎克伯格在欧洲议会作证遭到批评。 https://www.bbc.com/news/technology-44210800
- ↑ McGirt, E. (2017 年 10 月 05 日). Facebook 的马克·扎克伯格:黑客。辍学。首席执行官。
- ↑ Constine, J. (2017 年 6 月 22 日). Facebook 将使命宣言改为“让世界更紧密”。
- ↑ Rosenberg, M.,Confessore, N. 和 Cadwalladr, C. (2018 年 3 月 17 日). 特朗普顾问如何利用数百万人的 Facebook 数据。
- ↑ a b 德勤 (2017). 全球移动消费者调查:美国版。 https://www2.deloitte.com/content/dam/Deloitte/us/Documents/technology-media-telecommunications/us-tmt-2017-global-mobile-consumer-survey-executive-summary.pdf
- ↑ McDonald 和 Cranor (2008). 阅读隐私政策的成本。 http://lorrie.cranor.org/pubs/readingPolicyCost-authorDraft.pdf
- ↑ Grewal, P. (2018). 从 Facebook 暂停剑桥分析公司和 SCL 集团。 https://newsroom.fb.com/news/2018/03/suspending-cambridge-analytica/
- ↑ Zuckergeberg, M. (2018). 关于剑桥分析公司的更新。 https://www.facebook.com/zuck/posts/10104712037900071
- ↑ Mirhaydari, A. (2018 年 5 月 10 日). 在剑桥分析公司数据丑闻之后,Facebook 股票回升至损失的 1340 亿美元。
- ↑ 美国应该制定法律来保护社交媒体用户的數據。 (2018 年 4 月 05 日)。
- ↑ Burgess, M. (2018 年 11 月 08 日). 什么是 GDPR?英国 GDPR 合规性摘要指南。
- ↑ Wylie, C. (2018) 英国脱欧大抢劫:我们的民主是如何被劫持的。 https://www.theguardian.com/technology/2017/may/07/the-great-british-brexit-robbery-hijacked-democracy