X

大数据之殇:对人文、伦理和民主的挑战

由于互联网,电子计算机、数据存储, 物联网技术,移动通讯设备,社交媒体的发展,人类进入大数据时代。由于大数据及其分析技术的迅猛发展,大数据技术在自然科学,工程,生物,医学等领域获得了广泛的应用。大数据技术也颠覆了传统企业管理和商业模式, 对人类传统的思维模式和行为和生活方式产生巨大冲击。

大数据及其相关技术的应用和研究在公共管理学界和实践界方兴未艾。公共管理领域大数据及其技术的应用的集大成者为打造智慧城市。 公共管理者希望通过大数据的收集和分析,掌握和认识人和公共管理活动的规律。通过打造智慧城市,提升政府的治理能力和水平,解决城市经济和社会发展带来的一系列问题,提供优质和高效的公共服务,提升城市市民的生活水平和质量。

大数据及智慧城市的支持者相信通过对大数据的收集,分析和使用,公共管理和公共政策的决策更加科学,公共产品产生和分配会更加公平,技术驱动的大规模公众直接参与的可能让我们的社会更加平等和民主。尽管现有的文献已经指出发展大数据技术和智慧城市对政府和公共管理的挑战,然而这样的探讨仍然是以发展大数据技术和发展智慧城市为出发点,并没有从根本上对大数据技术及其应用的指向进行彻底的反思。即使在欧美等国家,学者已经开始对大数据进行哲学、伦理学和政治经济学的反思和批判,但这样的思考和反思对大数据技术及其理想化未来的推崇不成比例。

这样的反思,对发展中国家尤为重要。发展中国家对采纳先进科技,赶超发达国家、促进经济发展的痴迷,使得发展中国在享受技术后发优势的同时,也不得不品尝后发劣势的苦果,发展中国家在突飞猛进的快速发展中,相应的文化,制度和心理支撑条件的落后和缺位使得技术发展的缺陷和弊端得到放大。因此对于发展中国家而言,学习和思考发达国家在技术发展过程中取得的经验和教训,躲避发展陷阱,维持和获得后发优势非常重要。

本文旨在结合西方国家主要是美国大数据技术应用发展过程中出现的一系列问题和学界对大数据及其相关技术的反思,以发达国家大数据技术应用过程中出现的案例为例,分析和探讨大数据及其相关技术内在的缺陷和困境,大数据在公共管理领域的应用不是一个技术问题,而是一个社会政治的过程。大数据本身不会自动像它的福音传播者传扬的那样是实现科学,公平,民主的包治百病的灵丹妙药。相反,大数据技术对人性,正义,民主是巨大的潜在的威胁 。在大数据高歌猛进的时代,研究大数据的原罪,控制大数据之恶是公共管理研究者和公共管理者不可推卸的使命。

大数据范式与大数据技术乌托邦

大数据技术背后是一整套新的科学哲学思想,是一个崭新的世界观和范式体系。大数据是一场计算革命。著名大数据学者Mayer-Schonberger 等人指出这个大数据的新范式包涵以下核心思想:1)大数据强调全体数据而不是样本;2)大数据强调数据的混杂性而不讲究精确;3)大数据强调相关关系而不是因果关系;4)大数据强调预测而不是解释,大数据强调一切皆可量化。

大数据技术最富有颠覆性和革命性的部分在于在大数据思想支配下的数据分析师和社会科学家不再关心因果解释机制,而是将焦点转向了数据变量间的相关性,因为大数据的最大应用价值体现在其预测而不是解释。用数据进行预测,只要数据间有相关性就足够了。

美国连锁超市巨头沃尔玛Walmart 很早就开始利用自己销售商品的大数据进行预测,取得了巨大的成功。2004年在台风法兰西(Frances) 即将重创美国东南之前,沃尔玛非常想知道应该如何安排自己的库存和货架,以满足受灾区民众的潜在需求。在前大数据时代,做到这点相当困难。

但是这一次沃尔玛将有记录以来的所有地区在飓风来袭时所有连锁店的销售记录进行了分析,发现最受欢迎的商品是草莓味速食蛋挞。飓风期间草莓味速食蛋挞的销售量是平时的7倍。基于这样的大数据关联分析,沃尔玛调集自己所有的草莓味蛋挞到台风将要袭击的地区,取得了惊人的销售业绩。直到今天,人们还搞不清楚,为什么速食蛋挞会大卖,特别是为什么只有草莓口味而不是其他口味会大卖。

对大数据分析师和管理者而言,在大数据的范式里知道为什么不重要,只要关联存在,能成功预测即可 。这样的思路的指导下,网飞(Netflix)公司根据自己的影音资源租赁的记录,成功制作了一系列最难预测观众口味的影视作品,取得了巨大商业成功。

随着大数据在社会生活中的应用越来越广泛和智慧型政府在公共管理领域的发展突飞猛进,大数据和智慧城市建设过程中出现了一系列的问题。学者开始越来越关注大数据和智慧城市建设的对政治和社会发展的负面影响和冲击。

从这样的社会运动视角批判地来看大数据及智慧城市等相关技术,大数据技术自身的技术属性既是其优势,也是其危险之所在。如果我们运用马克思主义的辩证唯物主义和政治经济学视角来分析大数据及其衍生技术和管理范式,我们会看到大数据本身内在着不可调和的矛盾使得大数据技术不是像它的福音传播者所传播的那样美好,恰恰相反大数据及其技术是对人性,社会伦理(隐私和社会正义)以及民主巨大的威胁和挑战。

大数据技术对人性、人文(Humanities)及人的存在的威胁

在大数据分析师看来一切皆为数据,人的情感,意志,态度以及行为都可以数据化。人及其社会关系的也是可以以标准化的数据形式存在的。

从马克思辩证唯物主义的哲学视角来看, 这是对人和人性的简单化,机械化和物化。马克思主义哲学是从实践出发去理解和把握人的存在的,从人的存在即社会存在的角度出发全方位理解人性和人的存在,离开这一点分析和理解人的存在都是对人的异化。

推崇大数据和大数据技术的数据分析师和技术官僚将对人和人性理解的简单化推向了极致。这样得出的研究成果和在之指导下展开的管理活动本质上是错误的和注定要失败的。2005 年大数据技术的引领者谷歌公司开发的大数据人脸识别和标签技术将两个非裔美国人的照片错误识别成了大猩猩还贴上了大猩猩的文字标签。 大数据科学家也认为人的情绪是可以被量化和测量的。

他们发展出了一种叫情绪分析(sentiment analysis)的技术,通过对大量文本的分析和机器学习,他们认为他们可以测量出一个特定文本的情绪即这个文本是快乐还是悲伤。脸书(Facebook)的数据分析师试图测量在特定时期美国的国民情绪。他们根据人们在脸书上的留言而产生的海量信息的分析,得出结论说圣诞节是美国人最开心的时间。

显然这样的分析结果是相当有问题的。为什么不同人用同一单词或表达,我很快乐,表达的是相同内涵和强度的情绪和感受。 对大数据技术的盲目相信和依赖而做出政府决策产生的社会伤害是巨大的。2014年1月19日《华盛顿邮报》网站报道,2005年美国国土安全局依赖他们自己的大数据收集和分析的系统将一位来自马来西亚的斯坦福大学女博 士生列入禁飞恐怖主义监控名单。直到2014年,联邦法院才推翻了国土安全局的决定。美国著名的大学排行机构U.S News 用大数据和数学模型来对美国大学教育质量进行排行所引起的混乱和争议是另一很好的例证。

大数据的迅猛发展带了了人工智能研究的突飞猛进。大数据存储和运算技术的发展使得计算机开始出现智能的迹象。最近脸书的科学家不得不强行关闭了两个用来研究沟通的计算机,因为两台计算机之间的交流发展出了人类无法理解的语言。Google 最新的人工智能技术Alpha Go zero 击败了他的前身 Alpha Go. Alpha Go zero 和Alpha Go 不同,它不再需要人类的棋谱,只要告诉它规则,它自己跟自己下棋,演化应对策略。

这样的人工智能的发展是非常可怕的。这样的发展未来会危险人类的存在。 在新技术领域取得巨大商业成功的美国特斯拉CEO  Elon Musk 一再 警告世人一定要对人工智能技术的发展保持警惕,政府一定要对人工智能的发展进行规制,人工智能像核武器一般对人类存在产生致命威胁 。

大数据技术对伦理(隐私和社会正义)的威胁

由于大数据和大数据技术蕴含巨大的商业经济利益,在数据科学和数据科学管理思维的推动下,大数据时代企业和政府掌握了大量的个人信息,对个人隐私权保护产生了巨大的威胁。大数据时代颠覆了传统的隐私观和对隐私的定义和试图保护个人隐私的现有的法律和政府规章制度。在90年代互联网时代,人们曾认为互联网的一大特点是隐秘性。

互联网上谁也不知道你是一只狗的说法体现的就是当时人们对互联网隐密性的看法。然而随着互联网,电子商务,个人移动终端和社交媒体的发展,例如消费记录,个人行动轨迹和个人偏好等非传统隐私信息被创造出来。应对这一挑战,互联网时代的政府试图使用采用告知许可、信息的模糊化和匿名化来管制信息获取方和使用方对隐私的影响。

但是在大数据时代,由于大数据的信息整合能力和对信息二次使用的能力,传统的隐私管理手段形同虚设。即使信息的使用是被用户在一定范围内授权的,即使单一信息是模糊的和匿名化的,大数据发掘技术仍然可以将大量的数据联系起来,以惊人的概率指向具体个体。

隐私信息之所以需要保护,是因为隐私信息可能带来巨大的伤害。隐私权的泄露带来的伤害在社会群体之间分配是不均衡的,因而是巨大的社会不公。大数据时代创造了新的数据鸿沟,大数据对社会弱势群体产生了前所未有的威胁和伤害。

尽管采用大数据进行市场营销,对消费者而言可以以较低的搜寻成本买到自己合意的商品,然而消费者更有可能成为猎捕式营销的猎物,这其中最大的受害者是社会弱势群体。 在美国大量无良商业机构运用这些数据界定和分辨低收入和低教育程度人群,利用他们的信息不对称,无助,脆弱和急于摆脱现状的心理,对他们进行诈骗。

更让人气愤的是美国的数据分析师们运用贝叶斯后验概率的数学模型用各种形式的市场营销手段和骗术对弱势群体进行轰炸,从中通过机器学习,不断寻找最有效的诈骗手段,在这样的技术手段下被定位的潜在受害者几乎无处可逃。美国存在大量臭名昭著的线上垃圾私立大学利用大数据猎捕式营销的手段定位新移民,非法移民,伤残退伍军人,低技能失业者,教育程度低犯罪率高的社区居民等获取了巨大的商业利润。现行法律对这样的商业行为几乎无能为力。

大数据模型已预测为主要目的,数据模型的建构依赖于过往的历史数据和建构者的主观偏好。效率等这样的可被定量化的价值很容易被整合进模型,而社会公平和正义这样变量很难被量化。

这样以效率为导向的大数据建模将大量历史、社会和个人心理偏差和不公带进了数据模型。当数据模型变得越来越复杂,体系越来越庞大。这些社会不公和个人偏见就隐而不见,很难感知,大数据分析披上了公正、科学、客观的羊皮,进而对人类社会公正产生巨大威胁。

美国一家名为PredPol 的大数据公司向美国各地方警察局销售一款大数据预测犯罪软件。这款软件系统地对各地历史犯罪记录进行分析和计算。这样的软件系统已在美国各地警局被广泛采用。越来越多的美国法院也开始使用大数据预测罪犯再次犯罪的概率来辅佐他们审理案件甚至量刑。

这些依赖人工智能和大数据来进行预测犯罪和审理案件的大数据分析软件,背后的数学模型体现着历史、社会的不公和数据分析者的偏见。即使数据分析者没有偏见,大数据建立起来的关联而进行的对犯罪的预测和处罚是没有因果关系基础的。一个出生在黑人聚集的社区,家庭破裂,拥有多名犯罪分子亲属的黑人少年因此被预测具有高犯罪或再次犯罪的可能性,并进而被认为高度危险和被警察监控是对无罪推论的法律争议的挑战也是对不公正的社会经济制度对弱势群体系统性歧视的漠视。

大数据分析的结果使得出生在犯罪高发,经济凋敝的社区里的无辜社会弱势群体受到到警察的严密监视、不公平的对待和社会歧视,而一个出生和生活在在中产、治安良好社区里的非少数族裔罪犯则被警察忽略和放纵。近来美国拉斯维加斯惨绝人寰的大屠杀就是一个鲜血淋漓的教训。

大数据技术对民主的威胁

如果说权力在原始时代,来自武力,在封建时代,来自对土地的占有,在工业化时代来自对金钱的占有,在信息时代来自知识,在大数据时代权力则来源于对数据的占有。大数据时代的大数据已经是“新类型的资产” 和“新原油”。

从马克思主义的政治经济学的角度看,新的资本的诞生,产生了新的资产阶级,产生了新的剥削与被剥削的生产关系,产生了由数据科学家组成的数据精英和数据资本家组成的新统治阶级,新的统治阶级在大数据的加持下将对民主的破坏和对大众的剥削推向了新的历史高度 。

对于数据精英组成的技术官僚来说,大数据和智慧城市是最有效、最科学、成本最低的治理手段。在大数据技术的辅佐下,传统的民主参与和反馈机制都是多余和落后的。

人的心理态度,感知和需求是不可靠的,是自欺欺人的,只有大数据技术才能准确识别和界定人的真实需求,进行科学、公平和有效率的城市治理。在这样的情况下,数据精英和数据资本家甚至宣称我们不需要市场,有数据精英主导的计划经济是可行的 。

世界上最大的社交平台脸书(Facebook)2008年的广告收入是3亿美金,到了2012年即达到了惊人的42亿美金。其利润的来源是其近10亿的用户。Laney  (2012)称脸书的近10亿用户是有史以来最大的免费劳动力,因为脸书对用户创造的内容进行了使用,而没有任何补偿 。

脸书为代表的数据资本家和其后的数据精英利用其对数据占有的垄断地位,开始对公众的心理进行操纵和影响民主政治。2014年美国媒体揭露了脸书秘密进行的心理实验,细思极恐的是事实上这样的消息还是脸书自己披露出来的。脸书将自己的用户根据人口学属性随机分组,然后向他们推送正面的积极的信息或者负面消极的信息,来观察长期接触不同信息的用户的情绪的变化。

由于用户在使用脸书服务时,都选择了数据使用条款,政府对这样的数据使用行为几乎束手无策。脸书自2010年以来就开始鼓励用户参与投票,影响政治和政策的进程。美国总统特朗普的当选和最近的俄罗斯门都与脸书发挥的作用有一定关系。饶有兴味的是,在2017年九月份泰晤士报高等教育副刊对50位诺贝尔奖得主的调查中,甚至有诺贝尔奖得主认为脸书(facebook)是人类面临的最大挑战。

近年来在美国劳工界出现了一个新名词“clopening” 。这个新词是由close 关和open 开 这两个名词组成的。 这个字的意思是指同一个员工工作到凌晨关门,然后几个小时之后,又不得不返回开门营业。尽管对于公司而言,这样的工作计划衔接天衣无缝,极大降低劳动成本。但是这样疯狂的工作时间是对员工休息权的践踏。

这样的现象在美国大量为星巴克、麦当劳、沃尔玛等企业工作,挣着最低工资的工人中越来越普遍。大数据技术使得雇主在安排劳动时间上越来越有效率。 大数据算法可以精确的计算和预测什么时间需要多少工人,以及工作多长时间。

工人的工作强度被提升到了极限,传统工作计划中的工作间断清闲带来的休闲时间被剥夺,工人一刻没有喘息。 这样的工作计划技术使得低收入工人没有时间组织和安排他们自己的生活和学习,焦虑感加深,随眠被剥夺。更糟糕的是,由于大数据算法的高效率,公司可以有效限制工人的总工作时长,使他们少于法定需要支付公司医疗保险的工作时长,以规避应有的公司责任 。资本主义对效率和利益的无止境的不知羞耻的追逐,通过数学建模和大数据技术的使用将对工人的剥削上升到了前所未有的高度。

美国著名左派作家 Hill在其著作 《原始交易:优步经济,跑路资本主义是如何压榨美国工人的》 中对基于大数据的共享经济进行了尖锐的批评。共享经济在资本和风险投资资本家的疯狂追逐下早就偏离了其原先的轨道,共享经济表面上为公众提供了便利和低廉的服务, 其实非常昂贵。

资本以难以置信的速度流向共享经济垄断资本家,所谓的共享,实质上是垄断资本家的独享。这样的共享模式改变了传统劳工和资本家的关系。工人不再长期受雇与单一企业。 由于法律制度的缺位、缺乏政府监管和工会等劳工组织的保障,雇主没有义务或雇主更容易规避为工人提供应有的社会保障和医疗保险。这样的共享经济比以前资本积累的任何阶段都来得更加赤裸,更加直接,更加迅速。在资本的驱逐下,共享经济打着高科技和大数据的名号,以公众秩序和利益为代价,引发恶性竞争,扰乱市场秩序和竞争,刺激不必要需求,对自然资源和环境带了极大的破坏。

结论 

大数据技术是人类科技发展的巨大进步。以之为基础的包括人工智能和智慧城市在内的技术和应用,在人类改造自然和社会,为自己创造更美好生活上发挥了巨大的作用。

然而技术是中性的,使用和发展技术的过程却不是中性的,大数据技术的应用是历史、政治经济结构,政治社会制度及参与者互动博弈的过程。 大数据技术的发展和应用极为迅猛,对现存的政治、法律、经济制度都是巨大挑战。大数据技术支持者描绘的人类美好未来,是技术的乌托邦。

大数据技术本身不可调和的矛盾,决定了大数据技术本身同时是人性,社会伦理、正义和民主的巨大威胁。理解和深刻把握大数据发展的困境和挑战,对于发展国家中国家极为重要。发展中国家的政府要对大数据及其相关技术应用的社会影响有深刻的洞察力,明确政府在科技进步和发展的作用,明确科技进步到底是为了构建美好生活,还是满足资本驱动下的人性贪欲,以及科技进步对人性、人文和人的存在的威胁。

政府要对科技发展的伦理和资本市场进行严格的控制和监管。政府公共管理存在的价值并不是追求效率,政府应是社会正义,平等和民主的守护神。然而非常遗憾的是,科技发展是飞速的,资本是贪婪的,在资本驱动下的科技发展和应用是飞速和贪婪的,政府监管总是无力和滞后的。

马克思在《资本论》中深刻指出“资本来到人间,从头到脚,每个毛孔都流着鲜血和肮脏的东西” 。西方学者将希望寄托在企业“不作恶”, 强调企业的大数据伦理,无异于虎谋皮 。 除了政府的顶层设计和相应的法律制度建设以外,多元的社会民主,更开放的媒体和更多的人民群众的积极参与是制止数据精英和资本作恶的关键。从更长远的角度来看,可能回归中国古代传统智慧,回归老庄的无为,无欲,强调断、舍、离的天人合一的发展之道,才是遏制人性贪欲,科技野蛮发展和资本任性扩张的根本解决之道。

(作者:于文轩,助理教授,公共政策与全球事务系,新加坡南洋理工大学社会科学学院

wxyu@ntu.edu.sg)