统计数据是如何失去权威的——为什么我们应该担心接下来会发生什么
5123字
2021-03-28 23:17
45阅读
火星译客

从理论上讲,统计数据应该有助于解决争论。它们应该提供稳固的参考点,让所有人——无论他们的政治立场是什么——都能达成一致。然而,近年来,人们对统计数据相信的分歧程度,已成为西方自由民主国家中出现的主要分裂之一。在11月份的总统大选之前不久,一项美国研究发现,68%的特朗普支持者不信任联邦政府公布的经济数据。在英国,由剑桥大学和市场调查和数据分析公司(YouGov)调查阴谋论研究项目发现,55%的人们认为政府“隐瞒了居住在这里的移民数量的真相”。

统计数据非但没有能化解争议和两极分化,反而好像实际上是在含糊争议和加剧两极分化。对统计数据的厌恶已成为平民论者右翼的标志之一,在2016年被选民表面拒绝的各类“专家”当中,统计学家和经济学家位居首位。许多人不仅认为统计数据不值得信任,而且认为这些数据似乎有些无礼或傲慢。将社会和经济问题简化为数字的总和和平均数似乎违反了一些人的政治正义感。

这一点在移民问题上表现得最为明显。智库“英国未来”研究了如何最好地为支持移民和多元文化主义赢得争论。它的主要发现之一是,人们通常对定性证据反应热烈,比如移民个体的故事和不同社区的照片。但统计数据——尤其是有关所谓移民给英国经济带来好处的数据——却引发了截然相反的反应。人们认为数字是操纵的,不喜欢诉诸定量证明高人一等的优越感。以官方估计数据给出有多少非法移民时,一种普遍的反应是嘲笑。“英国未来”发现,指出移民对GDP的积极影响非但不会增加人们对移民的支持,反而会让人们对移民更加敌视。GDP本身似乎成了精英自由主义议程的特洛伊木马。意识到这一点,政客们现在基本上已经放弃了用经济术语来讨论移民问题。

所有这些都对自由民主提出了严峻的挑战。坦率地说,英国政府——包括政府官员、专家、顾问和许多政界人士——确实认为移民总的来说对经济有利。英国政府确实认为脱欧是一个错误的选择。问题在于,政府现在正在进行自我审查,以免进一步激怒人们。

这是一个不受欢迎的两难境地。政府要么继续发表它认为有效的言论,并被怀疑论者指责为宣传,要么,政客和官员只能说一些看似可信、直观上真实的东西,但最终可能是不准确的。不管怎样,政治会陷入谎言和掩盖的指控中。

 

统计数据——以及分析这些数据的专家——权威不断下降,是这场被称为“后真相”政治的危机的核心。在这个不确定的新世界里,人们对定量分析专业技能的态度越来越分化。从某种观点看,以统计为基础的政治是精英主义的,不民主的,显然无视人们对社区和国家的情感投资。这只是伦敦、华盛顿或布鲁塞尔的特权人士将他们的世界观强加给其他人的又一种方式。从相反的视角看,统计学与精英主义完全相反。它们使记者、公民和政治家能够从整体上讨论社会问题,不是基于奇闻轶事、情绪或偏见,而是以切实可行的方式。除了数量的专业分析之外,民主不可能就成了民主,而是通俗小报编辑和煽动者释放提供他们自己的“真相”来了解整个社会正在发生的事情。

有办法摆脱这种两极分化吗?我们必须简单地在事实政治和情感政治之间做出选择,还是有别的方法来看待这种情况?一种方法是通过历史的镜头来看待统计数据。我们需要试着看清它们到底是什么:既不是不容置疑的事实,也不是精英的阴谋,而是旨在简化政府工作的工具,不管结果是好是坏。从历史上看,我们可以看到统计数据在我们理解民族国家及其发展过程中发挥了多么重要的作用。这就出现了一个令人震惊的问题:如果统计数据被抛在一边,我们如何(如果有的话)继续对社会和集体进步有共同的看法。

17世纪下半叶,在长期血腥冲突的余波中,欧洲统治者对政府的任务采取了一种全新的视角,关注人口趋势——现代统计学的诞生使这种方法成为可能。从古代起,人口普查就被用来追踪人口规模,但进行这些普查既昂贵又费力,而且只关注那些被认为具有政治重要性的公民(拥有财产的男人),而不是整个社会。统计数据提供了一些完全不同的东西,在这个过程中改变了政治的性质。

统计数据的目的是让人们了解整个人口,而不是简单地指出具有战略价值的权力和财富来源。在早期,这并不总是涉及生产数字。以德国为例(“统计学家”一词由此而来),在这个由数百个微小国家组成的帝国中,要绘制出不同的习俗、制度和法律的地图是一项挑战。这种统计知识的特点在于它的整体性:它旨在描绘整个国家的面貌。统计对人口的作用就像制图对领土的作用一样。

同样重要的是来自然科学学科的灵感。由于标准化的措施和数学技术,统计认知可以被客观地呈现出来,就像天文学一样。英国的人口学家先驱,比如威廉·佩蒂和约翰·格罗尔特,曾被奥利弗·克伦威尔和查尔斯二世雇用,采用数学手段来估计人口变化。

17世纪晚期出现的政府顾问声称自己拥有科学权威,而不是政治或军事敏锐,这代表了如今被平民主义者痛斥的“专家”文化的起源。这些开路先锋式的人既不是纯粹的学者,也不是政府官员,而是介于两者之间。他们是热情的业余爱好者,他们提供了一种新的方式来思考特权人口总数和客观事实。多亏了他们高超的数学本领,他们相信自己能够计算出需要大量人口普查才能发现的东西。

最初,这类专业技能只有一项委托,线索就在“统计”这个词中。只有中央集权的国家才有能力以一种标准化的方式收集大量人口的数据,而且也只有国家一开始就需要这些数据。18世纪下半叶,欧洲国家开始收集更多的统计数据,这些数据在我们今天看来很熟悉。各国着眼于本国人口,开始集中关注一系列数据:出生、死亡、洗礼、结婚、收成、进口、出口、价格波动。以前在地方和教区一级登记的东西现在集中到全国一级。

新的技术被开发出来来表现这些指标,利用了页面的垂直和水平维度,用矩阵和表格来排列数据,就像商人在15世纪晚期发展标准化簿记技术所做的那样。将数字排列成行和列提供了一种显示特定社会属性的强大的新方式。现在,大而复杂的问题可以通过扫描以几何形式排列在单页上的数据来进行调查。

这些创新为政府带来了非同寻常的潜在能力,通过将多样的人口简化为具体的指标,并将其显示在适当的表格中,政府可以围绕需要获得更广泛详细的地方情况和深刻见解历史。当然,从不同的角度来看,正是由于这种对当地文化多样性的忽视,使得统计数据变得粗鲁,甚至具有潜在的攻击性。不管一个国家是否有任何共同的文化特征,统计学家都会假定某种标准的统一性,或者有些人可能认为,强加这种统一性。

不是特定人群的每一个方面统计数据都能反映出来。什么被包括和什么被排除总是有一个隐含的选择,而这个选择本身就可能成为一个政治问题。GDP只包含有偿工作的价值,因此排除了传统上由妇女从事的家务劳动,这一事实使其自20世纪60年代以来成为女权主义批评的目标。在法国,自1978年以来,收集关于种族渊源的人口普查数据是非法的,因为这些数据可以用于种族主义政治目的。(这有一个副作用,那就是让劳动力市场上系统性的种族主义更加难以量化。)

尽管有这些批评,但要以客观的方式完整地描绘一个社会的愿望就意味着各种进步的理想都附在了统计数字之上。统计学被认为是一门冷静的社会科学,这只是故事的一部分。另一部分是关于强大的政治理想如何被投入到这些技巧当中的:"基于证据的政策"、理性、进步和建立在事实基础上的民族的理想,而不是浪漫化的故事。

自18世纪末启蒙运动达到高潮以来,自由派和共和党都对“国家能够构建一种围绕社会和经济生活明显改善而组织的更加理性的政治”寄予厚望。伟大的民族主义理论家本尼迪克特·安德森曾有一段著名的言论,它将国家描述为“想像共同体”。不过,统计学家提出了将这种想象附着在某种现实存在的事物之上的可能性。同样,他们承诺揭示这个国家的历史道路:正在发生怎样的进步?进步速度如何?启蒙运动时期的自由主义者认为,各国都在朝着一个单一的历史方向前进,对于他们来说,这个问题至关重要。

在后革命时代的法国,用统计数据来揭示国家状况的潜力被攫取了,雅各宾国家着手实施一套全新的国家测量和国家数据收集框架。世界上第一个官方统计局于1800年在巴黎成立。数据收集的一致性由受过高等教育的专家组成的中央干部监督,是中央统治的共和国理想的一个组成部分,寻求建立一个统一、平等的社会。

从启蒙运动开始,统计数据在公共领域扮演着越来越重要的角色:为媒体上的辩论提供信息,为社会运动提供他们可以使用的证据。随着时间的推移,这类数据的制作和分析不再由国家主导。学术社会科学家开始为自己的目的分析数据,通常与政府的政策目标毫无瓜葛。到了19世纪末,为了了解城市的贫困状况,伦敦的查尔斯·布斯和费城的韦布·杜·波依斯等改革者开始自己进行调查。

想要认识统计数据是如何与国家进步的概念纠缠在一起的,不妨以GDP为例。GDP用一个数字表示,是对一个国家的消费支出、政府支出、投资和贸易平衡(出口减去进口)总和的估计。计算这个数字是极其困难的。在20世纪30年代,为之所付出的努力就像许多数学技术一样,只是一种边缘的、有点书呆子气的兴趣。直到第二次世界大战时,各国政府需要知道全国人口是否有足够的生产能力来维持战争,这个问题才被提升为国家政治上的紧急事项。在接下来的几十n里,这个单一的指标尽管从来没有遭到过批评,却获得了神圣的政治地位,成为了评判政府能力的终极晴雨表。GDP是上升还是下降,实际上已经成为社会前进还是后退的一个指标。

再以民意调查为例,民意调查是私营部门统计创新的早期例子。20世纪20年代间,统计学家发明了一些方法:在调查对象中确定一个具有代表性的样本,以此来收集公众的整体态度。这一突破最初被市场研究人员使用,之后不久民意调查由此衍生,这一行业也随即成为公众和政界关注的对象,因为这一新兴科学向我们展示了“女性”、“美国人”或者“体力劳动者”对世界的看法,而媒体对此进行了报道。

如今,民意调查的缺陷愈加显露,一定程度上是因为人们从一开始便对投票寄予了厚望。只有在我们相信大众民主的程度上,我们才会对公众的想法如此着迷或关心。但在很大程度上,我们能够了解公众对具体问题的看法要归功于统计数据而不是民主制度本身。我们低估了大众的“公共利益”感来源于专家的计算而不是民主制度的程度。

随着健康指标、繁荣指标、平等指标、意见指标和生活质量指标使我们逐渐意识到我们是谁、情况是在变好还是在变坏,政治家们也变得严重依赖统计数据来巩固自己的权威。通常情况下他们太过依赖、夸大证据,对数据的解释过于松散,以致于无法为自己的事业服务。但这是公共生活中数字泛滥的一个不可避免的危险,并不一定会引发我们最近看到的那种对专业知识的全盘否定。

当代平民主义者对“专家”的攻击和对民选代表的攻击在很多方面源自同样的怨恨。人们认为,在将社会作为一个整体来谈论时、在寻求将经济作为一个整体来治理时,政治家和技术官僚都“迷失”了自己作为一个特定公民的感觉。用无政府主义政治思想家詹姆斯·C·斯科特的话来说,统计学家和政治家都掉进了“看起来像一个国家”的陷阱。科学地谈论国家——例如从宏观经济学的角度——是对那些更愿意依靠记忆和叙述来获得民族认同感的人的侮辱,他们厌倦了别人告诉他们“想象中的社区”并不存在。

另一方面,统计数据(以及民选代表)在几十年甚至几百年的时间里在支持可信的公众话语方面发挥了足够的作用。那么它改变了什么?

统计危机并不像看上去那么突然。在大约450年的时间里,统计学家的伟大成就在于将国家人口的复杂性和流动性降低为易于管理、易于理解的事实和数据。然而,近几十年来,由于20世纪60年代出现的文化政治以及此后不久开始的全球经济重塑,世界发生了巨大变化,目前还不清楚统计学家们是否一直与这些变化保持同步。传统的统计分类和定义形式正受到越来越不稳定的身份、态度和经济路径的压力。用简单、公认的指标来代表人口、社会和经济变化的做法正在失去其合法性。

想一想过去40年里民族国家的政治和经济地理的变化。在政治辩论中占主导地位的统计数据在很大程度上是全国性的:贫困水平、失业率、GDP、净移民。但资本主义的地理位置却在向不同的方向发展,显然,全球化并没有让地理位置变得无关紧要,很多情况下它反而加大了位置在经济活动中的重要性,加剧了成功地区(如伦敦或旧金山)和欠成功地区(如英格兰东北部或美国“锈带”地区)之间的不平等。其中所涉及的主要地理单位也不再是民族国家,而是那些兴衰起伏的城市、地区或者单个城市社区。

启蒙运动理想中的国家是一个由共同度量框架连接在一起的单一社区,而这种理想越来越难以维持。威尔士山谷里的城镇曾经依靠钢铁制造业和采矿业供人们谋生,如果你住在那里的一个城镇上,谈论“经济”如何“表现良好”的政治家可能会招致更多不满。从这一点来看,“GDP”一词并不能准确反映任何有意义或可信的东西。

当宏观经济学被用来进行政治辩论时,说明这个国家某一地区的损失和其它地方的收益中和了。花里胡哨的国家指标(比如GDP和通胀)掩盖了各国政客不常讨论的局部收益和损失。移民从整体上来说可能有益,但并不是说不需要付出丝毫代价。当政客们用国家指标来证明自己的论点时,他们含蓄地假定选民都是爱国的,都有某种相互奉献的精神:这次可能是受损方,下次可能就是受益方。但是,如果形势从未逆转呢?如果每次都是同一个城市或地区获胜、其它城市或地区失败呢?给予和索取应当遵循什么样的原则才合乎情理呢?

在欧洲,货币同盟加剧了这一问题。例如,对欧洲中央银行(ECB)来说,那些代表5亿人口的指标才是重要的指标。欧洲央行关心的是整个欧元区的通胀或失业率,就好像它是一个单一区域。与此同时,欧洲公民的经济命运正因他们恰好住在哪个地区、城市或者社区而分裂成不同的方向。官方认知从生活经验中变得越来越抽象,直到这种认知不再相关或可信。 

 

把国家作为自然而然的分析尺度而给予其特权是统计的内在偏见之一,这种偏见多年的经济变化已经变化了。另一种承受越来越大压力的内在偏见是“分类”。统计学家的部分工作是将人们分类,将他们放入统计学家创建的一系列框中:就业或失业、已婚或未婚、亲欧或反欧。只要人们可以用这种方式进行分类,就有可能分辨出某一特定分类在人群中的延伸程度。 

这可能涉及到一些简化的选择。例如,一个人要被算作失业的话,即便实际情况可能要复杂得多,那么他也必须出具一份不是自愿失业的报告。有很多人总是在就业、失业,原因可能和劳动力市场状况有关,也可能和健康、家庭需求有关。但是,多亏了这种简化才有可能确定整个人口的失业率。

但有一个问题。如果我们这个时代的许多定义性问题不是根据所涉及的人的范围来回答,而是根据人们受到影响的程度来回答,那么怎么办?失业就是一个例子。英国在没有失业率大幅上升的情况下度过了2008-13年的大衰退,人们普遍认为这是一项积极的成就。但对“失业”的关注掩盖了不充分就业的上升,意思就是人们没有得到足够量的工作或者说在低于他们所能胜任的工作水平上工作。这部分人目前约占“就业”劳动力的6%。此外,个体经营的劳动力数量也在增加,在这种情况下,“就业”和“非自愿失业”之间的差别几乎没有意义。

这并不是对英国国家统计局(ONS)等机构的批评,虽然它目前确实提供了就业不足的数据。但只要政客们继续用失业率来转移批评,那些努力获得足够工作或靠工资生活的人的经历就不会出现在公开辩论中。考虑到政客们对劳动力市场的说法与现实之间的不匹配,如果这些人对政策专家和政治辩论中统计数据的使用产生怀疑就不足为奇了。

20世纪60年代之后身份政治的兴起给这种分类体系带来了额外的压力。只有当人们接受了提供的由专家而不是被调查者选择的有限的人口统计类别时,统计数据才可信。但当身份成为一个政治问题时,人们就会要求用自己的方式来定义自己,比如性别、性取向、种族或阶级。

民意调查也可能因为类似的原因而受到影响。民意调查一般根据人们会做出相应行为的合理假设来捕捉人们的态度和偏好。但在政治参与度下降的时代,仅仅知道某人更愿意在哪个盒子里放“X”是不够的,还需知道他们是否有足够强烈的意愿去这样做。当要捕捉情绪强度的波动时,民意测验是一种笨拙的工具。

统计数据在其漫长的历史中经常受到批评,身份政治和全球化给其带来的挑战也已司空见惯。那么,为什么我们会觉得过去一年里发生的事件对定量专家的理想及其在政治辩论中的作用有如此大的破坏性呢?

近年来出现了一种量化和可视化人口的新方法,这种方法有可能将数据推向边缘,从而开创一个完全不同的时代。由于大规模数字化,由技术专家收集和汇编的统计数据正在让位于默认情况下积累的数据。一般情况下,统计学家已经知道他们想针对哪些人口问哪些问题,然后着手回答这些问题。相比之下,每当我们刷会员卡、在脸书上发表评论或者在谷歌上搜索某个东西时,数据就会自动生成。随着我们的城市、汽车、住宅和家用物品的数字化连接,我们留下的数据量将会越来越大。在这个新的世界,首先是获取数据,其次才是研究问题。 

 

长期来看,其影响可能会像17世纪后期统计技术的发明一样深远。“大数据”的兴起为定量分析提供了比任何数量的投票或统计建模都大得多的机会。但不只是数据的数量不同,它代表了一种完全不同的知识类型,伴随着一种新的专业技能模式。 

首先,它没有固定的分析尺度(比如国家),也没有固定的分类(比如“失业”)。这些庞大的新的数据集可以被挖掘出来以寻找模式、趋势、相关性和突现的情绪。它成为一种追踪人们赋予自己身份的方式(比如“我支持科尔宾”或者“企业家”),而不是将分类强加给他们。这是一种适用于流动性更大的政治时代的集合形式,在这个时代,并不是每件事情都可以可靠地追溯到某种启蒙运动的理想来作为公共利益的守护者。

其次,我们大多数人完全没有注意到这些数据对我们个人或集体的影响。目前还没有一个类似于国家统计局的机构来处理商业上收集的大数据。在我们所生活的时代,人们可以以前所未有的速度和敏感性追踪和分析我们的情感、身份和从属关系——但没有什么能将这种新能力锚定在公众利益或公众辩论上。谷歌和脸书也有数据分析师,但他们不是产生统计数据以及现在饱受谴责的的那种“专家”。新分析师的匿名性和保密性可能使他们在政治上比任何社会科学家都强大得多。

像脸书这样的公司有能力以极低的成本为数亿人提供定量的社会科学,但它将结果公开的动机少之又少。2014年,脸书的研究人员公布了他们对用户进行的一项“情绪传染”研究的结果——其中他们改变消息提供方来观察它如何影响用户之后分享的内容——人们表示强烈不满,称自己在不知不觉当中成了小白鼠。所以,从脸书的角度来讲,为什么要自找麻烦将结果公布出来呢?本本分分地做研究不好吗?

这种从统计逻辑向数据逻辑的转变最具政治意义的地方在于:它和平民主义的崛起相去甚远。平民主义领导人可以对经济学家和民意调查专家等传统专家嗤之以鼻,却完全相信另一种形式的数字分析。这些政客依赖于一个新的、不那么引人注目的精英阶层,他们从庞大的数据库中寻找规律,但很少发表公开声明,更不用说发布什么证据了。这些数据分析师通常是物理学家或数学家,他们的技能根本不适合用来研究社会。例如,下面是迈克尔·戈夫的前顾问、“脱欧”运动负责人多米尼克·卡明斯所宣扬的世界观,他认为:物理、数学和计算机科学领域有真正的专家,宏观经济预测领域则没有。”

和唐纳德·特朗普关系密切的人物,比如他的首席策略师史蒂夫·班农和硅谷亿万富翁彼得·蒂尔,都通过班农担任董事会成员的剑桥分析公司等公司来熟知尖端的数据分析技术。在总统竞选期间,剑桥分析公司利用各种数据来源开发了数百万美国人的心理档案,然后利用这些资料帮助特朗普针对选民定制信息。

这种在大量人群中发展和完善心理学洞察力的能力是新数据分析最具创新性和争议性的特征之一。“情绪分析”技术通过追踪社交媒体上的用词等指标来探测大量人群的情绪,随着“情绪分析”技术被纳入政治竞选,像特朗普这样的人物的情感诱惑将会受到科学的审视。在一个公众的政治情绪变得如此可追踪的世界里,谁还需要民意测验专家呢?

由这类数据分析得出的社会发现最后很少能够进入公共领域,这说明它对巩固共享现实中的政治叙事的作用少之又少。随着统计数据的权威逐渐衰落,没有什么东西能够进入公共领域取代它,人们可以生活在任何他们觉得与自己最一致以及最愿意相信的想象中的社区。统计数据可以用来纠正有关经济、社会或人口的错误说法,但在数据分析时代,几乎没有什么机制可以阻止人们屈服于本能反应或情感偏见。相反,剑桥分析公司等公司将这些情绪视为需要追踪的东西。

即使有这么一个数据分析办公室,它能够像英国国家统计局那样代表公众和政府行事,但它是否会秉持当今自由主义者竭力捍卫的那种中立观点尚不可知。这种新的数字处理设备非常适合探测趋势、感知情绪以及在事物发酵时发现它们。它能够很好地服务于竞选经理和营销人员,但它不太适合对社会做出明确、客观、可能形成共识的主张,而统计学家和经济学家是为此付费的。

在这种新的技术和新的政治氛围下,在纷繁复杂的数据流中识别事实、预测和真相的任务将落在新的数字精英们身上。国内生产总值和失业率等指标是否依旧具有政治影响力还有待观察,但如果没有,这未必预示着专家的末日,更不用说真相的末日了。既然数字不断在我们背后和我们不了解的情况下产生,我们就应该更认真地对待这个问题,这就是统计危机留给代议制民主的地方。

一方面,值得承认的是,长期存在的政治机构有能力予以反击。正如优步和爱彼迎等“共享经济”平台最近受到法律裁决的阻挠(优步被迫承认司机是雇员,爱彼迎被一些市政当局完全禁止),隐私和人权法律是数据分析扩展的潜在障碍。数据分析的好处如何以许多统计数据集的方式提供给公众,这一点我们不太清楚。由蒂姆·伯纳斯-李联合创立的“开放数据研究所”等机构致力于让数据公开,但这对如今积累了很多数据的企业并没有什么影响力。统计一开始是国家用来观察社会的工具,但逐渐发展成了和学者、公民改革者和企业都利害攸关的东西。但对于许多数据分析公司来说,对数据方法和来源保密是一种竞争优势,它们不会自愿放弃这种优势。

后统计社会是一个可怕的潜在命题,不是因为它会完全缺乏任何形式的真相或专业知识,而是因为这会将它们彻底私有化。统计学是自由主义、甚至是启蒙运动的众多支柱之一。制作和使用它们的专家们被描绘成傲慢自大、无视政治情感和地方层面之人。毫无疑问,有很多方法可以使数据收集更好地反映生活经验。但长期而言,需要进行的斗争不是精英主导的事实政治与平民主义政治之间的斗争,而是那些仍致力于公共知识和公共辩论的人和那些正在瓦解这些东西的人之间的斗争。 

 

0 条评论
评论不能为空