2024年11月6日星期三

川普胜出美国大选,民调和结果为何有差异?

文/ELM

【一】

美东时间6日凌晨,美国总统大选开票接近尾声,虽然在本文写作的时点尚未得到最终结果,但共和党候选人、前总统唐纳德·川普(Donald Trump)以267张选举人票领先民主党候选人、副总统卡玛拉·哈里斯(Kamala Harris),距离当选所需的270张选举人票仅差临门一脚。考虑在未公布的各州的选情大概率也是川普领先,因此川普胜出美国大选,已经成为定局。


川普趁胜追击,已经于美东时间6日凌晨在佛罗里达州发表胜选演说。

【二】

这个结果在意料之中,对于民主党来说,总结经验教训估计是下一个阶段的主要议题之一。这其中,很大的一部分精力估计要放在大选之前的民意调查上。

刨除有明显倾向性的媒体的预测,其实很多的中性政治立场的媒体都预测是民主党候选人哈里斯小胜的结果。例如《经济学人》的《Kamala Harris moves ahead - just - in our final election forecast》:


这篇文章刊发于11月5日,已经是尽可能在截止日之前、用上了各种能用的数据进行推测。

著名的538网(https://projects.fivethirtyeight.com/)也是如此,这个以预测美国总统大选结果出名的网站,此前一直在持续跟踪各项数据,收集各种媒体信息或不同来源的证据,来进行模拟预测,在关闭前也是一直哈里斯领先的结果:


538网是一个中性网站,不存在政治倾向,此前的多次大选选情预测基本都被验证准确。有趣的是,上一次预测失败,也和川普有关,是8年前(2016年)川普vs希拉里的那一次。这是巧合,还是什么其他的原因?

【三】

选前民意调查和选后的结果相左,不出意外肯定会有嘲讽民调的声音:



但这个锅其实扣在民调头上也不太合适,因为民调只能尽可能地提供有关候选人支持率的信息,但不能完全替代选举结果,因为有太多的误差因素

第一,抽样偏差。这个其实很好理解,民调只是抽取人群总体中的样本进行问卷调查,以此推测整个选民群体的倾向。那么,抽样中的偏差就会在很大程度上干扰最终的结果。比如,,某些群体(如低收入、年轻人或少数族裔选民)在民调中可能被低估或高估。

第二,“害羞选民”。由于众所周知的政治正确等等原因,很多选民并不会公开表明自己的政治主张和倾向,可能在接受调查时选择隐瞒自己的真实想法,导致民调结果低估了他们的支持率。但是,这样的偏差影响巨大,因为它可能直接影响到候选人的宣传策略和选民动员。538网后来自己总结2016年的预测偏差,就把“害羞选民”作为预测失利的主要原因。

第三,选举人票制度。各个州选举人票制度的存在,意味着各州的投票人的每一票的实际价值并不相等。加州常住人口4000万(假定都是本地注册选民),选举人票54票,每一票代表70万人;而特区常住人口70万(假定都是本地注册选民),选举人票3票,每一票代表23万人。这个因素是需要在抽样中予以考虑的,但稍有不慎就会失真,出现2016年希拉里得到更多自然人投票、但更少选举人票的情况。

第四,选民动员。民调结果有可能反向影响选民投票。例如,虽然有观点认为民主党动员出来了更多的家庭妇女、少数族裔和青少年选民,但也有观点认为正因为如此,所以共和党的有资格选民反而更多地站出来积极投票,生怕川普落选;而民主党可能恰恰被“乐观的民调结果”所蒙蔽,而导致投票率降低。这个观点的依据就是2016年大选中就存在类似的情况。

第五,摇摆州。摇摆州是老生常谈的问题,关键摇摆州的微小差距可能导致选举人票的分配与普选票不一致,这种现象在2016年大选和2024年大选中都明显,川普在关键摇摆州获得了意想不到的胜利。

第六,统计数据解读。以上是常规问题,最后聊聊统计学的数据解读,上面538网的截图的最下面有一行小字说明,意思是这个统计图表的置信度是95%。换句话说:这个民调存在5%的出错可能,看起来很小,但考虑到民调结果,哈里斯支持率48%,川普支持率46.8%,这个极小的误差已经很容易被5%的系统误差所扭曲了。

所以,从这几个方面来看,更准确的说法是:大选之前的民调结果显示哈里斯领先,但领先差距在系统误差范围之内,因为不能代表最终结果。

至于民调方法要如何改进,要如何统计不同媒体不同渠道的意见表达,那就是另外一个话题了。

当然,以上判断是基于中性政治观点的分析,不包括民调中可能存在的故意歪曲或颠倒黑白。

【四】

川普胜出大选,将成为美国第47届总统。至于在政治、经济、外交、内政上会有什么影响,留待他文再叙。

最后附一张新闻图。川普此次胜选,此图功不可没,团队要给摄影师加个鸡腿:


没有评论:

发表评论