民意调查结果还可信吗?
2024年10月25日星期五(2020年大选回顾。众所周知,在2020年美国大选期间,我做了不少选情分析,后来都被证明是准确的。我将陆续把当时录制的有关大选的视频整理出来,对分析本次大选也有参考价值。)
今天又有一批关于美国总统选举的民意调查公布,平均下来现在拜登比川普要领先10个点。这比在几天前只领先7个点高,证实了我以前的说法:川普总统被新冠病毒感染并没有赢得美国普通民众的同情心,反而对他的选情不利。
每次谈到民意调查,就总有一些人表示不相信,说民意调查如果可靠的话,那么现在的总统就是希拉里而不是川普了。
大家首先要了解一下民意调查的常识。全国总统民意调查是在美国全国抽查一、两千人问对这一次美国大选要选谁。有人说,美国有三亿人口,才问一、两千个人,怎么能够说明问题呢?如果学过概率与统计就知道,在统计学上有公式可以算出,要做这种民意调查,只要抽查1000人左右就足够了。抽查的人越多,误差会小一点,如果人数偏少,误差会大一点。如果要把误差控制在2~3%,抽查一、两千人就够了。关键的问题不在人数的多少,而是抽查必须是随机的,而且样本应该有代表性。
涉及到选举问题,代表性就很关键。这是因为不同的人群倾向性是不一样的,并不是均匀分布。不仅选民属于民主党还是共和党会有党派的倾向,性别、族裔、年龄、教育程度等也是影响投票倾向性的因素。所以在做完民意调查之后,还要根据这些人群在全国占的比例,也就是所谓的“权重”,做一定的校正。这就涉及到方法问题了:不同的调查机构用的抽查方法、校正方法不太一样,这样结果就会出现一定的偏差。
所以,单一的民意调查不一定可靠。但是,对于美国总统大选有很多机构都在做全国性民意调查,把他们的结果综合起来平均一下,偏差基本上可以抵消了。一般认为,各个调查机构在一定时期内平均的结果是比较可靠的。我们下面谈的民意调查的结果,如果不特定说明的话,指的就是各家机构的平均调查的结果。
那么,经常被提到的2016年美国总统大选的民意调查结果究竟是不是可靠?
很多人认为,如果民意调查的结果是可靠的,现在的总统就是希拉里了。很多人因此否定民意调查。的确,在2016年大部分的人、包括很多的专家都预测希拉里会赢。但是预测和民意调查结果不完全是一回事,虽然很多预测是根据民意调查结果做出来的。2016年全国性的民意调查的结果,最后是希拉里领先川普3个点(3%),投票的结果是希拉里赢了川普3个点(2%)。说明民意调查的结果实际上是非常准确的。
希拉里赢了2%,为什么反而是川普当总统?因为美国的选举制度非常特殊,并不是数全国的票数,如果那样就是希拉里当总统了;而是由所谓的“选举人团”来投票,选举人团的票数是按州来分的。所以决定美国总统选举的不是全国的,而是各个州的投票的情况,最主要的就是十个左右所谓的“战场州”。所以,除了看全国的民意调查的情况,还要看所谓的战场州的民意调查的情况。大多数的州或者选民主党,或者选共和党,是肯定的,战场州摇摆不定,谁当总统基本上是由它们决定的。
2016年州的民意调查的情况比全国的民意调查不准确。主要的原因是,做全国民意调查的机构非常多、非常的频繁,甚至一天就会做一次;但是州的民意调查做得很少。美国有50个州,再加上一个特区,即使只做十个州的民意调查,相当于比全国民意调查多了十倍的工作量,因为即使做州的民意调查,也要抽查1000人左右。所以做州的民意调查的机构就比较少,而且做得没那么频繁。这样的话就导致州的民意调查结果不像全国的结果那么准确。
还有一个原因。如果我们仔细看一下某个州的民意调查的结果,就会发现,其实民意调查的结果对希拉里的结果是非常准确的。比如说我们看一个很关键的战场州——威斯康星,2016年最后的民意调查的结果是希拉里有46.8%的支持率,比川普多出了7%,这个差距很大了。
但是,民意调查表明还有很多人表示要投给第三方候选人(当时有绿党、自由主义党在竞争),或者表示自己还没有确定,而实际上这些人大部分都想要投给川普,或者不好意思说,或者还没定下决心。到最后投票的时候,这些人纷纷去投川普了。最后川普反而赢了一点点,是47.2%。所以,不准的原因是低估了川普的支持率。
今年(2020年)的民意调查的结果跟2016年有什么不一样?为什么2016年的情况不太可能在今年重演?首先,拜登跟川普的差距要比希拉里领先川普大很多。现在拜登比川普高出了10个点,而上一届同一个时期希拉里只比川普高出了5个点。可见现在拜登的优势要比希拉里明显得多。
其次,拜登的支持率非常稳定,这一年来基本上没有什么波动,一直保持领先,只不过有时候领先多一点,有时候领先少一点。而希拉里的民意调查的结果是大起大落,有时候比川普领先很多,有时候领先很少、基本持平,偶尔还会落后于川普。
第三,拜登的支持率基本上达到了50%甚至更高了。也就是说,这一次大选向做民意调查的人说自己“还没确定”的人数非常少。而且这一次也不像上次那样,没有第三方来搅局。那么,由于拜登票数已经达到了50%甚至更高了,那些不确定的票数即使绝大部分都投给了川普,也不太可能超过拜登。
这说的是全国的民意调查情况。我刚才说了,还要看战场州的民意调查的情况。目前十来个战场州,拜登绝大部分也都是领先的,而且情况跟我刚才说类似,例如在威斯康星,拜登现在的支持率已经达到50%了,说还没确定的、想投给川普但不好意思说的那些人已经很少了。所以这个差距已经很明显了。
别看川普、川粉老说民意调查不可靠,但实际上他们也是相信民意调查的结果的。比如说,川粉喜欢传一些网络的投票,说网络投票的结果表明了川普大大地领先于拜登。其实那种网络的投票才是靠不住的,因为网络投票不像专业的民意调查那样是随机抽的,而是很有倾向性:在某一个网站做的网络投票,跟网站的读者群是什么样的很有关系,跟拉票、投票的热情也很有关系。甚至有一些网站的投票是可以反复投的:如果有一个人发了疯不停在那里刷票,当然就把某一个候选人的票给刷上去了。所以,网络投票看上去好像投的人很多,比民意调查抽查的人还要多,几万甚至十几万,但是它不是一种科学的民意调查,人数再多也不能说明任何问题。其实川普、川粉也知道这个道理,所以,专业的民意调查如果有哪一个做出的结果是川普领先了拜登,他们马上就转。
其中川普最喜欢转的,是一个叫做“拉斯姆森”的民意调查机构。拉斯姆森在上一届大选做出的民意调查结果跟别的民意调查的结果是相反的,是川普领先希拉里2%,于是就自称是“最准确的民意调查机构”。其实是最不准确的,投票结果实际上是希拉里赢了2%。但不管怎样,它认为预测对了川普会当选,所以就自认为是最准确的。它的方法可能有问题,因为它的各种各样的民意调查的结果都是偏向川普的。比如说,各个民意调查机构的调查结果,川普执政的赞赏率从来没有达到50%,都是40%左右;但是拉斯姆森偶尔会让川普的赞赏率达到50%,而一达到50%川普必转。这说明,川普其实是很看重专业的民意调查的,虽然是比较另类的民意调查机构。
拉斯姆森今天公布了它最新的民意调查的结果,拜登居然比川普领先了12个点,比平均还要高。那就是说,今年已经没有专业的民意调查会去做出对川普有利的结果了,所以连川普最信任的、最喜欢的民意调查机构做出来的结果也认为,拜登目前大幅度地领先川普。
既然现在民意调查的结果认为拜登大幅度领先,那么我们能不能说拜登就必胜无疑呢?不能这么说。民意调查查的是现在的情况,如果现在就投票的话,那么拜登是肯定会赢的,甚至能够领先川普大约10个点。但是可惜的是,投票不是在今天投的。虽然有一些地方已经开始陆陆续续地提前投票、邮寄投票了,但最终的、最主要的投票日期是在11月3日,还有20多天。这20多天什么情况都有可能发生,我们没法预测。像上一届,我们哪里会知道,在大选的前一周FBI局长科米会宣布重新调查希拉里的邮件门呢?那件事可能对上一次的大选发生了影响,导致希拉里的支持率下降。在接下来20多天里,我们不知道会发生什么事。更何况川普现在是总统,手上有很大的权力,他会采取各种各样的方法来让选举没法顺利进行,甚至会用作弊或者别的方法来干扰整个大选。所以,这20多天会不会发生什么事情是不知道的,还有可能发生变化。但如果就这么持续下去的话,按照整个趋势拜登赢的可能性相当高。
民意调查一个很重要的作用,就是在相当程度上预测了整个大选的趋势,可以说给出的是一种可能性。目前来说,拜登获胜的可能性相当高,可以说达到了90%或者更高。但是概率再高还是有可能发生意外,有可能发生小概率事件。你去赌博,人家给你算了概率,但是你反着来,非要押那个小概率的,那么是有可能反而赢的,这就是所谓的“爆冷门”。爆了冷门不能说人家的计算就是错的。
有没有可能再爆一次冷门呢?当然有可能,只不过这种可能性更低。川普获胜的可能性当然存在,只不过这种可能性要比上一届还要低。就是说,川普需要再创造一个更大的奇迹。
2020.10.8.录制
2024.9.1整理