方舟子的Blog

总统辩论谁赢了？

3 10 2016年

今年是美国大选年，将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候选人要举行三场辩论。今年的第一场辩论在9月26日举行之后，几乎所有美国媒体请的裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。但是辩论的胜负判断本来就是很主观的，即使媒体一致认为希拉里获胜也不会让川粉（川普的狂热支持者）接受，因为他们本来就认为美国主流媒体基本上都是自由派，都是支持希拉里的。举行辩论的主要目的是要影响选民，那么，我们可以给胜负定一个客观标准，那就是认为哪一方获胜的选民人数比较多，这一方就获胜了。第一场辩论刚刚结束，CNN就立即报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果，62%认为希拉里赢，27%认为川普赢，据此可以说希拉里大获全胜。

但是网上有很多对这次辩论结果的投票，有的票数几十万、几百万，都是一面倒地认为川普赢。川普就因此宣布自己赢了，说除了“没人看的CNN”，所有的“民意调查结果”都是他赢得了辩论，并嘲笑说CNN只对300人（其实是500多人）的调查怎么能算数呢。川粉也坚信网上投票结果，跟着川普嘲笑CNN的民意调查人数太少，甚至有一家一直力挺川普的微信公众号还抱怨人们想去CNN网站投票找不到门，大骂CNN。

其实那种网民自己去投的网上投票的结果才是完全不可信的，即使有几百万、几千万票数，也不可信。首先是网上投票很容易作弊，一个人可以反复地投，也就是刷票。有的网站为了避免刷票，限定一个IP只能投一次票，但是通过代理服务器是可以随便换IP的，这种限制难不倒懂点网络技术的人，何况还有现成的刷票软件可以自动换IP刷票，想刷多少票都可以。有一个关于支持谁当总统的网络投票有高达一千七百万次投票，95%是支持川普，谁会傻到去相信这样的投票结果没有作弊？即使投票的网民都很诚实，不作弊，网上投票结果也不可靠。支持者会到处拉票，比的是哪方支持者更狂热更爱拉票。川普支持者往往比希拉里支持者狂热、偏执，川普支持者就被发现在某些论坛拉票，列出了各个投票网站的链接号召川普支持者去投票。再退一步说，即使某个网站的网络投票没人作弊也没人拉票，其投票结果也只是反映该网站读者的意见，而不能反映全体选民的民意，因为一个网站的读者往往是有倾向性的，例如美国有一个著名的极右网站Breitbart是一直支持川普的（其主编是川普竞选团队的CEO），该网站的读者就基本上是支持川普的，投票的结果当然是大部分人（约75%）认为川普获胜，其实我们应该惊讶的是其读者中居然还有25%认为希拉里获胜。

所以网上投票说难听点是垃圾，说好听点是好玩，不能当真。想要知道民意，就要做民意调查。民意调查要由组织者通过打电话、发邮件等方式主动找人询问（以打电话为主，但是现在很多人都不接陌生电话了，所以也有网上调查，但是是通过发邮件邀请的方式，不是网民自己找上门），这样就可避免调查对象重复投票、拉票、倾向性等问题。如果要调查的人群很小，挨个挨个去问就可以了。例如对“你认为总统辩论谁赢了”这问题，你想统计一个班的学生的看法，让每个学生依次回答就可以了。但是如果你想了解全校学生的看法，假定一个学校有三万名学生，一个个去问显然是不现实的，即使能做到，工作量也太大了。在这种情况下就可以采取随机抽样的方式，只找一部分人做调查。如果找的人数太少，没有代表性，结果容易出现偏差；但是如果找的人数太多，则是浪费。那么找多少人合适呢？或者说，需要多大的样本呢？

样本的大小和几个因素有关。一个因素是置信度，它表示的是你对调查结果的信心。因为不是对所有的人做调查，置信度不可能是百分之百，但是如果调查了足够多的人数，你就会对调查结果的可靠性很有信心。一般取置信度95%，意思是有95%的几率是这个结果。另一个因素是抽样误差，据此可以知道调查结果的正负变化范围（所谓置信区间）。可接受的误差越大，需要的样本就越小，反之，可接受的误差越小，需要的样本就越大。民意调查可接受的误差通常是2%～5%。“你认为总统辩论谁赢了”是个比率问题（支持希拉里和支持川普之比），在调查前我们是不知道比率的，这时候可以设置为50%，因为在比率为50%时需要的样本最大。知道了人群总数（总体）、置信度、误差和比率这些参数之后，统计学上就有公式可以计算需要的样本大小。网上有现成的民意调查计算器（例如http://www.surveysystem.com/sscalc.htm )，把这些参数输进去，就可以算出样本大小。假定总体有3万人，置信度95%，误差5%，算得样本大小为379。也就是说，你要知道3万名学生对“你认为总统辩论谁赢了”这个问题的看法，随机抽样379人做调查就够了，调查结果有95%的可能是成立的，有5%的误差——假如调查结果是50%的人认为希拉里赢，意思是如果重复调查20次，有19次的结果是45%～55%的人认为希拉里赢。

如果我们想要知道一个30万人的城市对这个问题的民意呢？其他参数不变，把总体改成30万，算得的样本大小是384，只需要多调查5个人。如果要调查的是全美国人口呢？美国人口大约是3亿人，算得的样本大小还是384。在总体足够大以后（几万人以上），需要的样本大小基本不变了，调查全国和调查一个城市需要的样本大小其实是一样的，这虽然违反直觉，但是事实就是如此。

所以，要对全美国做民意调查，随机抽查300人也是可以的，川普、川粉的嘲笑只不过暴露了他们对统计学的无知。不过，抽查300人的误差有些大，全国性民意调查的误差一般控制在3%左右，因此需要的样本大小通常是1000人左右。CNN/ORC调查了521人，误差是4.5%，误差稍大，但是因为调查的结果比率悬殊（62%:27%），这个误差并不会改变希拉里大胜的结论。CNN/ORC调查采用的是简单随机抽样的方式，这样抽得的随机样本不一定能很好地符合人群分布特征，例如其中认同民主党的人数偏高。所以有时候为了获得能代表人群分布的样本，会采取分层抽样的方式，先根据人群特征设定各个群体的比例，然后再在各个群体随机抽样。

因为是抽样调查，即使精心地设计，也不能保证每次调查结果就一定可靠。但是如果有别的调查机构也做了类似调查，那就可以相互验证。如果各个调查的结果都一致，就说明非常可靠。CNN是第一个公布总统辩论的民意调查结果的，随后其他民意调查也都得到了类似的结果：NBC News的结果52%:21%，ppp的结果51%:40%，YouGov的结果49%:22%，Politico的结果49%:26%，Echelon Insights的结果48%:22%，路透社的结果：48%:23%，福克斯的结果61%:21%，Post-ABC的结果53%:18%。所有的调查结果都认为希拉里赢了，而且除了ppp的调查，都认为希拉里大获全胜，认为希拉里赢的选民人数是认为川普赢的选民人数的2～3倍。不知为何川普、川普支持者只顾着骂最先出头的CNN，而无视其他的调查结果？特别是保守派电视台福克斯一直是支持川普、获得川普的信任的，其民意调查结果比分比CNN还悬殊，认为希拉里赢的人数是认为川普赢的人数的3倍，川普、川粉怎么不去骂福克斯？

当然，再多的民意调查结果也不会让川普承认自己输了，他本来就是极度自恋的人，从不认输也从不认错。而川粉对川普是一种类似邪教的追随，川普认为自己赢了，他们也就只能跟着喊他赢了，然后认为所有的民意调查结果都是不可靠的，都是被民主党收买的，只有他们刷出来的网上投票才能代表民意。

2016.10.3