证伪分界的窘迫 — 根源之二
可证伪性原则在实际应用中发生困顿的另一个根源是它自身的局限。可以从两个方面来看。
第一,可证伪性不够严格,作为科学分界标准或者太宽,或者太窄。太宽是说,伪科学的东西也可能被证伪,根据证伪原则伪科学有可能被放入科学殿堂。比如虎皮鹦鹉预测地震的理论,说虎皮鹦鹉一跳某地就会发生地震。显然这个理论是能够证伪的,很容易设计实验来检验虎皮鹦鹉跳的时候,某地有没有发生地震。按照可证伪性原则,“虎皮鹦鹉预测论”应该算作科学。但是没有一个真正的科学家会把“虎皮鹦鹉论”当作科学。如果有人宣称信了某种大法功可以使人在水上行走如飞,刀枪不入,按照可证伪性原则这种理论也可以归入科学之列的。另一方面,可证伪性原则有时又显得太窄,有可能把一些科学家认可,不能证伪的理论学说排斥在科学殿堂之外。比如“宇宙空间存在黑洞”,“自然界存在正电子”等等。所有这些没有限制条件的存在性命题,有一个例子便可证实,但无法证伪。要证伪得遍寻宇宙,是个不可能的任务。由此可见,仅仅依靠可证伪性原则是不够的,它本身往往不能给予清楚具体的分界,而是要借助常识、经验、逻辑和公认的理论去判别哪些东西是胡说八道,伪科学,哪些东西是有价值的科学假说,值得进一步去检验。
第二,可证伪性原则把科学研究、科学发现和科学进步的过程看得过于简单,以此进行科学分界也使这个标准难以应付错综复杂的实际情况。按照可证伪性原则,一个假设一经证伪,它背后的理论就必须当作错误的东西被抛弃。不这样做,就不是科学。但是,科学研究和发展的过程并不如此简单。法国物理学家、科学史家杜恒(又译迪昂)提出一个很有影响的思想观点,认为一个假设不可能孤立地得到检验。假设检验不是针对某一个孤零零的假设,而是针对构成一个理论体系的一组假设。不仅如此,假设检验的过程还牵涉对实验设备、实验条件等方面的许多附助假定,这些也会影响检验的结果。当一个实验结果与理论预测的结果不符时,科学家知道检验过程涉及的许多假设中有一个或多个不成立,但是无法确切知道到底是哪一个。因此很难判断是仅仅是一个假设被证伪了呢,还是整个理论体系被证伪了。这个观点后来被美国哲学家奎因发扬光大,因此又称“杜恒-奎因原理,”后来有人认为是证伪主义不可逾越的障碍。
科学发展的过程错综复杂,由于种种原因,一种理论有可能先被证伪后来又被证实,或者证实后又被证伪,因此无法简单地套用可证伪性原则去给某种理论一锤定音。1906年考夫曼宣布他的关于高速电子荷质比的实验与爱因斯坦狭义相对论不符时,爱因斯坦对自己的理论依然充满信心,并没有抛弃它。两年后,布歇雷尔发表了更精确的实验结果,支持爱因斯坦理论。到了1916年,两位法国物理学家才发现考夫曼的实验装置是有问题的。
爱丁顿观察日全食证实广义相对论的历史事件对波普尔思想有深刻影响,因此仔细考察一下这个例子可能更能说明问题。爱丁顿第一次以一种“判决性检验”(crutial tests)支持了广义相对论的预言,产生的轰动效应使广义相对论开始为科学界广为接受。但是从当时的实验情况来看,爱丁顿宣布证实爱因斯坦广义相对论这个结果可以说相当偶然,并不十分可靠。其一,巴西索布拉尔观察队大口径望远镜由于聚焦问题,19张底片只有0.93角秒的结果,更接近牛顿理论的预言值(0.87角秒)。但是这个结果理所当然地被深信爱因斯坦理论的爱丁顿打了折扣,而更愿意相信小口径望远镜的7张底片的数据(1.98角秒)。爱丁顿和戴森最后对三数据加权平均,最后得出1.63角秒这个比较接近爱因斯坦理论的数值(1.75角秒),是压低了0.93角秒的权数的结果。其二,严格的做法,爱丁顿的普林西比岛观察队应该像索布拉尔观察队一样,观测完日食时的恒星位置之后,几个月后回到同一地点再次观察没有太阳时的同一天区,比较两次观察到的恒星位置。但爱丁顿没有这样做,而是直接比较英国的研究人员在夜间观察这批恒星位置的结果。尽管爱丁顿为了避免系统误差拍了另一天区的照片用作参照,其精确性仍然不及同一天区的比较。其三,测量精度受仪器和环境条件的影响。爱丁顿在在普林西比岛碰到恶劣的天气,只有两张照片可用。两张底片的平均值和索布拉尔观察队26张底片的平均值,可靠性显然不同。不仅如此,温度变化造成聚焦系统和照相底片的变化也直接影响测量结果的精度。索布拉尔的昼夜温差达22°F,是可允许温差的一倍以上。研究人员的观念,实验的设计,环境条件,仪器能够达到的精度等等,这些因素都可能影响最后实验结果。设想如果不是爱丁顿,而是另一个对爱因斯坦广义相对论持怀疑和敌意态度的科学家,比如瑞典的实验物理学家哈瑟伯格;如果普林西比观察队可用的两张底片碰巧是数值偏低的极端值;那就很可能给低数值更大的权重,由此得出不利于广义相对论的结论。或者由于忽略索布拉尔较大昼夜温差的因素,把由此造成的高达2.16角秒光线偏折量理解成否定广义相对论理论预期值的正误差[1],如果做实验的科学家据此宣布广义相对论没有得到验证又如何?实际上,1919年前后的一些观察实验就有不支持爱因斯坦理论的结果。爱丁顿之前,就有美国的天文学家赫伯.柯蒂斯和威廉.瓦拉斯.坎贝尔,试图通过观察1918年6月8日发生在华盛顿州戈登代尔的日全食检验爱因斯坦的理论。爱丁顿之后,又有厄文.弗伦德里希(Erwin Freundlich)1929年在苏门答腊岛的观察。前者由于仪器精度不高,后者由于人为错误,都没有得到支持爱因斯坦理论的结果。
这个例子中更说明问题的,还有历史时机这个偶然因素对科学理论验证结果的影响。爱因斯坦在1911年发表《关于引力对光传播的影响》时,误算出光线偏折值是0.875角秒,直到1915年他全部完成广义相对论时才把它修正为1.75角秒。1911年到1915年间,各国科学家做过多次努力,试图通过观察日食时的星光来检验爱因斯坦的引力理论,但是由于多云的天气,准备工作的失误以及第一次世界大战的爆发等因素而没有一个成功实施。富有戏剧性的是,假如这些早期实验中有一个真正成功实施了,其结果必然是爱因斯坦引力理论预期值的一倍,实验结果从现象上看又是对爱因斯坦引力理论的否定了。
从另一个角度看杜恒-奎因原理,科学理论各个组成部分之间有内在的联系,科学家不能仅凭对一个部分的证伪就否定整个体系。孤立地看万有引力定律,我们怎么可能建立一种实验去证伪它?如果不能证伪是不是可以断定万有引力定律不是科学?万有引力定律的科学性,来自它和牛顿三大定律一起构成的整个经典力学体系的科学性,而这个体系的科学性则在于它的自洽和解释力可以为物理事实检验。对爱因斯坦广义相对论的最后验证,当然不是爱丁顿的这一次日食观察,而是后来实验条件更严格,仪器精度更高,重复多次的实验,包括对无线电波偏折的观察。更重要的是,广义相对论的“判决性检验”不仅仅是星光的引力偏折,而且包括对水星近日点的进动的解释,光谱线引力红移等一系列推测和检验。
波普尔自己后来也承认,不能一条条假设地单独评价,而是要把科学理论作为一个体系来证伪。“我们确实只能证伪理论体系,任何对体系中某个特定陈述证伪的做法都是非常不确定的。” 即便如此,一旦要综合考理论整体,可证伪性原则立刻失去作为实践中判断标准所必须的便利、清晰和确定性,失去人们所期望它具有的那种一锤定音的法力,因为对于什么构成理论整体可以有无穷无尽的争论。
[1]据说戴森在观察队出发前解释观察结果的含义,如果数值接近0.875角秒,说明支持牛顿理论;如果接近1.75角秒,说明支持爱因斯坦的理论。这时爱丁顿观察队的副领队哥廷翰问道:“如果得到的数据是爱因斯坦偏折值的两倍,那又说明什么?” 戴森回答说,”那么,爱丁顿就会发疯,你只能一个人回家了!”