两个孩子能够继承父亲基因的百分之几?

27 03 2007年

在赵若舟的文章《中央电视台的两次低级的科学错误》中有这么一段话:

其一,原解说词我忘了,大致意思是这样的:“一个儿子可以继承父亲50%的基因,两个儿子就可以继承父亲100%的基因。”这个错误高中理科生就可以发现,第二个儿子继承父亲的50%的基因中,又会有50%基因和第一个儿子的相同,因此两 个儿子中,只能继承父亲75%的基因,而不是100%。也就是说父子之间会有50%的基因相同,亲兄弟之间也会有50%的基因相同。

我没有看过那一期节目,但从这个100%基本可以推断中央台犯了一个严重的错误。比方说有这么一个问题:某种彩票买一张中奖的可能性是50%,那么买两张至少有一张中奖的可能性是多少?如果我们问一般的小学低年级学生,他大概会说,是100%。如果我们问学过一点概率的中学生,他会告诉我们是75%。

从75%这个数字看来,赵文中的算法至少要比中央台的算法高明许多。但实际上它也是不合适的。下面我们来做一个较为详细的分析。

我不知道电视节目里讲的是孩子还是儿子。我觉得讨论两个孩子比两个儿子更合适,因为如果是儿子,那么有一条Y染色体已经是确定的,在计算概率是要把它排除,增加了计算的繁琐程度。因此我们在这里主要讨论两个孩子的情况,多少也兼顾一下两个儿子的情况。另外,我们还需要两个假设,一是忽略Y染色体和X染色体基因数的差别;二是忽略线粒体遗传信息的影响。这样我们分析起来才比较简单。从这两个假设也可以看出缺乏基础知识会给思考问题造成一定的困难,所以这里并没有苛责赵文的意思。

首先,每个人的染色体都是一半来自父亲,一半来自母亲,因此每个人都继承了父亲50%的基因。这不是一个概率问题,不是有人多有人少,平均是50%,而是大家都一样。可以看出这一步和买彩票是两回事。

如果一个父亲有两个孩子,那么这两个孩子所继承的父亲的基因有多少是相同的呢?这个答案是不确定的,我们只知道它介于0-100%之间(包括两端)。因为人有23对染色体,精子和卵细胞各有23条染色体,如果不考虑同源染色体之间的交叉互换的话,一个人可以产生2^23种精子或卵细胞(如果考虑到互换,那么这个数字又要扩大很多)。任意两个精子之间有多少基因相同我们当然无法知道。

那么两个孩子能够继承父亲多少基因呢?从上一段我们可以知道这个数字应该在50%-100%之间(含两端)。也就是说当两个孩子对应的精子基因完全相同时,他(她)们一共继承了父亲基因的50%,当他们对应的精子基因完全不同时,他们就继承了父亲100%的基因。当然这两种极端的情形都非常的少(几乎是不可能的)。仍然不考虑互换的话,我们可以把这些不同的情形都写出来:

23/46 (50%), 24/46, 25/46, 26/46, ……45/46, 46/46 (100%)

一共24项,而它们的概率分布恰恰是23次二项式的展开。这样我们知道,两个孩子继承父亲基因的平均比例是75%。也就是说,对于许许多多拥有两个孩子的父亲的平均结果是75%,而对于任何一个具体情况我们都无法知道这个比例是多少。而且,由于46不能被4 整除,我们在上面的排列中并不能找到75%这一数字(也就是说,两个人各从1-46之中任意抽出23个数字,他们两个之间不可能有一半的数字相同,要么有11个相同,要么12个,而不可能有11.5.个相同)。离75%最近的两个比例34/46和35/46出现的概率是C(11,23)/2^23=16%。可见,两个孩子正好遗传父亲75%左右的基因的概率并不大。如果考虑到互换虽然有可能出现75%,但概率又会小得多。

我们顺便再来看一下两个儿子的情况。因为父亲把Y染色体传给儿子,把X染色体传给女儿,所以如果一个父亲没有女儿的话,即使他有一万一亿个儿子他也无法把自己的基因全部传下去,他的X染色体始终无人继承。可见两个儿子和两个孩子的情况还是有所不同的,在概率的计算上也有差别。

以上的分析是针对全部染色体的。对于某一个单个的基因而言,生一个孩子就有50%的可能传下去,生两个就有75%的可能传下去,生三个87.5%,依此类推。这倒和买彩票的原理差不多。但我们必须明确,这里的75%是概率,而不是基因的比例。假使彩票一次中奖的金额是100元,买两张中奖的概率是75%,并不是说你买两张彩票会中75元。

现在我们来总结一下:
1)
某一个基因能被一个孩子继承的概率是50%,能被两个孩子继承的概率是75%。这都是概率问题。

2)
一个孩子能够继承父亲(或母亲)全部基因的50%,这是确定的,不是概率问题。两个孩子能继承多少比例的基因是概率问题,平均比例是75%。

3)
孩子有50%染色体和父亲(或母亲)相同,这是确定的,不是概率问题。同父同母的两个孩子之间基因相同的比例是概率问题,平均比例是50%。

由此我们可以看出,中央台的算法是完全错误的,而赵文中的算法有一定的道理,但也不合适。之所以不合适,是因为混淆了单个基因和全部基因以及必然事件和概率事件之间的差别。

最后还要指出,这里说的“相同”和“不同”是指的基因或染色体的来源,不是基因组的相似程度。不然的话,兄弟两个除了50%的相同之外,另50%其实也是基本相同的,毕竟都是人的基因。



说说农历

27 03 2007年

在我国现今使用的日历上可以看到两种历法――公历和农历。公历是世界上通用的历法,而农历则是我国所特有的。

按照历法的计算依据可以将历法分为阳历和阴历。阳历的依据是地球围绕太阳的公转(公历就是一种阳历),阴历的依据则是月球围绕地球的公转。因此,阳历能够准确地反映由于地球公转引起的自然现象,如春夏秋冬四季的更替、昼夜长短的变化等。这些现象在阴历中显然没有准确的反映。阴历能够准确地反映由月球公转引起的现象,比如月亮的圆缺、潮汐的涨落(当然月球公转不是潮汐的唯一原因)等。这些则是阳历所无能为力的。

农历的主体是阴历,以地球自转一周为一日,以月球公转一周为一月。月球公转的周期约29天半,所以农历的月有大月和小月,大月30天,小月29天。由于阴历不能准确地反映季节的变换,单纯使用阴历不能满足生产生活的需要。因此我们的祖先又在历法中加入了二十四节气。

节气是与地球公转的轨道严格对应的(在日历上是精确到几时几分的)。地球公转一周是360度,平均分成24份,每15度就对应两个相邻节气的间隔。太阳直射北回归线时就是夏至,直射南回归线时是冬至,一年中太阳有两次直射赤道,就是春分和秋分。我们只要稍加留意就会发现节气和公历是基本对应的。比如,清明节在平年几乎都是4月5日(或6日),在闰年几乎都是4月4日(5日)。这一两天的差距是由于一年中的天数不是整数造成的。从这种意义上看,节气是比公历更严格的阳历。

由于阴历12个月约有354天,13个月约383天,而地球公转的周期为365-366天,因此为了保证阴历年的平均天数和地球公转周期一致就决定了阴历有时一年有12个月,有时又有13个月。这就是闰月了。阴历平均二到三年就会有一次闰月。那么闰月是怎样决定的呢?由于阴历的一个月为29-30天,而两个相邻的节气的间隔为15-16天,所以必然有的月份能遇到两个节气,而有的月份只有一个节气。在历法中把奇数的节气(立春、惊蛰、清明、立夏、芒种、立秋等)称为“节”,把偶数的节气(雨水、春分、谷雨、小满、夏至、秋分等)称为“气” 。原则上如果某一月“有节无气”,那么它就会成为闰月。闰月上面是几月,闰月就称为“闰几月”。而闰月实际上的设定规则还要复杂得多,所以一般人不查日历的话根本就算不出哪一年该闰月,是闰几月。不利于大众的了解是阴历的一个弊端。

简单地说,我们的农历就是阴历和节气的组合。因此农历是阴阳合历。农民可以根据节气计划耕种收获,渔民可以根据阴历判断潮汐涨落。农历有很悠久的历史,至少在夏朝就已经比较成熟,所以农历又叫夏历。当然,随着科技的发展,历法也在进步,变得越来越准确了。

阴历还使用干支计年法,每一年都对应一组“干支”。由于干支的周期是60,所以会有一些人以为阴历的周期是60年,60年前的日历拿到今年就可以适用。这是不正确的。要使阴历的周期为60年,除非月球公转周期和地球公转周期的最小公倍数是60年。而60年这个数字实在是太小了。实际上这个最小公倍数可能是无穷大,因为地球公转周期与月球公转周期的比应该是一个无理数。干支完全是人为加上去的,和历法本身没有关系。其实不光是年,月、日、时也都对应于干支(就是我们说的“八字”了),难道60个月或60天以前的日历也能拿来用吗?

还有一些人认为节气是针对黄河流域的,并不适用于全国。这也是一种误解。因为我国的文化发源于黄河流域,所以节气的名称带有明显的地域特色。比如单从字面理解,“大雪”、“大寒”这些节气在岭南显然是不适用的。但历法的依据是地球和月球的公转,这在地球上任何地方都是适用的。聪明的劳动人民从来都不生搬硬套。许多热带地区就是在冬至或小寒时节开始早稻插秧的,他们根本不会傻乎乎地等到谷雨。在我的家乡华北,虽然人们也常念“五九六九河边看柳”,但也没有人当真在阳历二月底去欣赏柳树的干树枝。劳动人民使用农历几千年也没有发生混乱,如今随着科技的进步有了更多的指示和参考只会越来越好。杞人忧天的全是不亲手参加劳动的纸上谈兵的家伙。相反,如果不同地区的节气使用不同的名称反倒会造成混乱。

最后再提一下皇历。和前面说的干支一样,皇历也是人为加上的东西。所谓宜什么,不宜什么压根儿就是迷信。不过只要不相信那上面的胡说,倒也没必要对皇历过于排斥。比如,没买到火车票的时候还可以安慰自己今天“不宜出行”,倒可以做为一种文化。同样,相信西洋的“星座”也是不可取的,正如把刚刚从脚上解下来的布条又紧紧地束在腰间一样的荒唐。