略谈房德邻先生《“光绪帝系砒霜中毒死亡”说难以成立》中对砒霜中毒的质疑是否合理

本文最早于2019年01月30日发表于知乎专栏:“没史料啊!”,此处为存档。


2017年出版的《清光绪帝死因鉴证》一书是这样开头的:

1908年11月14日18点33分(光绪三十四年十月二十一日酉正三十三分),清光绪帝死,时年38岁。

正如电影《盗墓迷城》里的经典台词所说的那样,“死亡只是一个开始”。尽管官书将这位皇帝的死亡记载为病亡,但从清末到现在,一百多年过去,关于这位皇帝惨遭慈禧太后毒杀的传说一直从未停止。从20世纪初开始,野史作者们绘声绘色地描述着宫闱秘闻的每一个细节、每一条线索、每一种动机;这些假多真少的故事,满足了清末民初民间读者们对宫廷秘史的好奇心,并在很大程度上影响了清史的主流叙事。今天,大多数的清史读物要么直言光绪帝系中毒死亡,要么将这种传说作为重要的备注,列在括号或脚注里。

当然野史终究是野史,通俗读物作者们为了提振昏昏欲睡的读者们的兴趣,可以堂而皇之地把野史写进书里,却不足以让这起谜案得到确证。这不仅是一个事实问题,更是一个观念问题:不同的论者,对于不同文献的可信度各执一词,争论也就难以穷尽。

自2003年开始,在包括中央电视台主任编辑钟里满先生在内的一批人士的推动与合作之下,一些关于光绪帝遗体中砷的含量的检验工作逐步展开,人们试图采用科学方法来检验光绪帝的死因。国家清史编纂委员会后来也参与了这些工作,召集了一批清史学者予以协作。这些工作的成果的一部分发表于《清史研究》2008年第4期《清光绪帝死因研究工作报告》(以下简称《报告》)及《清光绪帝砒霜中毒类型及日期考》两文之中。

钟里满《清光绪帝砒霜中毒类型及日期考》主要采用的是脉案进行推断,这篇文章暂且不论。另一篇《报告》一文却在当时掀起轩然大波——这篇文章采用了微量元素检测的方法来检查光绪帝遗骨中的砷,被认为是历史学与自然科学罕见的携手合作的范例。最终该文得出了光绪帝系砷中毒死亡的结论。在当下中国,一份“由科学方法得出”的结论,其权威性是不言而喻的;包括诸多媒体在内的许多人都相信,这一百年谜案已经得到了解决。

然而问题并未至此结束。2010年,北京大学的房德邻先生撰《“光绪帝系砒霜中毒死亡”说难以成立》一文,针对上述两篇论文提出了不少的质疑。这篇论文最早发表在北京大学历史系网站上。由于北京大学历史系网站改版(作为一个多年前深受他系网站访问困难之苦的搬砖工,请恕我采用一种我能想到的最中性的表述方式来描述这件事),这篇文章原链接已经无法打开;但在许多网站上都能找到它的备份,想读到并不困难。该文同年发表于挂靠在故宫博物院名下的学术集刊《明清论丛》(第十集,2010年8月出版)。(有人认为该文从未出版,并进而衍生出一些想入非非的解释,这并非事实。)

《明清论丛》第十辑部分目录

房先生的质疑可以分为两部分,一部分针对的是钟里满《清光绪帝砒霜中毒类型及日期考》一文中对史实的推测。这部分虽然也很重要,但并非本文所要讨论的对象。本文所重点讨论的,是房先生论文中影响较大的一部分,也就是对《报告》中微量元素检测工作方法与结果的质疑。这部分工作被一些道听途说者炒作为“历史学对自然科学的还击”云云,所受关注远高于前一部分,也是房先生质疑光绪死因研究的发力点所在。

房先生发表该文时,互联网技术远不如今日之方便,历史学从业人员又普遍不擅计算机,很少有人在当时能自如地摘抄文段互相对比,或将两文对照之处作比较自如地展示,“瑕瑜互见”还是不太容易的。故而房先生的质疑虽然很早就已作出,并有机会加以宣讲,但目前在公开场合很少有人对这一质疑作出具体评价。目前仅见朱金甫《再论光绪帝载湉之死》一文(发表于《历史档案》2010年第4期)曾应和房德邻先生的说法,指出应该谨慎行事。

我很早就知道房先生有此大作,但很长一段时间也只是知道而已,和许多同仁一样并未有机会细读;日前由于一件被人抬杠然后又被抬杠者挂的无聊事情,方将此文对照《清光绪帝死因研究工作报告》作一简单的检视。孰料稍加检视,即发现该质疑存在一些十分简明的问题,特在此略作说明,以便各位历史爱好者明白为何房先生的“质疑”从学术上完全不足以撼动《清光绪帝死因研究工作报告》的结论(当然,非学术的角度我就无可奈何了)。

在谈论这件事以前,我要郑重强调三个前提。其一,房德邻先生是一位优秀且值得尊敬的近代史前辈学者,大家没必要因为这一件事上犯了一些小错误而否定这位学者,事实上有许多学者犯的错误比他要大得多。任何对房先生的讥笑、评头品足和风凉话,都是本文作者所不愿见到的,请各位读者千万不要说这种话,更不要因此就对房先生有什么意见——这是一件很小的小事,我是一个很小的小人物。

其二,房先生的错误,根本原因当然在于缺乏定量分析实验的常识。然而,任何在求学之路上试图改行的人都会明白学科壁垒有多么难以逾越。跨学科来讨论一些事情,本来就是很不容易的,何况房先生功成名就,能主动针对自己感兴趣的问题,哪怕跨域学科和领域,做一些学习和争鸣的工作,这本身就已经非常值得后辈人物尊敬。至少,要不是有房德邻先生的质疑,我想《报告》一定会少许多读者。公开的质疑、平等的讨论,就算质疑者的看法有简单的错误,也比“万马齐喑”、“一堂和气”甚或“以官品定是非”要好得多。

其三,这篇文章与国家清史编纂委员会没有任何关系。笔者只是几年前曾经给他们打过一点零工而已,早已和该机构没有什么瓜葛。我的任何言论都不能代表委员会,同理,委员会的公同决议也不能代表我的看法。

房先生犯的错误其实非常简单,不过展示起来却未必很容易。为此,我将先展示这些错误的逻辑形式,然后再来结合文段内容进行分析。


一、十块钱一斤的苹果,买半斤,是不是就是五块钱一斤了?(或曰,“单位质量中的含量”是什么意思)

题目(1.1) 水果摊上,苹果十块钱一斤。有一个人买了半斤,请问对于这人来讲苹果多少钱一斤?

选项A:十块钱一斤。选项B:五块钱一斤,因为这人花了10*0.5=5元。

题目(1.2) 根据可口可乐的营养标识,每一百毫升可口可乐含有10.6克糖。那么请问一瓶330毫升的可口可乐里,每一百毫升含有多少克糖?

选项A:10.6克/100mL,因为无论一罐多大,每百毫升的含糖量不变。

选项B:35.0克/100mL,因为一罐是330毫升而非100毫升,用330毫升乘以10.6克,得到34.98约等于35.0克。

很显然上述两个题目都应该选A,另一选项B很明显是错误的。无论买多少苹果、有多少体积可乐,因为我们求算的是“单位质量/重量的价格”和“单位体积的含量”,是“强度量”,所以它们都不受涉事物质量多少的影响,也就是不受“广度量”影响。

既然如此,那么房先生文章中的重要质疑之一,也就不难解决了。在检测过程中,第一个重要的工作是对光绪帝所遗头发中含砷量的测定。《报告》称:

2003年,首先采用中国原子能科学研究院微型反应堆仪器中子活化法(核分析方法)测定了提取于光绪帝的两小缕头发 , 其方法是 : 将光绪帝的头发按照国际原子能机构(IAEA)推荐的方法清洗,自然晾干,剪切成1厘米长的截段,第一缕头发长度为26厘米,剪切成 26小段;第二缕头发长度约为65厘米,剪切成59小段,其中第1、59段长度分别为4.5和3.5厘米。逐一编号、称重和封装,入堆辐照后逐段检测光绪帝头发中的元素含量。

这一流程,稍具分析实验经验的人应该都觉得很普通,很容易理解。其结果则如下图所示:

《报告》中光绪帝头发中含砷量依发丝位置分布的检验结果,注意单位

房先生对这两张图提出了如下质疑:

图1是检测26厘米长的头发,图的横坐标的单位是长度1厘米,纵坐标的单位是砷重量500微克,但课题组却又特别说明砷含量的单位为“微克/克”,依此说明,则1厘米的头发恰好重1克。但这在事实上是不可能的。课题组已经说明图1是采取一小缕头发,由此可知1厘米的头发不可能恰好就是1克重。究竟多重,课题组未说明,我们只好假设每1厘米的头发约重0.1克。由此我们可以推算出课题组实际检测到的数据。例如第1厘米处,现在是21.2微克/克,则当初检测的数据应当是21.2微克÷10=2.12微克,即第1厘米(重0.1克)检测到2.12微克砷。课题组将此换算为每克的砷含量,便扩大10倍,为图中的21.2微克/克。这个数字已经不是课题组实际检测的数字了,它的含义也改变了,它等于说检测了10小缕头发,其他9小缕头发的第1厘米处也是重0.10克,砷含量也是2.12微克。这个换算是没有问题的,因为砷本底值是平均分布在光绪帝的头发中的,从理论上说,光绪帝头发的第1厘米处的砷含量是相同的。 

但是图1第10厘米处的2404微克/克却不同。当初课题组并不是检测1克头发,而是检测0.1克,其砷含量为2404微克÷10=240.4微克,其含义是第10厘米处(重0.1克)的头发检测出240.4微克的砷。课题组把它也换算成每克的砷含量,也扩大10倍,为2404微克/克。这个数字已经不是课题组实际检测的数字了,它的含义也改变了,它等于说检测了10小缕头发,其他9小缕头发的第10厘米处也是重0.10克,砷含量也是240.4微克。这个换算就有问题了,因为沾染的砷不是平均分布在光绪帝头发上的,其他9小缕头发的第10厘米处并没有沾染到腐败尸体,10小缕头发的第10厘米处所沾染的砷的总量仍然是240.4微克。其实,不仅是10小缕头发,就是全部光绪帝的头发,其第10厘米处所沾染的砷的总量也是240.4微克。沾染的240.4微克是个固定的数(内中含有发砷本底值,忽略不计),它不能换算为2404微克/克,光绪帝的头发中不存在2404微克/克的现象。 

因此,图1第10厘米的砷含量必须改为240.4微克/克,图中其他沾染腐败尸体的砷的数据也都得缩小10倍,其他还有9个厘米处沾染了砷,即第3至第9,第11、12厘米,缩小10倍后的砷含量分别为6.232、14.92、7.896、25.89、66.92、68.20、115.1、18.7、14.5微克/克。

这段话由于房先生不太熟悉分析实验表述方法而有些缠夹不清,我来把上述文段简单归纳一下:

(1) “《报告》测出第10小段头发里含砷量最高,2404微克/克。”(这一点符合报告原文)

(2) “但是第10小段头发长1厘米,它的质量肯定没有1克。”(这一点推测应该说符合事实)

(3) “第10小段头发多重我们不知道,假设它是0.1g好了。”(这一点只是假设。顺便一提,学过分析化学的人都会敏锐地指出0.1克和0.10克是不一样的,这已经无关宏旨,不追了)

(4) “因此第10小段头发里实际检验结果是240.4微克。”(如果(3)是对的的话成立,但(3)只是假设,并不一定成立。)

(5) “所以第10小段的检验结果不是2404微克/克,而是240.4微克/克。”(即便在(4)的基础上也不对)

从(4)到(5),也就是引文中加粗的几句话这里,房先生犯了混淆强度量和广度量的错误。

分析实验对准确性的追求,要求实验结果必须有相同的基数,以便对比。在不交代试样质量的情况下,绝对含量经常是意义有限的;只有相同质量试样中,含量才能互相对比。因此许多实验所形成的结果,都是绝对含量除以试样质量,得到单位质量试样当中的含量,这是一个强度量。在这一实验中,十分明显,剪刀修剪并不能保证每份头发在分析天平的量级上重量相等——一个常识:分析实验室电子天平的精确度一般为万分之一克——故而直接测得的结果,也就是含砷的绝对质量,其意义非常有限,必须要除以各试样的绝对质量,由此形成了“微克/克”这一含量单位,它表示的是每克头发里的砷含量。

房先生并不理解实验结果的数字含义,作出了曲解,强行假设每段头发重0.1克(这一假设并无依据,纯属拍脑门),把已经归一化的“强度量”实验结果,也就是单位质量头发中的含砷量2404微克/克乘以这一“质量”而得到一个毫无意义的240.4(由于量纲混乱而无意义)的数字,硬说这是“真正的”单位质量头发中的砷含量,即2404 μg/g * 0.1g = 240.4 μg/g,很明显量纲对不上(有效数字就不管了)。这个错误简而言之就是,十块钱一斤的苹果,只买了一两,花了1元钱,然后把这1元钱当成苹果单价,声称苹果是1元钱一斤。

这个错误很简单,但影响非常大。它否定了房先生文中相当多的努力。房先生试图让人相信《报告》把光绪帝头发之中砷的含量夸大了十倍,但从上面的分析可以看到,是房先生的错误理解,让他把头发中砷的含量给压低到了十分之一(当然,也把苹果价格给压低了)。类似的错误,例如第一节里质疑《报告》从光绪帝衣物取样过程时,称:

《报告》对于骨骼、衣物的检测只说明在何处取样,未说明取样的重量,由此可推测课题组取样时并不是每1份样品都取1克重来进行检测的,但公布的数据是1克的砷含量,这些数据可能是换算得来的,而不是实测得来的。如果取样的重量等于或大于1克,则这些数据就是准确的。如果取样的重量小于1克,则这些数据就不准确了。……《报告》公布的衣物的含砷量是以“微克/克”为单位的,这不是课题组实际检测的数据,实际检测的数据要比这个单位小,“微克/克”是换算得到的,这个换算在不经意中扩大了衣物的含砷量。

这显然也是对“单位质量中某物质的含量”这一概念理解错误所致。房先生非常固执于《报告》“未说明取样重量(按:应为质量)”,认为“如果取样的重量等于或大于1克,则这些数据就是准确的。如果取样的重量小于1克,则这些数据就不准确了”。这和“10元/斤的苹果,如果买半斤,就是5元/斤了”是一样的错误——毕竟《报告》谈到砷含量的时候一直使用“微克/克”这一单位,因此含砷量与取了多少试样无关,试样质量早已在分数线下面被除掉了。

事实上,我们都可以理解,用“几块钱一斤”来表示价格,比不谈单位、单说几块钱,要准确得多、常用得多、标准得多;同理,单位质量含量也比不谈质量、空谈绝对含量要准确。不然你说苹果价格是十块钱,那是十块钱一车、还是十块钱一个?

房先生也不是通篇总犯这个错误,有一处似乎明白了一些。但这一处有其他的麻烦,我们在后面谈试样的时候再说。


二、“鸽子为什么这么大?”(或曰:看似问到了重要的东西,实则所问与对方原意无关。)

鸽子为什么这么大”可能是每个试图跟人讲理的人的梦魇。说理者摆出事实、条分缕析,然而听者却根本不和人沟通,不愿理解说者到底在说什么,而是呶呶不休,反复提及和质问一些无关宏旨的事情,并把这些不相干的问题和论据当成一种“质疑”;往往听者所问,和说者所指的事情并不相同。在这种情况下,尽管质疑者可以表现得大义凛然、用富有感情的语言将问题包装得掷地有声,但它们都是无效的质疑。

房先生的文章之中,有三个质疑点就是在追问“鸽子为什么这么大”。这三个质疑点分别是“原来体内的砷浓度怎么算”、“沾上砒霜溶液的量是多少”和“右袖含砷量为什么这么高”

2.1“不知道腐烂尸体减重多少,怎么计算原来体内的砷浓度?”“但我并没有要算原来体内的砷浓度呀!”

房先生在文章开头开宗明义地称:

我认为,《报告》在方法上有根本性的错误,它未对检测的数据做回溯分析便下结论。这种错误就如同下例中甲某的错误一样:一百年前有一桶海水,经过一百年海水已经蒸发了,盐沉淀在桶底。甲某发现了,从桶底取出一克物质进行含盐度检测,结果含盐度为99%。于是甲某就宣称:根据检测的结果可知一百年前那桶海水的含盐度是99%。这个结论显然是荒唐的。而课题组正是用的这种方法,他们把尸体腐烂挥发后存留在衣物、头发、骨骼上的砷取来做检测,把测得的砷浓度当作光绪帝身体中的砷浓度,这不就是甲某把沉淀的盐的浓度99%当作海水的含盐度了吗?

很难不把这段话当成房先生撰写本文的初衷。房先生认定,我们不能确定检出的砷源于多大质量的腐败尸体,因此也就无法确定光绪帝尸体中原本的砷的浓度是多少

课题组检测了内衣躯干部的4份样品,其含砷量的平均值是448微克/克。这是腐败尸体挥发后留存在内衣上的砷,它不等于是光绪帝生前内藏和上腹部的平均含砷量,必须对它做回溯分析才能知道生前的平均含砷量。但是这有困难,因为我们不能准确地知道当初有多少腐败尸体挥发掉了,只能做估算。如果在1克内衣躯干部上承载了10克腐败尸体,则448微克/克÷10=44.8微克/克。如果承载20克腐败尸体,则448微克/克÷20=22.4微克/克。如果承载30克,则448微克/克÷30=14.93微克/克。究竟是多少,不能确定,但光绪帝尸体对应样点部位的腐败物的平均含砷量肯定比448微克/克小得多。

(房先生此处的计算犯了之前“五块钱一斤苹果”的错误:448 μg/g / 20 g = 22.4 μg*g^(-2),不是22.4 μg/g,量纲明显有误。当然后面这个量纲已经奇怪得让人难免失笑了。)

然而如果仔细读了《报告》,会发现《报告》并没打算复原“1克腐烂尸体对应多少克新鲜肉体”,更没打算计算光绪帝身体中的砷浓度。《报告》的逻辑链条是:

(1) 光绪帝头发之中的含砷量远高于常人;

(2) 头发之中的过高含砷量源于头发局部的结痂物残渣;

(3) 部分尸骨上含砷量过高,与(2)一起说明腐败尸体里有过高的砷;

(4) 葬衣由内至外的含砷量升高,同件葬衣以肠胃处含砷量最高,说明尸体的砷源自肠胃处;

(5) 根据葬衣、葬衣抖落残渣与头发残渣样本之中的平均砷浓度,乘以所涉及的葬衣、葬衣抖落残渣与头发残渣的总重,计算这些葬衣、葬衣抖落残渣与头发残渣整体含砷的质量。

可以看到,(5) 计算的并不是光绪帝体内的砷浓度,而只是本实验所涉及到的一些遗物、头发之中含砷量的总和。它的意义是给大家一个大致的心理预期,即这些东西里一共含有多少砷、进而推算出这些砷对应多少砒霜(三氧化二砷)。而计算结果是对应201.5 mg 砒霜,超过文献中的砒霜致死量200 mg。只是葬衣和头发中的量就足以超过致死量,那么全身的量肯定更高;即便不知道全身的量,也可以得到“光绪帝死于砒霜中毒”的结论,《报告》在这一点上是自洽的。如果想要准确地知道光绪帝体内一共有多少砒霜,或如房先生所说要计算“光绪帝尸体的砷浓度”就必须把全部尸体毁掉,这显然是不可能的(《报告》里反复提醒读者他们无权打开光绪帝棺椁,只能用1980年代西陵清理时保留在库房里的头发与部分遗骨),实验设计上就没打算这么干,只是房先生没理解实验目的,误以为如此而已。

2.2 “沾上的含砷试剂浓度不同!”“这和讨论无关啊。”

这一点其实是“浓度”问题的延伸。可能是由于教育背景的缘故,房先生不太了解定量分析实验的做法,这让他的一些质疑显得非常外行,例如他对砒霜溶液浸泡实验的看法就比较怪。

《报告》的“初步检验”里有一个模拟实验,用来证明光绪帝头发上砷含量依位置而呈正态分布,这一现象并非源自头发内部生长所携带的砷,而是来自含砷流体的浸泡,进而排除头发自然带砷对结论的影响。《报告》是这么描述实验的:

取一段当代健康人头发,长度为10 cm,清洗干燥后,放在一层棉花上,棉花下垫一层聚乙烯薄膜。用定量滴管取砒霜溶液 (As2O3 浓度为1.28 mg/mL,北京市公安局提供),体积为36.5 μL,一次性滴在头发的第五厘米处,放置 24小时,清洗并分段检测。另取同一人的头发清洗后分段检测砷的本底含量。

实验结果为:

《报告》中模拟砒霜浸泡实验的结果

进而,《报告》得出结论:

外界的砷化合物不经过自身机体代谢,也可以吸附、渗透到头发内,而且可以形成近似正态分布的高峰。由此推测,光绪帝发砷分布高峰不是新陈代谢的结果,而含有高浓度砷的物质沾染可以形成。

看起来这就是个简单的外标法实验,实验方法和结论都无甚难理解之处。但房先生不了解外标法这一分析实验中的常见做法,对这个实验产生了一些“跑偏”的理解(特别是加粗的句子):

表中最高值是第5厘米处的17.5微克/克,最低值在两边,程正态分布。之所以程正态分布,是因为做实验滴砒霜溶液时是一次性滴在第5厘米处,所以第5厘米处砷量最高,向两边少逐渐减少。由于每厘米头发沾染的砒霜溶液的多少不同,所以检测到的砷含量也就不同。但是这并不等于当初滴上的砒霜溶液的浓度不同,浓度都是1.28mg/mL。所以对10厘米头发上的砷做回溯分析时,取任何一个数值,无论是最高的第5厘米处的17.5微克/克,还是最低的第9厘米处0.590微克/克,其砒霜溶液的浓度都是相同的,我们已知它是1.28mg/mL。第5厘米处17.5微克/克是第9厘米处0.590微克/克的29.66倍,这是因为第5厘米处滴上的砒霜溶液是第9厘米处的29.66倍。 

同样,光绪帝第一缕头发的砷含量也程正态分布,这是因为尸体腐败液化后在流动时受到第一楼头发的阻挡,这股液体的“主流”沾染到头发上的流量大,而两边沾染的少。由于每厘米头发上沾染的液化的腐败尸体的流量不同,所以检测到的砷含量也就不同。但是这并不等于液化的腐败尸体的砷浓度就不同,而是大体相同的。所以对第二至第十三厘米(共10厘米)头发上的砷做回溯分析,无论是最高的第10厘米处2404微克/克(应为240.4微克/厘米),还是最低的第3厘米处62.32微克/克(应为6.232微克/厘米),其沾染上的液化的腐败尸体的砷浓度大体是相同的,但是我们不知道它的浓度具体是多少。240.4微克/厘米是6.232微克/厘米的38.58倍,这是因为前者沾染的腐败尸体是后者的38.58倍。 

课题组误以为光绪帝头发上沾染的砷量在每厘米上高低不同,是因为沾染的腐败尸体的砷浓度不同造成的,2404微克/克(应为240.4微克/厘米)沾染的腐败尸体的砷浓度高(“胃容物”),而62.32微克/克(应为6.232微克/厘米)沾染的腐败尸体的砷浓度低,所以课题组特别挑出“2404微克/克(应为240.4微克/厘米)”来证明光绪帝死前体内有大量的砷,而不是挑选出“62.32微克/克(应为6.232微克/厘米)”来证明,如果用后者来证明,大概不会有人相信光绪帝体内有高浓度的砷了,连课题组自己也不会相信。

稍有定量分析化学基础知识的人都能意识到,加粗的句子完全不是模拟实验的本意。实际上模拟实验只是为了说明一个关于砷来自沾染还是新陈代谢的简单结论,这个结论得出以后,它的使命就完成了。不能把模拟实验的任何数据带入到正式检验中来,它和所谓“沾染到多少腐败尸体”、“腐败尸体上砷浓度有多少”之类议题(这些议题都不是《报告》本意,是房先生对《报告》的曲解)都无关。换句话说,上述所谓“质疑”,都和《报告》没有关系,而是房先生自己生造了一个“质疑对象”。

至于加粗的那句话,则是房先生看漏了《报告》第5页图5下面的那句对模拟实验的总结:“外界的砷化合物不经过自身机体代谢,也可以吸附、渗透到头发内,而且可以形成近似正态分布的高峰。”其实他只要读得仔细一点,就能知道模拟实验到底是什么意思,也就不会对模拟实验作如此宽泛的解读了。

2.3 “右袖砷含量高,怎么解释?”“这并不是我们所讨论的对象。”

“鸽子为什么这么大”型讨论之所以经常把人逼疯,一个原因是,提问者可能注意到了一些异常现象,并对此非常感兴趣;一旦论者并未直白地对这些异常现象给出一个提问者能理解的解答,提问者就会没完没了地坚执自己的“发现”,声称论者不能解释这些“异常”,因此论者是错误的。然而有许多时候,这些异常现象与论者所论根本无关,因此无论这些事情多么异常,都不应看成讨论重点。房先生在文中多次提到的“右袖的砷含量高”就是一个这样的例子。

房先生肯定对“右袖含砷多”这件发现很自信,他把这一点当成第一个提出的质疑点:

课题组检测了内衣的左袖、躯干、右袖的含砷量,其样品的平均含砷量分别是359微克/克,448微克/克、879微克/克,三者以右袖最高。这是怎么回事?依照医理,急性胃肠型砷中毒和慢性砷中毒是内藏的含砷量最高,可是《报告》的数据却是右袖的最高,它是左袖的2.45倍,是躯干(对应内藏和上腹部)的1.96倍,这怎么解释?

后面他又提了一次:

第四件衣物左袖重69克,躯干(后背)重88克,两者共重157克,前者含砒霜32.7毫克,后者含砒霜52毫克,两者共含砒霜84.7毫克。而右袖重90克,含砒霜104.4毫克,它是左袖和躯干含砒霜总和的1.22倍。这就引出上面已经提出的问题:为什么右袖的砒霜量这么高?怎么解释?

然而如果仔细看一下《报告》里所谓内衣的检验结果,这个“右袖含量高”的说法到底怎么回事就清楚了:

《报告》中对光绪帝下葬时内衣(即所谓第四件葬衣)的检验结果

可以看到,右袖的“砒霜量这么高”,完全是由于一个异常值2439导致的。如果排除掉这个异常值,平均值就只有567,一下子就没有多高了。针对自然界中的实际分析对象所展开的分析实验,由于试样的复杂性以及其他偶然因素,出现异常值真是再正常不过了,这就是我们为什么要做平行测验,多次取样求平均值的缘故。这种明显不在置信区间的异常值,完全可以舍去。

退一步讲,即便右袖含量高,事实上也不影响《报告》的结论。《报告》提出砷源于肠胃区域的腐烂尸体,这是从第一、二、三件衣服对应胃区的部分含砷量高得来的结论,论据不包括内衣(第四件衣物);因此内衣右袖高,不能否定《报告》的结论。

读者可能要问:那么,为什么内衣胃区的数据没有被列入讨论范围呢?事实上房先生想到了这一点(只不过论述有些散):

《报告》是这样分析4件衣物的: “从同一件衣物看,第一件至第三件,每件衣物的胃区部位、系带和领肩部位的含砷量较高;从穿着层次看,第四件衣物(内层衣物)的含砷量大大高于第一件至第三件……”这段分析违反了逻辑一致性的要求。在叙述了前3件衣物的含砷量在胃区比较高之后,接下去就应当也必须叙述第四件是否也在胃区比较高,但《报告》却略去不说,而笔锋一转,改换叙述角度,说从内衣到外衣的砷量变化。这说明课题组明明知道第四件衣物的数据不支持“砷含量在胃区比较高”的结论,却在叙述中有意加以隐瞒。

后面又说:

为什么高达几千微克“极高浓度”的胃内容物不沾染到内衣躯干部,却都沾染到别处去?

这个问题看起来似乎很严重,但其实回到《报告》里看一下那第四件衣服的照片大家就知道怎么回事了。

《报告》所附光绪帝葬衣照片

很明显,第四件衣物,也就是内衣,中间都已经烂了,“胃区”已经没了,提取不了了。因此《报告》根据前三件衣服得出结论,是严谨的;相反房先生不去看一下那四张照片就把“第四件衣服的胃区”当成问题,才是“拍脑门”。


三、取样

取样是定量分析实验的一个重要程序,也是最容易被质疑的环节。我相信每一个有基本理科常识的人都可以理解,由于无法证明不可知的概然,事实上无法从根本上证明一种取样方法绝对合理、完全能够如实反映整体——毕竟如果诉诸概率,“连一颗头颅都有一定概率因隧穿效应而被塞进一个比它小的头盔里”(某推理小说家的奇想)。基于这一前提,我认为,在不谈取样方法到底有何具体问题的前提下空疏地指责别人取样不妥,这是不负责任的行为。

房先生显然不理解什么是取样。他在文章里提出了这种看法:

有人计算中国的森林总面积,他在东西南北中各取1平方公里,测算出各自的森林面积,分别为a、b、c 、d、e ,然后计算:(a+b+c+d+e)÷5×9600000(平方公里)=森林总面积。能这样算吗?第一、江、河、湖、草地、沙漠、秃山等都没有森林。第二、a、b、c、d、e并非每个数据都对应1/5的国土,并非每个数据各为1/5国土森林面积的平均数,它们只是1平方公里的森林面积,不代表其他处。

我觉得这是一种很不负责任的指责,它把一种自己设想的、图解式的错误取样方法盲目扩大为“取样都是错误的”。事实上面对一些数据分布并没有数量级上巨大差异(注意,房先生举例的问题正在于数量级)的研究对象时,取样检测并适度放大的研究方法在自然科学和社会科学中都非常常见——只要取样方式能够与误差对应上就可以。无论是生物学之中的“标记重捕法”测算种群密度,还是林业之中用单位面积棵数来估算林地树木总量(对,这里就是在林场里选择abcde几块,然后把它们的平均值乘个总量,正如房先生所嘲笑的那样),都在实践中证明并不是一件值得嘲讽的事情。在这件事上无端指责,只能反映出房先生对自然科学与社会科学的研究方法了解不够。从实际数据来看,内衣各检测点的数值除了一个异常值以外,并没有什么数量级的差别,何况从题图的角度来看,这些所留不多的残余衣服上各自取了十来个点,这个样本密度不能说不大了吧。我不知道房先生为何要把“中国各地森林分布”这样一个样本密度很低、极值差异很大的情形,混同于本案之中样本密度较高、差异很小的情况。我相信他只是单纯的“不懂”而已。

如果不用取样法,就只能把几件文物全部检测,代价就是几件文物悉数毁灭。而且即便如此还会有人说:也许分布是跨在接缝两侧的,等等。用诉诸不可知的方法来攻击取样,这在科学上是没有意义的。

与此类似的指责还有几处,如房先生认为“课题组只检测了4个样点的含砷量,其平均值448微克/克只是这4个样点的平均值,它不是整片内衣躯干部的砷量平均值”,“如果检测的衣物重0.5克,含砷100微克,将其换算为200微克/克,算式是正确的,但实际可能是错误的,因为未检测的0.5克衣物未必含砷100克”,“残渣是从衣物上抖落下来的,它所含的纤维远少于用常规方法从衣物上剪切的样品所含的纤维,所以含砷的比例就高。如果把残渣放回到它所脱落之处,再用常规方法取样,那么它一定和其他用常规方法取样所测得的砷含量相当”等等,都是对取样这一在自然科学与社会科学中司空见惯的研究方法不够了解所致。

这里还要提的是另一种对样本的错误认识。房先生在质疑衣服上的取样点时说:

裤子分三片,前外层、后内层、后外层,分别采集样点9个、6个、10个。这很奇怪,为什么样点不一样多?3片中最重要的是后内层,它能反映光绪帝肠道的砷中毒程度,为什么只采集6个样点,而最不重要的裤子后外层却采集10个样点?

但事实上看一眼《报告》所附光绪帝葬衣照片就能知道,裤子的正反面残留面积是不均等的。因此空谈说“每一层取点数应该一样”毫无意义,正确的看法是应该在单位面积上取一样的点。当然,我觉得对于一件破裤子而言,五到十组平行已经足以反映问题了。


四、实验规程(或曰:看起来好像很合理,实验上不是那么回事)

这一节只说一件小事,那就是关于房先生提出的“微克/厘米”这个单位。房先生在单位这件事上并没有都犯错误,至少有一个看法是不无道理的:

必须指出,以“微克/克”为单位来表达检测到的沾染的砷量是不准确的,准确的表达应该是“微克/厘米”,即在1厘米处检测到的砷量。

其实这个问题提得倒好。我们不妨想想看,为什么不用“微克/厘米”?

最明显的理由当然是讨论毒物时的常识:毒物含量都是以生物组织的重量为单位的,例如半数致死量是以每单位体重的大鼠或兔兔来标称。故而在讨论头发中含有的砷时,用头发的质量也是顺利成章的。

其次,对于干瘪易碎而且伸展性未知的年久脆发而言,测量重量比测量长度要容易也准确得多。根据2017年《光绪帝死因鉴证》一书中披露的图片,这些头发试样的状况确与正常人的健康头发有区别。这可能也是《报告》一直强调“一缕头发”而非“一根头发”的原因。

2017年《光绪帝死因鉴证》一书中所附取样工作的照片

最后,电子天平精确到万分之一,四位有效数字;而直尺只能有三位有效数字。如果按“微克/厘米”来标称的话,那精度还会再下降。

其实这都是定量分析实验的常识,只要找一本北京大学出版社的《分析化学》就能学会。


五、臆测

我对房先生唯一一点不理解的是,为什么在涉及一些实验结果时,自己没有做过实验(哪怕他把自己头发剪一截下来称一下)的情况下,会对实验结果作出臆断式的预测。头发多重、测得有多少,都敢直接猜,这是我上学的时候想都不敢想的。例如:

如果把抖落的残渣放回到它脱落之处,然后按常规方法取样,即取下一片龙袍,那么检测的结果一定与平均值1.68微克/克差不多,不会是94.1微克/克。 ……

我们只好假设每1厘米的头发约重0.1克。由此我们可以推算出课题组实际检测到的数据。例如第1厘米处,现在是21.2微克/克,则当初检测的数据应当是21.2微克÷10=2.12微克,即第1厘米(重0.1克)检测到2.12微克砷。……因此,图1第10厘米的砷含量必须改为240.4微克/克,图中其他沾染腐败尸体的砷的数据也都得缩小10倍,

还有一些则是对实验方法的无端猜疑。

3片中最重要的是后内层,它能反映光绪帝肠道的砷中毒程度,为什么只采集6个样点,而最不重要的裤子后外层却采集10个样点?且不说课题组中有专业的检测人员,就是非专业人员做实验也不可能分别采集9、6、10,而应该采集大体相同数量的样点,并且重点部位应该多采样点。我推测,课题组在每一片上采集的样点都不少于10个,但检测的数据有些太低了,不符合课题组的预期要求,被删除了,所以出现了9、6、10这数量不等的现象。……

课题组在内衣躯干只采集了4个样点,这是非常不合理的,样本太少了,不能说明问题。我认为当初至少也采集了10个样点进行检测,但结果被删除了6个不合乎课题组需要的数据。

我觉得在没有根据的情况下攻击实验人员的声誉,这挺不合适的。要是有个人没任何证据直接指责笔者,也就是司马亮,写论文史料作假,我大概会非常生气。我觉得房先生应该反躬求己一下。

房先生有一句话,我觉得非常妙,作为这一小节的总结:

其他的数据在做必要的回溯分析时,都得靠猜测,猜测得准不准,都无法证明。


结语

这文章写得已经太长。简单归纳一下房先生文章里关于科学检验这部分的错误:

不了解强度量的概念;不了解外标法的作用;不了解取样法的意义;误认为研究者要计算光绪帝体内砷的浓度;未注意内衣没有胃区;不做实验的条件下臆测实验结果。

在我看来,以上的总结,已经足够让各位自然科学学科出身的读者了解房先生的“质疑”为何无法撼动元素分析结果了。毕竟,定量分析化学之中早已提供了许多基本的关于分析实验的认知,而这只是北京大学本科一年级的知识而已,对理科生来讲并不是什么难事。只不过在我们当下,虽然科学一直被奉为最重要的意识形态之一,但事实上科学素养的教育与培养始终任重道远。有相当多的人并不具备足够的科学素养,有的可能是历史原因,例如十年动乱干扰了他们学业,有的则可能是教育体制的过错。大家也不要太过求全责备。

这篇文章没有涉及任何关于对钟里满先生的评价,也没有对房德邻先生就《清光绪帝砒霜中毒类型及日期考》的质疑进行任何辩白。这并不是因为我有所厚薄,而是因为他们所用的文献我并不了解,不足以妄议浅深。——事实上,我也并不太了解元素分析实验,我的阐释都只是常识而已。

至于所谓“历史学界对自然科学的回击”云云,年轻人们大概还是不要再提的好:本来搞历史的普遍已是“高考不仅考不过理科生,也考不过一般的文科生,只好调剂去历史”这种歧视链的下下游,要是这种“反击”被理工科的同学们看到,岂不是连地缝都难找了。我以后不希望看到有人再说“房先生打了自然科学的脸,扬眉吐气”之类的话。过去的几年里有人过了嘴瘾,只是因为理工科学生不跟你一般见识,只要有个人肯抽一小时读一下两篇文献,过的嘴瘾全都要还。“战狼式爱学科”要不得。

最后,我要郑重感谢房先生的工作和努力。没有他的质疑,《清光绪帝死因研究工作报告》这篇文献本身绝不可能获得这么大的关注度,大家也不会意识到这件发现有多么大的突破。而且他以高龄依然查阅文献,努力学习一些和自己知识体系差距很大的新东西(尽管学得不太好),我觉得这一点也很值得尊敬。

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s