论文部分内容阅读
2001年,一个流言飘荡在希腊的医院里:年轻的住院医师为了看谁开刀更快,将很多阿尔巴利亚移民误诊为阑尾炎,好拿他们做手术来比赛。这个说法引起了希腊约阿尼纳大学医学院附属教学医院一位刚毕业的年轻医生塔西奥尼的兴趣。当她与同事们谈论这则八卦时,正好被路过的一位像“憨豆”一样宽额大眼、留着卓别林式的小胡子的教授听见。这名长相令人印象深刻的教授名叫约翰·约阿尼迪斯,是医学院卫生学与流行病学系的负责人。约阿尼迪斯便问她,可否想办法证明这个流言是真的。
这番偶然的谈话引发了一项正式的研究。在约阿尼迪斯等人的帮助下,塔西奥尼调查了希腊的6家医院,结果发现,尽管原因不明,被误诊割除阑尾的阿尔巴尼亚人确实是希腊患者人数的三倍。“几乎没有学术期刊愿意发表我们的结果”,塔西奥尼说,因为它很难归类于任何一个医学领域。还算幸运,最终,他们设法将论文发表在全球最大的开放获取出版商BMC旗下的《健康服务研究》上。他们的结论是,在希腊定居的阿尔巴尼亚人面临着更高的阑尾炎误诊风险。这预示着,受社会经济、文化与语言等因素影响,移民人口遭受的医疗服务不平等问题值得关注。
这项看起来有些“偏门”的研究,是约阿尼迪斯的学术生涯“偏离正轨”的序曲。他生在纽约,长在希腊,就读于两国最好的大学的医学院,博士毕业后先是探索罕见病,后来又转向人类基因组流行病学研究。但“阑尾炎研究”给予他新的灵感:医学之外的因素会影响医生的决策从而导致错误产生——尽管连他们自己可能都没意识到,那么在科学领域是不是也是如此?他开始从常规科研工作中挤出部分精力,和一群年轻的临床医生与医学博士一道,着手一项新课题——对“研究”本身加以研究,以科学的手段甄别“坏科学”。如今,这项看起来离经叛道又易招惹众怒的工作终于登堂入室,成为正儿八经的学术命题:2014年3月底,美国斯坦福大学成立了由约阿尼迪斯领衔的“元研究创新中心(METRICS)”,向“坏科学”正式宣战。
“坏科学”不完全等同于造假。2014年年初,国际科学界发生了一件大事:日本美女科学家小保方晴子在英国《自然》杂志上发表论文称,他们采用非常简单易行的办法,培育出了能分化为多种细胞的新型“万能细胞STAP”。很多人对此兴奋不已,认为这一研究直接挑战了两年前获得诺贝尔奖的日本科学家山中伸弥的成果,是干细胞领域的“世纪大发现”。但在今年4月,日本方面宣布,论文存在造假行为。尽管调查认为,造假不直接否定研究本身,结论是否成立还需要更多科学实验来验证,但至今,国际同行都没有成功重复小保的实验,因此,很多人已经开始怀疑小保方晴子的研究从根本上就是个错误。
在科学领域,衡量你的发现能否成立的金标准就是可重复,即别人按照你的方法做实验能得到相同的结果。TetraLogic制药公司的首席科学家格伦·比格利,曾经做过这样一个测试:他们复制了癌症领域53篇具有里程碑意义的论文里的实验,结果有47个都无法重现结果。在这些无法重复的实验中,甚至有一部分还得到了那些当初作出原创发现的科学家本人的帮助。
因此,小保方晴子的案例实际上并不罕见。这也是约阿尼迪斯要研究的问题:生物医学领域充斥着大量不可复制的、错误的、无用的甚至虚假的研究与发现,也就是他所说的“坏科学”。
在食品里添加荷尔蒙与维他命,可对某种疾病有疗效或具有抗癌作用,每天一片阿司匹林,对心脏有好处——约阿尼迪斯宣称,这些统统都是假的,根本经不住更大范围的科学实验的检验。根据2005年他在《美国医学会杂志》上发表的一篇论文,在生物医学领域,大部分公开发表的文章都是完全错误的或者被夸大了的。《时代》周刊对此的报道有一个更加简明又惊悚的标题:“90%的医学研究都是错的!”《柳叶刀》杂志最近也有文章指出,在2010年,有85%的全球医学研究经费共计2000亿美元,都被惊人地浪费在了那些设计有缺陷、多余的、而且从未发表或者报道甚少的研究上。
对此,约阿尼迪斯解释说,造成这个现象的原因,并非是科学家们有意作假,而是他们的试验设计有瑕疵,或者他们使用了不被承认的数据。因此,他希望做一些实证研究,找出目前科研出问题的原因所在,以及如何去矫正它。
做这样的分析,需要有坚实的数学基础。而约阿尼迪斯恰恰具备这样的优势:在雅典大学读书时,他曾经获得了希腊数学学会的国家奖。根据他分析,在医学研究中被广泛使用的统计方法,其实是个非常脆弱的体系。如果一项研究的目的是考察某种药物对人的健康是否有好处,而你又希望能证明有好处的话,你将很容易做到这一点。
这首先是因为,现在大部分医学研究的效应其实都是比较微弱的,因为“不微弱”的效应早就被别人发现了。再者,也许一个病人的病情并没有什么明显好转,但因为科学家希望这个药物有效,他也许会刻意寻找好转的证据,因此可能会把本来没什么好转的病人当成好转的病人。
这就是人类无意识的偏见对科学研究的影响。约阿尼迪斯强调说,科学家总有要打破常规找到新发现的雄心,受此影响,很多假设从一开始就已经包含了很高的错误几率。再加上人类的本能就是只看到他们想看到的,这种偏见造成的偏差几乎是无法避免的。因此,即使不存在任何故意的动机,科学家也会推动数据分析工作朝着有利于他们结论的那一方向前进,哪怕这一解释只是勉强行得通。
根据约阿尼迪斯的计算,如果某一微弱效应有10%,而科学家的偏见有30%的话,你的实验得到正确结论的概率只有20%。他将这一基于数学原理的分析写成文章,发表在2005年的《美国科学公共图书馆》(PLoS)杂志上。这篇名为“为什么大多数公开发表的发现都是错的”文章,迄今访问量已逾百万次,成为PLoS上最热门的文章之一。
造成科学研究走偏的原因还包括,约阿尼迪斯说,对日益缩水的科研经费的激烈争夺,制药公司的商业利益影响,以及此类实验的设计本身存在缺陷——都是小样本而非大样本,以及“什么才算是有统计学上的显著意义”这一标准的日渐松弛,这一效应被大大地放大了。从统计学角度来看,一个更有趣的悖论则是:越是热门的研究领域,同一个问题研究的人越多,出错的可能性就越大。
将所有这些因素综合起来考虑,约阿迪尼斯发明了一套数学模型,用于验证一项研究是否可信。但令约阿尼迪斯感到忧虑的是,这些错误的结论一旦发表,它们在学界造成的坏影响就难以清除。比如,10年前,在美国和欧洲曾有一股风潮,要寻找诸如导致抽烟、抑郁、肥胖和哮喘等问题的相关基因。但实际上,只有极少部分的疾病可以找到直接相关的致病基因之外,大部分疾病的发病因素是错综复杂的,难以单从基因上找到根源。后来,欧美这些研究只有1%的成果被证明是有意义的。但直到今天,约阿尼迪斯指出,仍有大量科学家在这个领域白白地耗费精力,其中,60%的“无用研究”都来自于中国。
约阿尼迪斯认为,从根本而言,是目前对科学家的评判标准存在问题。他说“科学共同体应当允许科学家说:‘我已经非常努力踏实地工作了,但就是找不到任何有价值的发现。’只要他们努力工作,就不应当受到拿不到科研经费的惩罚。科学是一项高贵的事业,但也是低产的事业。人们应当明白这一点:尽管有无数科学家付出了大量努力,只有,依然只有极少一部分的医学研究成果可以提高医疗水平和改善人类的生命质量。”
这番偶然的谈话引发了一项正式的研究。在约阿尼迪斯等人的帮助下,塔西奥尼调查了希腊的6家医院,结果发现,尽管原因不明,被误诊割除阑尾的阿尔巴尼亚人确实是希腊患者人数的三倍。“几乎没有学术期刊愿意发表我们的结果”,塔西奥尼说,因为它很难归类于任何一个医学领域。还算幸运,最终,他们设法将论文发表在全球最大的开放获取出版商BMC旗下的《健康服务研究》上。他们的结论是,在希腊定居的阿尔巴尼亚人面临着更高的阑尾炎误诊风险。这预示着,受社会经济、文化与语言等因素影响,移民人口遭受的医疗服务不平等问题值得关注。
这项看起来有些“偏门”的研究,是约阿尼迪斯的学术生涯“偏离正轨”的序曲。他生在纽约,长在希腊,就读于两国最好的大学的医学院,博士毕业后先是探索罕见病,后来又转向人类基因组流行病学研究。但“阑尾炎研究”给予他新的灵感:医学之外的因素会影响医生的决策从而导致错误产生——尽管连他们自己可能都没意识到,那么在科学领域是不是也是如此?他开始从常规科研工作中挤出部分精力,和一群年轻的临床医生与医学博士一道,着手一项新课题——对“研究”本身加以研究,以科学的手段甄别“坏科学”。如今,这项看起来离经叛道又易招惹众怒的工作终于登堂入室,成为正儿八经的学术命题:2014年3月底,美国斯坦福大学成立了由约阿尼迪斯领衔的“元研究创新中心(METRICS)”,向“坏科学”正式宣战。
什么是坏科学
“坏科学”不完全等同于造假。2014年年初,国际科学界发生了一件大事:日本美女科学家小保方晴子在英国《自然》杂志上发表论文称,他们采用非常简单易行的办法,培育出了能分化为多种细胞的新型“万能细胞STAP”。很多人对此兴奋不已,认为这一研究直接挑战了两年前获得诺贝尔奖的日本科学家山中伸弥的成果,是干细胞领域的“世纪大发现”。但在今年4月,日本方面宣布,论文存在造假行为。尽管调查认为,造假不直接否定研究本身,结论是否成立还需要更多科学实验来验证,但至今,国际同行都没有成功重复小保的实验,因此,很多人已经开始怀疑小保方晴子的研究从根本上就是个错误。
在科学领域,衡量你的发现能否成立的金标准就是可重复,即别人按照你的方法做实验能得到相同的结果。TetraLogic制药公司的首席科学家格伦·比格利,曾经做过这样一个测试:他们复制了癌症领域53篇具有里程碑意义的论文里的实验,结果有47个都无法重现结果。在这些无法重复的实验中,甚至有一部分还得到了那些当初作出原创发现的科学家本人的帮助。
因此,小保方晴子的案例实际上并不罕见。这也是约阿尼迪斯要研究的问题:生物医学领域充斥着大量不可复制的、错误的、无用的甚至虚假的研究与发现,也就是他所说的“坏科学”。
在食品里添加荷尔蒙与维他命,可对某种疾病有疗效或具有抗癌作用,每天一片阿司匹林,对心脏有好处——约阿尼迪斯宣称,这些统统都是假的,根本经不住更大范围的科学实验的检验。根据2005年他在《美国医学会杂志》上发表的一篇论文,在生物医学领域,大部分公开发表的文章都是完全错误的或者被夸大了的。《时代》周刊对此的报道有一个更加简明又惊悚的标题:“90%的医学研究都是错的!”《柳叶刀》杂志最近也有文章指出,在2010年,有85%的全球医学研究经费共计2000亿美元,都被惊人地浪费在了那些设计有缺陷、多余的、而且从未发表或者报道甚少的研究上。
对此,约阿尼迪斯解释说,造成这个现象的原因,并非是科学家们有意作假,而是他们的试验设计有瑕疵,或者他们使用了不被承认的数据。因此,他希望做一些实证研究,找出目前科研出问题的原因所在,以及如何去矫正它。
无意识的偏见
做这样的分析,需要有坚实的数学基础。而约阿尼迪斯恰恰具备这样的优势:在雅典大学读书时,他曾经获得了希腊数学学会的国家奖。根据他分析,在医学研究中被广泛使用的统计方法,其实是个非常脆弱的体系。如果一项研究的目的是考察某种药物对人的健康是否有好处,而你又希望能证明有好处的话,你将很容易做到这一点。
这首先是因为,现在大部分医学研究的效应其实都是比较微弱的,因为“不微弱”的效应早就被别人发现了。再者,也许一个病人的病情并没有什么明显好转,但因为科学家希望这个药物有效,他也许会刻意寻找好转的证据,因此可能会把本来没什么好转的病人当成好转的病人。
这就是人类无意识的偏见对科学研究的影响。约阿尼迪斯强调说,科学家总有要打破常规找到新发现的雄心,受此影响,很多假设从一开始就已经包含了很高的错误几率。再加上人类的本能就是只看到他们想看到的,这种偏见造成的偏差几乎是无法避免的。因此,即使不存在任何故意的动机,科学家也会推动数据分析工作朝着有利于他们结论的那一方向前进,哪怕这一解释只是勉强行得通。
根据约阿尼迪斯的计算,如果某一微弱效应有10%,而科学家的偏见有30%的话,你的实验得到正确结论的概率只有20%。他将这一基于数学原理的分析写成文章,发表在2005年的《美国科学公共图书馆》(PLoS)杂志上。这篇名为“为什么大多数公开发表的发现都是错的”文章,迄今访问量已逾百万次,成为PLoS上最热门的文章之一。
造成科学研究走偏的原因还包括,约阿尼迪斯说,对日益缩水的科研经费的激烈争夺,制药公司的商业利益影响,以及此类实验的设计本身存在缺陷——都是小样本而非大样本,以及“什么才算是有统计学上的显著意义”这一标准的日渐松弛,这一效应被大大地放大了。从统计学角度来看,一个更有趣的悖论则是:越是热门的研究领域,同一个问题研究的人越多,出错的可能性就越大。
将所有这些因素综合起来考虑,约阿迪尼斯发明了一套数学模型,用于验证一项研究是否可信。但令约阿尼迪斯感到忧虑的是,这些错误的结论一旦发表,它们在学界造成的坏影响就难以清除。比如,10年前,在美国和欧洲曾有一股风潮,要寻找诸如导致抽烟、抑郁、肥胖和哮喘等问题的相关基因。但实际上,只有极少部分的疾病可以找到直接相关的致病基因之外,大部分疾病的发病因素是错综复杂的,难以单从基因上找到根源。后来,欧美这些研究只有1%的成果被证明是有意义的。但直到今天,约阿尼迪斯指出,仍有大量科学家在这个领域白白地耗费精力,其中,60%的“无用研究”都来自于中国。
约阿尼迪斯认为,从根本而言,是目前对科学家的评判标准存在问题。他说“科学共同体应当允许科学家说:‘我已经非常努力踏实地工作了,但就是找不到任何有价值的发现。’只要他们努力工作,就不应当受到拿不到科研经费的惩罚。科学是一项高贵的事业,但也是低产的事业。人们应当明白这一点:尽管有无数科学家付出了大量努力,只有,依然只有极少一部分的医学研究成果可以提高医疗水平和改善人类的生命质量。”