最近南开大学校长、中国工程院院士曹雪涛被曝出40多篇论文涉嫌学术造假,数据图有PS痕迹。
曹院士是免疫学大牛,在全世界的学术地位都极高!但学术界是一个特别容不得造假的地方。这一锤下去,半个科研圈都惊得信仰崩溃了。
微博网民一开始喷曹院士骗子,再喷南开药丸,后来质疑曹的这个院士头衔估计也是骗来的。
但我坦率地说,大部分网友一不知道曹院士是谁,二吃不懂学术瓜,喷得很不理性。今天请允许我以我浅薄的学术水平,在此详细分析一下曹院士的前前后后。
01 事件的时间线
事情起源于11月14日,美国生医领域学术打假专业户Elizabeth Bik在推上表示,发现某中国大牛的论文图片有问题。她讲得很隐晦,没有点名。
随后我国打假专业户方舟子直接点名:此人是南开大学校长曹雪涛院士,有18篇论文被发现数据造假。
方在推里只配了4张图,并没有指明18篇论文是哪18篇。在国内传得最多那条微博就是方舟子的机器人小号,但我看这种阴阳怪气挺不爽的。
什么“创下世界纪录”、“墙内禁止报道”、“硕士研究气功”,净胡扯。人家硕士课题是《白细胞介素Ⅱ激活的肿瘤浸润性淋巴细胞抗肿瘤作用的实验研究》。气功的事我们后面会单说。
Elisabeth将她对曹院士数据的质疑陆续发在了论文评审网站PubPeer上。简单给大家科普一下PubPeer是啥。
论文发表的流程是:科研人员做实验-写paper-投给学术期刊-审稿通过-发表。一旦正式发表,就向全世界公开了你的科研成果。
但如果你觉得其他人的成果有问题,你就可以在PubPeer上质疑他的paper。大家都可以在这讨论,作者也可以回应。
Elisabeth一口气质疑了47篇,从2003年质疑到2019年,从水刊质疑到Science和Nature子刊,问题主要包括:
有些地方两次实验结果图像竟然完全一致!好比你说你画了两幅画,竟然每个细节都一毛一样,那我只能认为你是复印的,不可能是画的;
同一个实验图中,把部分点复制粘贴了一下,就变成了新图,这属于瞎编数据;
有些图有增添、删减的PS痕迹;
还有些是纯学术提问,这不属于我们本次关注的学术道德范畴。
论文都分为Introduction /Experiment /Results & discussion /Conclusion四部分。学术伦理要求每个科研人员都必须真实地做实验,真实地记录原始数据和图像,然后再把原始数据处理成图表,最终形成自己的成果。绝对不允许自己凭空捏造数据,否则你就是在欺骗全世界了。
但曹院士的很多paper显然捏造数据了。比如下面圈出来的几坨点,这么复杂的图居然能长得一毛一样!目测一个图是实验做的,另一个图部分是凭空P的,这就是造假实锤,跟玩连连看似的。
下面圈出来的那两大坨,也是一毛一样,目测就是复制粘贴,基本没得洗。
还有个比较扯的,他们把其中一个图转了个角度以为别人就不认识了,这种造假下次得注意不要这么明显。
曹院士昨天给出了回应:“我现在刚到上海实验室,要把这些事情查一下。我知道大家关注这个事情,查完了,我会给大家一个回复。”
昨天夜里,我发现曹院士在PubPeer上亲自下场回复了。
大概意思是:Bik博士,那些paper的确是我发的。我已经把这件事列为最高优先级,仔细检查我们的原始数据和实验记录。如果调查发现有任何问题,我们会和期刊合作处理。但我对我们成果的有效性、重现性充满信心!我的确监督疏忽,这没有任何借口。我将利用这一宝贵的学习机会,不仅在推进科学方面做得更好,而且在维护科学的准确性和完整性方面也会做得更好。
看起来很有自信的样子。吃瓜群众既然想要吃这口科学的瓜,就要学会如何科学地吃瓜。鲁迅先生说过,学术瓜得吃第一手的。下面我们就去pubpeer上看看,曹院士被锤的文章究竟有多大的问题,曹本人要负多大责任。
02 就事论事,仔细分析
(1)锤他的Elisabeth是什么人?
Elisabeth是微生物和免疫领域的博士,早年在斯坦福搞了15年科研,2016年辞职专门搞学术打假[1]。
她2016年还发过一篇paper[2],专门吐槽了生物医学领域普遍有改数据的陋习,“不当图像复制(Inappropriate Image Duplication)”。
她还专门讲过国家与数据造假之间的关系:中国、印度的paper出问题的比例高,法德日美比较低。虽然很丢脸,但也没办法,就像我们平时做科研的时候碰到三哥的paper肯定都是绕着走的。
(2)曹院士的锤有多实?
先说结论:挺实的。
我上pubpeer统计了目前全部被锤的paper,记录了期刊名、发表年份、被质疑的问题、曹组同学的回应。展示如下:
一共被质疑了54篇,其中Elisabeth对学术不端质疑了47篇,主要质疑原因是一图多用和改动图片,也就是疑似把其中一张图的数据用在了其他的图里,以为别人看不出来,或者是把数据图进行了裁剪和修饰。
目前有5篇得到了曹院士或他的学生的解答,其余42篇还没下文。
我们来抽几个案例给大家说明。
比如这篇《The STAT3-binding long noncoding RNA lnc-DC controls human dendritic cell differentiation》,2014年的Science。在Supplementary里的俩图对比后发现,竟然有部分点是完全重合了!
两次实验密密麻麻的数据点居然能重叠,那真是见鬼了。可能因为是Science,曹院士昨天夜里2点亲自回复了质疑,表示虚了,这是我搞错了,我们检查了原始数据,画了个新的图。
再像这篇《HSP70L1-mediated intracellular priming of dendritic cell vaccination induces more potent CTL response against cancer》,2018年的《Cellular and Molecular Immunology 》。这刊是Nature旗下,去年8分。讽刺的是,曹院士是它的主编。
Elisabeth的质疑十分直接,你这俩长一样,显然P图了。
这篇paper的一作出来回应了,表示我躺平认错,的确就是复制错了!我们会联系编辑更正数据的。话说这刊主编不就是你老板吗!
不过其中也有一些质疑被曹组完美解决的。
比如这篇《Type I IFN inhibits innate IL-10 production in macrophages through histone deacetylase 11 by downregulating microRNA-145》,2013年的Journal of immunology,5分。Elisabeth认为框住的图长得太像了。
此时一作Li Lin出现,一波原始数据直接甩出,并耐心解释了为啥它们就是长得像。
Elisabeth听完表示服气。
还有的paper,Elisabeth在这没有质疑任何学术造假,而是单纯问了个学术问题。比如这篇《K33-linked polyubiquitination of Zap70 by Nrdp1 controls CD8(+) T cell activation》,2015年的Nature Immunology。
结果被不知道哪来的网友很不客气地怼了一楼
在《Platelets promote allergic asthma through the expression of CD154》这篇里,Elisabeth质疑两个图长得太像了。
此时出现了两个路过群众,表示这俩图压根不像,你不要逮着一篇质疑一篇。
截至目前,大部分质疑都还没有给出解释。
(3)曹院士要负多大的责任?
首先,改数据是实锤的。曹组的人再怎么解释搞错了、复制错了都很虚无。因为显然不是简单的意外出错,而是主观意愿上的修改。
这些paper曹院士都是通讯作者。在论文中,“第一作者”意思是做实验写论文的那个学生,“通讯作者”意思是导师。你手下博士生搞这些乱七八糟的学术不端,导师肯定是要背锅的。
但其实根据我搞科研的经验,曹院士肯定不会亲自动手或者授意。院士在中国就是一个大山头的存在,当了院士后都不会亲自搞科研了,而是管着手下很多小老板,小老板具体负责带博士。
以曹的学术地位,真没必要改数据,大概率是小老板所为。
其次,修改的数据很可能不影响paper的核心观点,审稿人乍一看也看不出来问题,于是曹组的人用P图蒙混过关。
40多篇出问题,说明整个组的风气从曹院士带头往下都坏了。要说曹院士对手下人P图不知情,我是不相信的。从2003年这种陋习就被默许保留到了现在,曹院士这个锅得好好锤。
(4)南开大学要负责任吗?
不,和南开一点关系都没有。曹是2017年去南开当的校长,目前被锤的所有paper的通讯单位都是第二军医大学,南开纯躺枪。网友们不要乱黑南开!
不过我听说南开学子对他的评价还蛮正面的。如果粉丝中有南开的可以分享一下对校长的感想……
03 曹院士这个人水不水?
(1)履历不水,甚至是极其天才
曹雪涛生于1964年,17岁在第二军医大学读本科,22岁读硕,师从著名免疫学教授叶天星。26岁硕士答辩,在场所有专家看了他论文后拍案叫绝,纷纷表示你这水平都可以博士毕业了!
于是曹院士一举完成了26岁硕士毕业,拿到博士学位这种骚操作。这是真本事。
此后人生继续跟开了挂一样。28岁曹雪涛被破格晋升为当时我国最年轻的医学教授,32岁晋升为博士生导师,41岁成为当时最年轻的中国工程院院士。
他不止是中国的院士,在中科院的官网介绍中,曹同时是美德法英四个国家的科学院/医学科学院外籍院士,学术水平是在世界范围内被认可的。
他的学术之路,也的确是一篇一篇paper发出来的。他发表过200+篇paper,总被引1万+次,是2018年Elsvier中国高被引学者,CNS大满贯。他要是骗子,CNS编委难道全都没看出来?
曹雪涛98年当杰青,2000年当长江,03年得国家自然科学二等奖,973首席,05年评院士,医学免疫学的教材就是他编的。
所以我认为,曹院士的水平是大牛无疑,虽然学术污点是抹不掉了。除非他真是一路骗出来这么多paper,那我科研信念是真要崩塌了。
(2)他早年搞气功研究是黑点?
这次除了被质疑论文P图外,曹院士在1989年发表的一篇气功的论文也被扒出来嘲讽。
说实话,我觉得背锅的主要是那个时代。
那时候全国都在兴气功热,国内可能有1亿人都在练气功,钱学森也搞,还牵头搞。在1986年的时候,成立了气功研究学会,钱学森就是名誉理事长。
热火朝天练气功的中国人所以这篇论文应该就是特殊背景下的特殊产物。那年曹25岁,正在读研,跟着老板做了篇骗人的水文。我们倒也不必就此把曹院士的学术水平钉死在气功上。
(3)这么多论文造假,他的院士也有水分?
这个我觉得得摆事实。PubPeer上他被质疑的47篇论文中有10篇是2005年评院士前发表的。
所以评院士之前的paper也的确出现了学术不端嫌疑,说明评院士之前就已经有掺假了。
我周围认识曹院士的人对他的评价是:能力强,人品好。总之我倾向于认为,曹院士是牛逼科学家,但手下带的人多了,学术伦理渐渐恶化,带出了P图的恶劣风气。
04 科研环境的水化
这件事让我感到很痛心,但我作为一个水博想结合我自身的感受冒昧讲讲当今的科研环境。
坦率地说,我感觉灌水难度是物理>化学>材料>生物/医学。生医里面的玄学因素实在太多了,P个图根本看不出来。还有些科研人员,会先想好结论,再强行把数据往结论上做。
所以前有韩春雨NgAgo无法重复,后有李红良猴子实验数据争议,总之是门很玄的东西。
但真正的科研之路,是漫长、艰苦和枯燥的。
你今天制了个样,准备烘干打红外。结果1700的羰基峰很漂亮,但样品没烘干净,3000以上有水包!好不容易做出来的样品,重做是不可能重做的。怎么办?用基线把水峰P掉咯,反正不影响我的核心结论。
你对材料进行了modification,理论上能降低表面粗糙度,于是你约了AFM。结果样品还是很粗糙!好不容易做出来的样品,重做是不可能重做的。怎么办?当然是精心挑一个光滑的地方拍AFM咯,我的理论不可能出错。
你改进了一种反应物,理论上能把表面的Nodule结构变成Sphere结构,你兴奋地送了SEM。结果发现只找到了3个Sphere。好不容易做出来的样品,重做是不可能重做的。那当然是强行拍一个Sphere宣布改进成功咯。
是啊!我心里的那些小九九谁知道呢?我做了十次实验,挑好的三次取平均加个Error bar有什么问题?我只不过是个水文混毕业的!老板看不出来,审稿人又不可能重复我的实验,谁管我啊!
每一步都这样,科研还搞个屁。现在中国硕博圈子里划水的人不要太多,大家都只想着灌水毕业。你说我们要为人类科学的进步做贡献?抱歉,博士工资一千五,青椒竞争那么苦,反正要转计算机,要做贡献你第一。
曹院士的问题,只是是近年来科研界急功近利,以高档论文,以项目经费论英雄,博士压力极大而导致不良结果的缩影。
然而时代越难,越要警惕。
我小时背过一句话,人之持身立事,常成于慎,而败于纵。科研工作更是容不得半粒沙子。如果19世纪的大厦是倾覆于伟大的两朵乌云,而21世纪的大厦是倾覆于豆腐渣工程,就太讽刺了。
希望曹院士早日公布自查结果,希望科研工作者们引以为戒,与你我共勉。
参考文献
1、https://www.the-scientist.com/news-opinion/eye-for-manipulation--a-profile-of-elisabeth-bik-65839
2、Bik E M, Casadevall A, Fang F C. The prevalence of inappropriate image duplication in biomedical research publications[J]. MBio, 2016, 7(3): e00809-16.
3、Wang P, Xue Y, Han Y, et al. The STAT3-binding long noncoding RNA lnc-DC controls human dendritic cell differentiation[J]. Science, 2014, 344(6181): 310-313.
4、Liu S, Yi L, Ling M, et al. HSP70L1-mediated intracellular priming of dendritic cell vaccination induces more potent CTL response against cancer[J]. Cellular & molecular immunology, 2018, 15(2): 135.
5、Lin L, Hou J, Ma F, et al. Type I IFN inhibits innate IL-10 production in macrophages through histone deacetylase 11 by downregulating microRNA-145[J]. The Journal of Immunology, 2013, 191(7): 3896-3904.
6、Yang M, Chen T, Li X, et al. K33-linked polyubiquitination of Zap70 by Nrdp1 controls CD8+ T cell activation[J]. Nature immunology, 2015, 16(12): 1253.
7、Tian J, Zhu T, Liu J, et al. Platelets promote allergic asthma through the expression of CD154[J]. Cellular & molecular immunology, 2015, 12(6): 700.