
7家中国医院“跻身”全球前十!撤稿率榜单来了 学术诚信问题凸显

《自然》杂志最近发布了一份研究报告,首次从机构层面对全球论文撤稿现象进行了系统性分析。报告显示,中国山东济宁市第一人民医院以超过5%的撤稿率(2014-2024年)成为世界上撤稿率最高的科研机构。该院平均每发表20篇论文就有1篇被撤回,撤稿率超过全球平均水平50倍以上。
早在数年前,济宁市第一人民医院就出现了大规模的学术不端事件。2020年,加州学术诚信调查员伊丽莎白·比克发现了400多篇内容高度雷同、疑似来自统一论文工厂的论文,其中大部分来自中国的几十家医院,济宁市第一人民医院的论文最多,超过100篇。事件曝光后,该医院陆续发布了10份通报,涉及107篇论文和107起学术不端事件,并对相关责任人进行了处理。
在《自然》的新研究中,河北沧州市中心医院和河南大学淮河医院分别位列撤稿率榜单第二和第三名,撤稿率约为3.5%。在全球撤稿率前十的机构中,中国机构占据了七席,均是医院以及医学院。此外,巴基斯坦的加齐大学、埃塞俄比亚“亚的斯亚贝巴”理工大学、印度KPR工程技术学院也进入了前十。
《自然》的撤稿分析基于三家研究诚信公司提供的数据:Scitility的Argos、Research Signals的Signals,以及Digital Science的Dimensions Author Check。这些公司通过整合Retraction Watch的数据库、Crossref的出版数据、PubMed的索引以及期刊网站信息,构建了全球撤稿数据集。虽然不同数据来源得出的结果有差异,但中国小型医院和医学院始终占据主导地位。根据Dimensions的数据,在撤稿率超过1%的136家机构中,大约70%为中国机构,其中接近60%为医院或医科大学。
医院是学术不端的重灾区。2023年国家自然科学基金委第一批不端行为案件处理结果通报中,8起案例中有7起当事人来自各医院、医学院、医科大学。2023年第二批通报中,也有三分之一案例与医院、医学院相关。一项研究显示,被处理的人员中专业为生物医药类的占比约75.9%。
另一项通过人工智能算法识别论文工厂论文的研究发现,论文工厂最初产量每年只有几篇,至2014年已达每年上百篇,自2018年起更是跃升至每年上千篇。在SCI收录的论文中,医院是论文工厂产出论文的主要来源,占比高达67.5%,几乎所有的论文工厂论文均出自中国的医院。这些医院的问题高度相似,年轻医生为了满足职业晋升的论文要求,不得不从“论文工厂”购买伪造数据或直接发表伪造的论文。
统计过去10年的撤稿数量,排名前列的不少是中国机构。但只统计过去5年(2020—2024)撤稿数量时,印度和沙特阿拉伯的几家科研机构主导了榜单,因为它们在2023年Hindawi的撤稿潮中受到了更大影响。2023年,Hindawi发布了超过9,600篇撤稿声明,史无前例。受此影响,教育部科学技术与信息化司要求各高校开展撤稿论文自查工作,全面梳理并核实论文撤稿的原因,并严惩学术不端行为。
尽管撤稿并不是大概率事件,但在2014到2024年间,撤稿声明的增长正在加速。从2014年不到2,000增长到2023年超过12,000。这一方面是由于论文工厂的兴起,另一方面是学术侦探发现了更多问题。2023年和2024年的撤稿数据看起来较低,可能是因为这两年发表的论文还没有经过足够的时间来暴露问题。
法国图卢兹大学计算机科学家纪尧姆·卡巴纳克认为,一些领域或机构之所以拥有较低的撤稿率,可能仅仅是因为它们避免对存在的问题进行调查。他开发了一种工具用来检测学术论文中的“扭曲短语”,这些短语可能是由多次翻译或人工智能生成以逃避抄袭检测的。截至2023年8月20日,该工具已发现16,000篇引用了5个或更多此类扭曲短语的论文,但被撤稿的只有18%。
高撤稿率可能源于鼓励发表的短视政策。印度自由数据科学家阿查尔·阿加瓦尔发现,印度高撤稿率机构几乎全部集中在教育重镇泰米尔纳德邦的私立院校。在他看来,私立机构不仅鼓励学生和教师多发论文,某些情况下还为发表论文提供奖金。阿加瓦尔对25个国家的撤稿数据进行研究后发现,发文数量大量增长的国家往往撤稿率也迅速提升。这让人对目前重数量轻质量的激励制度提出质疑。