zl程序教程

您现在的位置是:首页 >  IT要闻

当前栏目

PNAS: 论文越多,科学进展越慢

2023-04-18 14:45:07 时间

Published:October 4, 2021

注:

前两天在朋友圈看到这篇文章,内容正好和我最近一些体会和想法契合,于是分享出来。

摘要:

科学家和论文数量的增加是否以及如何转化为知识的进步还不清楚。

本文首先提出一个理论论证:

为什么一个领域每年发表的太多论文会导致停滞而不是进步。新论文的泛滥可能会剥夺审稿人和读者充分认识和理解新想法所需的认知能力。许多新想法之间的竞争可能会阻碍集中注意力到一个有希望的新想法。

然后展示了支持这一理论预测的数据:

当一个科学领域每年发表的论文数量增加时,被引用的论文将不成比例地流向已经被充分引用的论文;被引用最多的论文名单变得僵化。新论文不太可能被高度引用,即使被高度引用,也不是通过一个逐渐积累注意力的聚集过程。新发表的论文不太可能扰乱现有的工作。

这些发现表明,大型科学领域的进展可能会放缓,甚至被被困在现有的标准中。可能需要改变科学工作如何产生、传播、消费和奖励的政策措施来推动这些领域进入新的、更肥沃的研究领域。

Signifiance:

科学领域的规模可能阻碍新思想的产生。通过对241个学科9000万篇论文的18亿次引用进行分析,发现大量论文的泛滥并不会导致某一领域中心思想的转变,而是会导致思想的僵化。在每年发表大量论文的领域,学者们面临着发表、阅读和被引用的困难,除非他们的工作参考文献已经被广泛引用。包含潜在重要贡献的新论文不能通过渐进的扩散过程获得全领域的关注。这些发现表明,如果科学数量增长(包括科学家、研究所和论文的数量)不能与培养破坏性学术和关注新思想的结构相平衡,那么基础进步可能会受到阻碍。

对科学进步直截了当的看法是越多越好。一个领域发表的论文越多,科学进步的速度越大;研究人员越多,覆盖的领域就越多。即使不是每一篇文章的影响都是惊天动地的,但每一篇文章都可以为沙堆贡献一粒沙,增加雪崩的可能性,科学景观被重新配置,新的范式出现在结构探究中。发表更多的论文也增加了至少有一篇论文包含重要创新的可能性。一个颠覆性的新想法可能会破坏现状,吸引以前工作的注意力,并获得最大量的新引用。

政策反映了这种“越多越好”的观点。学者的评价和奖励取决于他们的生产力。在一段时间内发表许多文章是获得终身职位和晋升的最可靠的途径。文章数量仍然是大学和国家的衡量标准,比较集中在发表论文、专利、科学家和花费的资金的总数上。

“质量”也是主要的定量判断。引用次数用于衡量某一领域内个人、团队和期刊的重要性。在论文层面,普遍假设是最好和最有价值的论文将吸引更多的关注,塑造该领域的研究轨迹。

然而,我们预测,当每年发表的论文数量增长非常大时,新论文的快速流动会迫使学术上的注意力集中在已经被广泛引用的论文上,而限制对不太成熟的论文的关注——即使是那些具有新颖、有用和潜在变革思想的论文。新出版物的泛滥非但没有加速领域范式的周转,反而巩固了被引用次数最多的论文,阻碍了新作品成为被引用次数最多、最广为人知的领域经典。

本研究的重点是领域大小的影响:在给定的年份中,一个领域发表的论文数量。此前的研究发现在一系列学科中,引文不平等现象正在增加,这种不平等至少部分地由优先依附 (prefer-ential) 的过程驱动。然而论文并不总是能保持多年来的引文水平和排名。颠覆性论文可能会让之前的工作黯然失色,而引文数量的自然波动可能会打乱排名。我们预测,当领域很大时,被引用最多的论文变得根深蒂固,在未来获得不成比例的被引用份额。新论文不可能通过优先依附的过程积累引文而成为经典。新发表的论文很少会扰乱现有的学术成果。

这些预测有两个机制。首先,当许多论文在短时间内发表时,学者们被迫求助于启发式方法来继续理解该领域。审稿人和读者只处理与现有范例相关的新工作,而不是考虑有趣的新想法。一个不符合现有模式的新想法不太可能被发表、阅读或引用。面对这种情况,作者们被迫将自己的作品与知名论文紧密联系起来,这些知名论文就像“知识徽章(intellectual badges)”一样,明确了新作品应该如何理解,而不鼓励他们去研究那些不能轻易与现有标准联系起来的过于新颖的想法。突破性的新想法被产生、发表和广泛阅读的可能性都在下降,事实上,每一篇新论文的发表都会不成比例地增加已经被引用最多的论文的引用。

第二,如果新想法的出现速度太快,新想法之间的竞争可能会阻止任何新想法被广泛地了解和接受。要了解为什么会这样,可以考虑一个想法在一个领域中传播的沙堆模型。当沙子掉在沙堆慢慢地,一次一粒,随时间的沙堆达到无尺度临界状态,一粒沙子下降会引发整个区域的雪崩。但是当沙子快速下降,相邻的小型雪崩相互干扰,没有一粒沙子可以引发整个区域的移动。砂粒掉落的速度越快,每一粒砂粒所能影响的区域就越小。如果论文出现速度过快,就不会有新的论文通过局部扩散和优先附着的过程逐渐上升为新的标准。

上述论点产生了六种预测,其中两种预测认为,被引用次数最多的论文将持续占据主导地位,新发表的论文将毫无价值,新发表的论文的破坏性将下降。相对于某一领域每年发表较少的论文,该领域每年发表较多的新论文:

1)新被引论文更倾向于引用被引最多的论文,而不是被引较少的论文;

2)被引用次数最多的论文名单每年变化不大——标准僵化了;

3)新论文最终成为标准的概率会下降;

4)确实能跻身被引用最多论文之列的新论文,不会通过逐渐累积的扩散过程达到这一目的;

5)新发表的论文发展现有科学思想的比例增加,破坏现有科学思想的比例减少;

6)一篇新论文具有高度破坏性的可能性将会下降。

方法

利用Web of Science数据集,分析1960年至2014年间发表的论文。最终得到的数据集包含90,637,277篇论文和1,821,810,360次引用。学科分类中有241个主题,将这些主题作为实地分析的基础。感兴趣的主要变量是焦点论文,即从同一主题的新发表的论文中获得的年度引用数。计算1−decay rate(λ)。

结果

结果证明了上述的每个预测。具体见下面四个图。

随着领域的扩大,被引用次数最多的论文将长期占据主导地位,在引文分布中占据首位。相比之下,新论文被高度引用的可能性降低,无法随着时间的推移逐渐积累关注。发表的论文倾向于发展现有的想法,而不是破坏它们。破坏性的新研究流很少。

领域大小的引文动态变化:经典文章具有持久的优势。

X轴(以10为基数)为在学科年(N)内发表的论文数量。每个点代表Web of Science中的一个学科年。线条是10个最大的非多学科学科的趋势线。(A)按学科-年份划分的引文-引用份额不平等基尼系数。在某一领域发表的论文越多的年份里,被引用次数最多的论文被引用的比例就越大。(B)将被引用次数最多的前50名与相邻年份之间的斯皮尔曼相关性按学科年份排序。某一领域发表的论文越多,被引用次数最多的论文排序越稳定。

引用衰减率。

X轴为(以10为基数)该学科年度发表的论文数量(N)。(A - C) 1−decay rate(λ)为前百分位(A)、第二百分位(B)和第十百分位(C)在10个最大领域中被引用最多的论文(图1为图例)。除了被引用次数最多的论文外,其他论文在大领域的平均被引用次数都在逐年减少。(D) 1 -λ。在所有大的领域中,只有被引次数最多的论文每年保持其平均被引率水平;其他所有论文平均被引用的次数逐年减少。

成为经典的新论文。

X轴为学科年度(Np)发表的论文数量(以10为基数)。每个点代表1980年的一个主题。线是2000年及更早出版的10个最大的非多学科学科的线性趋势(图例见图1)。(A)一篇论文进入被引用最多文章前0.1%的概率(p,单位%)。当一篇新发表的论文在同一年有很多新论文时,其被引用次数达到该领域前0.1%的可能性就会降低。(B)一篇论文达到被引用最多文章的前0.1%的中值年数(τ),前提是达到前0.1%。同一年发表的论文并没有逐渐积累到被引用的前0.1%。

破坏性研究的倾向。

X轴为学科年度(Np)发表的论文数量(以10为基数)。每个点代表一个科目年份。(A) 破坏性指数D的比例(p)大于0 (D > 0;蓝点和线),且小于0 (D < 0;红点和线)。多年来发表的论文往往是发展现有的观点,而不是引入颠覆性的新观点。(B)在学科年度内发表的论文比例(p),破坏度排名前5% (D≥0.0256)。在同一年发表的论文和其他许多同类的论文不太可能具有高度的破坏性。

讨论

这些发现使我们对科学方向感到不安。如果有太多的论文在短时间内发表,新想法就无法与旧想法进行仔细的对比,积累优势的过程就无法选择有价值的创新。今天科学事业以数量和度量为导向的“多就是好more-is-better”的本质,可能会阻碍最大科学领域的根本进步。由于文章在线访问的方便,期刊的扩散和期刊等级的模糊等都会加剧这个问题。

减少数量是不可能的。禁止出版年刊、关闭期刊、关闭科研机构、减少科学家数量等政策不现实。即使一位科学家全心全意地同意我们研究的含义,考虑到他们的职业前景以及他们的同事和学生的职业前景受到损害,削减他们的产出是不切实际的。在不改变其他激励因素的情况下限制文章数量,可能会阻碍新颖、重要的新思想的发表,从而不利于低风险、以经典为中心的工作。

尽管如此,在学术研究的进行、传播、消费和奖励方式上的一些改变可能有助于加速大型科学领域的基础进步。一个更清晰的期刊等级体系,让最负盛名、参与度最高的期刊刊登一些不那么传统的文章,可以培养破坏性的学术,把注意力集中在新颖的想法上。奖励和晋升制度,尤其是在最负盛名的机构,避开数量衡量,看重更少、更深入、更新颖的贡献,可以减少争夺某个领域关注的论文泛滥,同时激发不那么经典、更有创新性的工作。一种被广泛采用的相对于已有标准的新颖性衡量方法可以为论文评估、资助申请和学者提供有帮助的指导。改进的研究生培训可以推动未来的研究人员更好地欣赏那些不那么根植于既定标准的新奇想法。这些措施虽然不容易在大领域中实施,但可能有助于将学术界从现有标准推向更新颖的前沿。

尽管被引用最多的文章保持不变,但进步可能仍然在发生。虽然《molecular biology》中被引用最多的文章(22篇)发表于1976年,并且自1982年以来每年都是被引用最多的文章,但很难说这个领域已经停滞不前了。最近的证据表明,现在需要更多的研究努力和资金来产生类似的科学成果——生产力正在急剧下降。我们会不会因为被困在过度内卷的学习领域而错过了丰富的新范式?