为什么名校论文发表率更高?研究人员刷了160万篇论文数据发现:只是因为劳动力多
白交 发自 凹非寺 量子位 | 公众号 QbitAI
为什么研究机构越知名,它发表的论文越多?
最新研究表明,无关天赋,无关声望,只是因为他们拥有更多的劳动力。
来自科罗拉多大学博尔德分校的研究人员,调取262家美国研究机构78802名终身教职员工的160万篇论文数据,得出了以上结论。
其研究成果登上了Science Advances。
研究一出,在学界引发了不小的热议,一作推特共有3000+点赞。
网友直呼:Good Job!
不过也有网友认为,这项研究还需要进一步解释:如何区分是先有鸡还是先有蛋?(是否有证据表明名校先有名师)
而且因为本项研究主要针对受资助的劳动力,有人问到:无偿劳动力在其中的作用呢?
研究人员回应称,在他们的分析中并没有发现无偿劳动力,对团队负责人的比例和生产力有显著影响。
论文内容
科学生产力,通常可以用出版物数量来粗略量化,是科学进步的基本衡量标准。
以往的研究表明,享有盛誉的工作环境可以通过多种因素来影响生产力的提高,比如增加个人的研究时间、降低教学压力、更高的报酬激励、跨部门合作等等。
其中他们已经发现,劳动力和科学生产力之间存在一定的相关性,但只是基于小样本、或者个别学科的情况。
可用劳动力对科学生产力到底有多大推动,以及这种影响是否因学科而异,尚不得而知。
基于这样的背景,研究人员分析了Web of Science数据库的大量数据——
来自25个学科的78802位研究人员撰写的160万篇已发表文章。
研究人员首先量化了两个关键因素:生产力和劳动力。
一方面,建立了一套经验性的知名度-生产力模式,并将总生产力分解为小组和个人组成部分。
结果发现,知名机构有更多优秀受资助的劳动力(博士/博士后)。
另一方面,还量化了劳动力随着知名度的系统性增长。在可用劳动力与团队规模之间建立因果关系。
△可用劳动力对群体规模和群体生产力的影响
基于以上结果汇总,他们得到了一张因果论证图。
可简单总结为:
- 团队声望与科学生产力之间的关联性,是由可用劳动力来解释的;
- 团队规模本身就与生产力有着天然而又紧密的关系——更多可用劳动导致更大的研究小组规模,与所谓的声望无关;
- 更大的小组规模可以推动小组负责人更高的发表率。
也就是说,越有名望的学校往往会发表更多的论文,只是因为他们有更多的人(本科生、研究员、博士后)可以在研究团队中工作,与本身的效率、天赋等因素无关。
研究人员还给一些知名度低的研究机构提了些建议,可以考虑增加研究员的数量,来提高发表率。
研究团队
本项研究来自科罗拉多大学博尔德分校的四名研究人员。
第一作者Sam Zhang是应用数学系博士研究生,与此同时他还是一位计算机科学家和数据科学家。
他的博士论文研究是关于学界的不平等现象,曾在微软纽约研究院计算社会科学小组实习过。
其余共同作者来自计算机科学系。
此前他们还量化了美国终审教职的招聘和层级关系,并创建了一个大型网络,其研究登上了Nature。
此研究一出,不少人认为Make Sense,但存在一个问题:到底是先有鸡还是先有蛋,如何证明名校先有名师?
对于这项研究你怎么看呢?
论文链接: https://www.science.org/doi/10.1126/sciadv.abq7056#supplementary-materials 参考链接: https://twitter.com/_szhang/status/1593712551660990465 https://www.nature.com/articles/s41586-022-05222-x https://sam.zhang.fyi/html/about/
— 完
相关文章
- 【P4论文分享】基于P4的可编程数据平面研究及其应用
- 莱斯大学胡侠团队 ICML 2022 杰出论文: 新型图数据增强方法 G-Mixup|附作者对话
- 为了写论文给 Linux “投毒”, Linux 内核维护者封杀明尼苏达大学「建议收藏」
- Nature封面论文撤稿闹大了,认定首个室温超导体数据存疑!领域大佬尝试复现6次全失败,9位作者集体抗议无效
- ECCV2022 &CVPR2022论文速递2022.7.26!
- ECCV2022 | 谷歌 AR 团队最新成果!论文速递2022.10.6!
- 孙荣辛 | 大数据穿针引线进阶必看——带你盘点那些必知必会的Google经典大数据论文
- 计算机病毒原理与防治技术-计算机病毒的发展趋势及防控策略论文
- [Bio | 论文简读] DiffChIPL:一种基于limma的具有生物复制的高通量测序数据的差异峰值分析方法
- [Genome Biology | 论文简读] 在评估单细胞RNA-seq数据聚类时考虑细胞类型层次关系
- [arxiv | 论文简读] 深度K-Means:简单有效的数据聚类方法
- [Genome Biology | 论文简读] 以知识为基础的神经网络能够对单细胞测序数据进行生物学上可解释的深度学习
- 【深度学习】深度学习三维人体建模最新论文、资源、数据、代码整理分享
- 2023美赛B题成品(论文+数据+代码+支撑材料+思路讲解)成品来了~
- DeepMind大佬4年读博日记!10组数据「定量分析」:6篇论文、97篇审稿、1308条代码提交、23098封邮件……
- 用ChatGPT写论文靠谱吗?有学者试了一下:漏洞百出,但是个注水的「好」工具
- 《A Unified Approach to interpreting Model Predictions》论文解读
- 达摩院首次将Pure Transformer模型引入目标重识别,论文入选ICCV 2021
- 四年积累,论文、网课、博客全打包,500+话题任意学,这儿有一本机器学习免费书
- 2023美赛Y题二手帆船价格--成品论文、思路、数据、代码
- ICLR 2023最高分论文被锤抄袭??
- 探索Linux服务器的论文(linux服务器论文)
- 探究MySQL论文:解读数据操作的核心技术与应用(mysqlpaper)
- 使用PHP和MySQL研究论文(php mysql 论文)
- ICLR 论文评选吃力不讨好? arxiv-sanity上有新发现 |ICLR 2017
- ICRA的5篇最佳操作机械手论文逐个看 | ICRA 2017