您现在的位置是：首页 > 其他

当前栏目

关于F统计量的澄清

统计关于澄清

2023-06-13 09:11:18 时间

在孟德尔随机化研究中，弱工具变量偏倚（weak instrument bias）是需要我们认真对待的一个问题，它通常是因为样本量较小导致的。在往期推送中，米老鼠和大家介绍过评价弱工具变量偏倚的策略------孟德尔随机化之F统计量。一般而言，当F 统计量大于经验值10时，我们认为工具变量法估计值的偏倚大约是观察性研究的10%，因此F大于10这个标准在孟德尔随机化研究中广为使用。然而，这样的盲目使用不见得是合理的。

早在2011年，Stephen Burgess等学者就提出盲目且单一使用F统计量大于10来判断弱工具变量偏倚是不合理，为此他们利用哥本哈根队列（Copenhagen General Population Study，CGPS) 去探索C反应蛋白对纤维蛋白原的影响，他们将总人群分别平均分成5,10,16,40,100和250个子队列，然后将子队列的结果进行meta分析，具体结果如下表：

以第三行数据为例，它表示将总人群等分为10个子队列，对每个子队列进行观察性估计（observational estimate），两阶段最小二乘法工具变量估计（two stage least squares instrumental variable estimate）和有限信息的极大似然估计（limited information maximum likelihood instrumental variable estimate），然后计算着10个子队列的平均F统计量。从上表中我们不难看出，随着均分的子队列数目增加，观察性估计量比较稳定，2SLS和LIML的估计值和实际观察值越来越接近，但是每个子队列的平均F统计量在不断减少。也即说明，等分的子队列数目越多，工具变量估计值越接近真实值，但这时候F统计量可能是比较小的。

从上表中我们不难看出单纯依靠F统计量大于10来判断弱工具变量偏倚是不可靠的，当然我们这里并不是否认F统计量的作用，在实际研究中，F统计量越大，确实偏倚会小，但不能拿F大于10作为“金标准”。

目前来看，我们可以将F统计量和meta分析方法有效结合来避免这样的偏倚。这里的meta分析是指针对个体数据分成子样本后meta或者针对汇总数据将不同研究的遗传效应进行meta分析。

参考文献：

Burgess S, Thompson SG; CRP CHDGenetics Collaboration. Avoiding bias from weak instruments in Mendelianrandomization studies. IntJ Epidemiol. 2011 Jun;40(3):755-64. doi: 10.1093/ije/dyr036. Epub 2011 Mar 16.PMID: 21414999.

猜你喜欢

学习Linux：如何修改IP网关（Linux修改IP的网关）
Linux下安装PostgresSQL-10.1详解数据库
「雷锋前线」攻破一把智能门锁的N种方法
C/C++ Npcap包实现数据嗅探
深入了解Oracle数据库中的锁机制（oracle查锁）
原始递归函数及模拟运行的优化
ORA-55430: query pattern is null ORACLE 报错故障修复远程处理
ORA-25121: MINIMUM EXTENT value greater than maximum extent size ORACLE 报错故障修复远程处理
数据SQLServer快速回退数据的技巧（sqlserver 回退）
时间设置使用Java在Redis中配置过期时间（redisjava过期）
简易快速：Linux网络安装系统指南（linux网络安装系统）
微信公众号Web开发笔记，持续记录
Linux命令行下快捷创建文件夹（linux创建文件夹命令）
Oracle先查询再更新的最佳做法（oracle先查询后更新）
让 Linux 开发者放飞创造力（linux 开发者）
Javascript实现的CSS代码高亮显示
比较Linux与安卓：哪一个更好？（linux与安卓哪个好）
Sublime Text 3设置中文语言
IDM无法下载.ts文件解决方案

zl程序教程

当前栏目

关于F统计量的澄清

相关文章