zl程序教程

您现在的位置是:首页 >  其他

当前栏目

关于F统计量的澄清

统计 关于 澄清
2023-06-13 09:11:18 时间

在孟德尔随机化研究中,弱工具变量偏倚(weak instrument bias)是需要我们认真对待的一个问题,它通常是因为样本量较小导致的。在往期推送中,米老鼠和大家介绍过评价弱工具变量偏倚的策略------孟德尔随机化之F统计量。一般而言,当F 统计量大于经验值10时,我们认为工具变量法估计值的偏倚大约是观察性研究的10%,因此F大于10这个标准在孟德尔随机化研究中广为使用。然而,这样的盲目使用不见得是合理的。

早在2011年,Stephen Burgess等学者就提出盲目且单一使用F统计量大于10来判断弱工具变量偏倚是不合理,为此他们利用哥本哈根队列(Copenhagen General Population Study,CGPS) 去探索C反应蛋白对纤维蛋白原的影响,他们将总人群分别平均分成5,10,16,40,100和250个子队列,然后将子队列的结果进行meta分析,具体结果如下表:

以第三行数据为例,它表示将总人群等分为10个子队列,对每个子队列进行观察性估计(observational estimate),两阶段最小二乘法工具变量估计(two stage least squares instrumental variable estimate)和有限信息的极大似然估计(limited information maximum likelihood instrumental variable estimate),然后计算着10个子队列的平均F统计量。从上表中我们不难看出,随着均分的子队列数目增加,观察性估计量比较稳定,2SLS和LIML的估计值和实际观察值越来越接近,但是每个子队列的平均F统计量在不断减少。也即说明,等分的子队列数目越多,工具变量估计值越接近真实值,但这时候F统计量可能是比较小的。

从上表中我们不难看出单纯依靠F统计量大于10来判断弱工具变量偏倚是不可靠的,当然我们这里并不是否认F统计量的作用,在实际研究中,F统计量越大,确实偏倚会小,但不能拿F大于10作为“金标准”。

目前来看,我们可以将F统计量和meta分析方法有效结合来避免这样的偏倚。这里的meta分析是指针对个体数据分成子样本后meta或者针对汇总数据将不同研究的遗传效应进行meta分析。

参考文献:

  1. Burgess S, Thompson SG; CRP CHDGenetics Collaboration. Avoiding bias from weak instruments in Mendelianrandomization studies. IntJ Epidemiol. 2011 Jun;40(3):755-64. doi: 10.1093/ije/dyr036. Epub 2011 Mar 16.PMID: 21414999.