关于F统计量的澄清
在孟德尔随机化研究中,弱工具变量偏倚(weak instrument bias)是需要我们认真对待的一个问题,它通常是因为样本量较小导致的。在往期推送中,米老鼠和大家介绍过评价弱工具变量偏倚的策略------孟德尔随机化之F统计量。一般而言,当F 统计量大于经验值10时,我们认为工具变量法估计值的偏倚大约是观察性研究的10%,因此F大于10这个标准在孟德尔随机化研究中广为使用。然而,这样的盲目使用不见得是合理的。
早在2011年,Stephen Burgess等学者就提出盲目且单一使用F统计量大于10来判断弱工具变量偏倚是不合理,为此他们利用哥本哈根队列(Copenhagen General Population Study,CGPS) 去探索C反应蛋白对纤维蛋白原的影响,他们将总人群分别平均分成5,10,16,40,100和250个子队列,然后将子队列的结果进行meta分析,具体结果如下表:
以第三行数据为例,它表示将总人群等分为10个子队列,对每个子队列进行观察性估计(observational estimate),两阶段最小二乘法工具变量估计(two stage least squares instrumental variable estimate)和有限信息的极大似然估计(limited information maximum likelihood instrumental variable estimate),然后计算着10个子队列的平均F统计量。从上表中我们不难看出,随着均分的子队列数目增加,观察性估计量比较稳定,2SLS和LIML的估计值和实际观察值越来越接近,但是每个子队列的平均F统计量在不断减少。也即说明,等分的子队列数目越多,工具变量估计值越接近真实值,但这时候F统计量可能是比较小的。
从上表中我们不难看出单纯依靠F统计量大于10来判断弱工具变量偏倚是不可靠的,当然我们这里并不是否认F统计量的作用,在实际研究中,F统计量越大,确实偏倚会小,但不能拿F大于10作为“金标准”。
目前来看,我们可以将F统计量和meta分析方法有效结合来避免这样的偏倚。这里的meta分析是指针对个体数据分成子样本后meta或者针对汇总数据将不同研究的遗传效应进行meta分析。
参考文献:
- Burgess S, Thompson SG; CRP CHDGenetics Collaboration. Avoiding bias from weak instruments in Mendelianrandomization studies. IntJ Epidemiol. 2011 Jun;40(3):755-64. doi: 10.1093/ije/dyr036. Epub 2011 Mar 16.PMID: 21414999.
相关文章
- webrtc开发入门_统计的简单应用
- 菜鸟的每日力扣系列——1995. 统计特殊四元组
- 关于本站同款统计
- 网站日志统计案例分析与实现详解大数据
- MySQL中PHP的总数统计(phpmysql总数)
- MySQL:实现千万数据量级的统计分析(mysql千万数据统计)
- MSSQL快速统计重复数据的小技巧(mssql 统计重复数据)
- 利用MSSQL进行统计优化的实践研究(mssql统计优化)
- 利用Oracle Col表实现简便数据统计报表(oracle col 表)
- 发款php蜘蛛统计插件只要有mysql就可用
- 输入框的字数时时统计—关于onpropertychange和oninput使用
- PHP统计二维数组元素个数的方法