模型诊断 模型诊断是对构建的回归模型(线性、Logistic、Cox等)的假设条件、拟合适度性及影响点进行检查的一套分析流程。 权威解读
⬆️ 从识别健康问题分布到分析影响因素,再到制定干预策略与效果评价,完整的公共卫生实践链条。
一次研究中发现,移除数据集里仅有的3个极端值后,线性回归的斜率从显著变成了不显著。你该如何处理这种情况?
提示: 从数据的真实性和报告的要求角度综合分析。
首先检查这三个“极端值”是否属于数据录入错误或明显不符合纳入标准的个体(应剔除并说明)。若数据真实,需进行敏感性分析(分别报告保留和剔除的结果),并讨论这些“强影响点”对结论稳健性的影响,而不是简单剔除以获得“更好”的结果。- ❌ 误区:拟合完模型并得出显著P值就万事大吉。 ✅ 事实:不进行模型诊断,结论可能是基于违背假设的错误模型得出的,极易产生误导。
误区: 拟合完模型并得出显著P值就万事大吉。
事实: 不进行模型诊断,结论可能是基于违背假设的错误模型得出的,极易产生误导。
问: 什么是Cook距离?
答: 一种综合了残差和杠杆值的统计量,用于识别对模型参数估计有强影响的个案。
问: 多项共线性有什么后果?
答: 使回归系数估计不稳定,方差(标准误)膨胀,甚至符号反转。
《回归诊断》《应用回归分析》。
🌱 为了包容与博爱的传递,为了知识平权,善智导航正在陆续深化每一个知识点页面。
下方所有知识点均已预留链接,可随时点击探索。
- Logistic回归诊断:① Hosmer-Lemeshow检验;② ROC曲线下面积。
我是学习回归模型的公卫学生,请结合具体实例详细讲解模型诊断的分布特征、影响因素、预防控制策略及监测评价方法,并指出常见误区。