模型诊断

模型诊断 模型诊断是对构建的回归模型（线性、Logistic、Cox等）的假设条件、拟合适度性及影响点进行检查的一套分析流程。权威解读

🧭 识别分布 → 分析因素 → 干预评价

识别分布
描述三间分布/监测 → 分析因素
探讨危险因素/病因 → 干预评价
制定策略/效果评价

⬆️ 从识别健康问题分布到分析影响因素，再到制定干预策略与效果评价，完整的公共卫生实践链条。

📖 深度解析

🔬 核心原理 —— 通过残差分析、强影响点分析和共线性诊断等手段，确认模型是否稳健可靠。
💡 核心要点：理解背后的疾病或健康问题的自然史与决定因素。
🏥 典型案例 —— 在线性回归后通过分析残差图（残差与拟合值）来判断是否存在异方差性。
💡 实际效果：真实世界的公共卫生干预案例。
📊 关键数据 —— 不满足模型假设将导致统计学推断（P值、置信区间）不可靠。
💡 量化指标：发病率、死亡率、效果指标等。

💡 学习贴士： 始终以人群为对象，运用流行病学和统计学的思维，理解“冰山现象”和三级预防策略。

🤔 深度思考题

一次研究中发现，移除数据集里仅有的3个极端值后，线性回归的斜率从显著变成了不显著。你该如何处理这种情况？

提示： 从数据的真实性和报告的要求角度综合分析。

👉 点击查看参考思路

首先检查这三个“极端值”是否属于数据录入错误或明显不符合纳入标准的个体（应剔除并说明）。若数据真实，需进行敏感性分析（分别报告保留和剔除的结果），并讨论这些“强影响点”对结论稳健性的影响，而不是简单剔除以获得“更好”的结果。- ❌ 误区：拟合完模型并得出显著P值就万事大吉。 ✅ 事实：不进行模型诊断，结论可能是基于违背假设的错误模型得出的，极易产生误导。

⚠️ 常见误区

误区： 拟合完模型并得出显著P值就万事大吉。
事实： 不进行模型诊断，结论可能是基于违背假设的错误模型得出的，极易产生误导。

❓ 常见问题 (FAQ)

问：什么是Cook距离？

答：一种综合了残差和杠杆值的统计量，用于识别对模型参数估计有强影响的个案。

问：多项共线性有什么后果？

答：使回归系数估计不稳定，方差（标准误）膨胀，甚至符号反转。

🧠 认知导航

前置依赖： 各种回归模型基础（线性、Logistic、Cox）

后续延伸： 稳健回归、模型优化、模型比较

📚 完整知识全景 · 回归模型

🔵 已开放 · 可随时探索 🟠 生长中 · 内容持续丰富 🟣 探索级 · 深度拓展

🌱 为了包容与博爱的传递，为了知识平权，善智导航正在陆续深化每一个知识点页面。
下方所有知识点均已预留链接，可随时点击探索。

残差分析- 异常值检测- 强影响点诊断（Cook距离）- 多重共线性检验（VIF） —— 知识要点

🌍 干预实例

🌍 线性回归诊断：① 残差正态性（Q-Q图）；② 等方差性（Scale-Location图）；③ Cook距离（识别对模型影响大的个案）。

- Logistic回归诊断：① Hosmer-Lemeshow检验；② ROC曲线下面积。

🤖 AI陪练指令

我是学习回归模型的公卫学生，请结合具体实例详细讲解模型诊断的分布特征、影响因素、预防控制策略及监测评价方法，并指出常见误区。

📁 更多公共卫生AI指令 →