卡方检验

🎓 研究生 🌍 公卫核心 📊 群体视角

卡方检验 卡方检验(χ²检验)是以卡方分布为基础的假设检验,用于分析分类变量(率或构成比)之间的关联性或拟合度。 权威解读

📊 分布特征/影响因素:—  |  🛡️ 预防与控制策略:—  |  📈 监测与评价:常用于疫情暴发调查中分析暴露与发病的关联。  |  📜 法规与指南:—

🧭 识别分布 → 分析因素 → 干预评价

识别分布
描述三间分布/监测
分析因素
探讨危险因素/病因
干预评价
制定策略/效果评价

⬆️ 从识别健康问题分布到分析影响因素,再到制定干预策略与效果评价,完整的公共卫生实践链条。

📖 深度解析

  1. 🔬 核心原理 —— 通过比较实际频数与理论频数的拟合优度(Pearson χ²),检验多个样本率/构成比是否相同。
    💡 核心要点:理解背后的疾病或健康问题的自然史与决定因素。
  2. 🏥 典型案例 —— 分析吸烟习惯(吸烟/不吸烟)和肺癌发生(病例/对照)之间是否存在统计学关联。
    💡 实际效果:真实世界的公共卫生干预案例。
  3. 📊 关键数据 —— 要求理论频数不宜过小(否则需校正或确切概率法),资料呈离散型。
    💡 量化指标:发病率、死亡率、效果指标等。
💡 学习贴士: 始终以人群为对象,运用流行病学和统计学的思维,理解“冰山现象”和三级预防策略。

🤔 深度思考题

为什么当四格表卡方检验中的理论频数T<1,或样本量n<40时,不宜使用普通卡方检验?

提示: 从统计学原理出发,考虑统计量近似分布的准确性。

👉 点击查看参考思路

卡方统计量是基于大样本近似理论推导出来的连续型分布。当样本量小或理论频数过低时,这个近似变得不准确,导致得到的P值有偏。因此,这些情况下需采用Fisher确切概率法直接计算超几何分布的概率,以得到精确P值。- ❌ 误区:卡方检验能说明关联的强度。 ✅ 事实:卡方检验(本质)只能说明关联的统计学意义,关联的强度应该用OR、RR、Phi系数或列联系数等指标来度量。

⚠️ 常见误区

误区: 卡方检验能说明关联的强度。
事实: 卡方检验(本质)只能说明关联的统计学意义,关联的强度应该用OR、RR、Phi系数或列联系数等指标来度量。

❓ 常见问题 (FAQ)

问: 什么是卡方检验的连续性校正?

答: 对于四格表资料,特别是自由度为1时,为避免P值过小,Yates提出校正公式,但现代统计软件多不推荐。

问: R×C表卡方检验要求频数符合什么条件?

答: 理论频数小于5的格子数不应超过总格子数的1/5。

🧠 认知导航

前置依赖: 概率基础、假设检验原理

后续延伸: Logistic回归、确切概率法、一致性检验

📚 完整知识全景 · 推断性统计

🔵 已开放 · 可随时探索 🟠 生长中 · 内容持续丰富 🟣 探索级 · 深度拓展

🌱 为了包容与博爱的传递,为了知识平权,善智导航正在陆续深化每一个知识点页面。
下方所有知识点均已预留链接,可随时点击探索。

🌍 干预实例

🌍 四格表卡方检验:比较两样本率,或检验无序分类变量的关联性。

- 配对卡方检验(McNemar检验):分析配对设计资料的差异。

🌐 探索更多

🔗 权威参考与延伸阅读

🤖 AI陪练指令

我是学习推断性统计的公卫学生,请结合具体实例详细讲解卡方检验的分布特征、影响因素、预防控制策略及监测评价方法,并指出常见误区。

📁 更多公共卫生AI指令 →