Home > Statistics > Main text

Think Stats: hypothesis testing


Tag: reading, statistics

假设检验:

  1. 效应具有统计显著性,指这种情况在一次试验中不大可能发生。
  2. 原假设:null hypothesis,观测到的由偶然因素造成;p值:p-value,在原假设下,出现直观效应的概率;解释:interpretation。
  3. 发现第一胎婴儿(m)怀孕周期的均值略长于非第一胎婴儿(n)怀孕周期的均值,检验:
    • 把所有数据混合在一起
    • 随机分成两组,一组等于m,另一组等于n,计算两组之间平均值的差异
    • 重复1000次,计算均值的分布
    • 选定阈值(比如一个方差),计算位于之外的概率(17%)
    • 这里使用的是重抽样(resampling)的方法
  4. I类错误(type I error, 假阳性,false positive):接受本质为假的假设
  5. II类错误(type II error,假阴性,false negative):推翻本质为真的假设
  6. 假设检验中最常用的方法是为p值选择一个阈值α,通常为5%。
  7. 同时降低两类错误的方法:增加样本量。
  8. 效应:在NSFG数据中,我们将效应定义为“两个分组的均值差(不分正负)大于等于δ”。所以效应是指需要评估的具体的定义?
  9. 双边检验:不关注相对大小;单边检验:只关注某一边的大小,通常p值比双边检验更低。
  10. 解释统计结果:1)古典解释:比较p值和阈值;2)实际解释:只求越低越好;3)贝叶斯统计解释。
  11. 交叉验证:构建不同的数据集来计算条件概率。避免抽样引入的误差:即使原假设是真的,也可能因为随机抽样的缘故而导致两个分组的均值有差别(δ)。
  12. 似然比(likelyhood ratio) P(E|HA)/P(E|H0),报道贝叶斯概率时采用这个,而不再关注后验概率。
  13. 卡方检验:场景:均值可能没有差异,但是分布的方差可能存在差异,但是通常方差的鲁棒性较差,统计检验通常表现较差。卡方统计量:检验观测值和期望值的离差平方和的均值。
  14. 高效再抽样:通过运用部分的计算的性质,从理论推导结果。
  15. 统计功效(statistical power)指的是在原假设为假的情况下,检验的结果为阳性的概率。一般地,一个统计检验的功效依赖于样本数量、效应的大小和我们设置的阈值α。

术语:

  • 单元格(cell) 在卡方检验中,将观测按一定的标准分到各个单元格里,每个单元格代表一种分类。
  • 卡方检验(chi-square test) 用卡方统计量做统计量的统计检验 。
  • 交叉验证(cross-validation) 交叉验证使用一个数据集进行探索性数据分析,然后用另一个数据集进行测试。
  • 假阴性(false negative) 在效应真实存在的情况下,我们认为这个效应是由偶然因素引起的。
  • 假阳性(false positive) 在原假设为真的情况下,我们拒绝了原假设的结论。
  • 假设检验(hypothesis testing) 判定出现的效应是否具有统计显著性的过程。
  • 似然比(likelihood ratio) 一种概率的比值, P(E|A)/P(E|B),这里A和B是两种假设。似然比不依赖于先验概率,可以用来报道贝叶斯统计推断的结果。
  • 原假设(null hypothesis) 一种基于以下假设的模型系统:我们观测到的效应只是由偶然因素引起的。
  • 单边检验(one-sided test) 一种检验类型,关注的是出现比观测到的效应更大(或小)的效应的概率。
  • p值(p-value) 在原假设成立的情况下,出现我们观测到的效应的概率。
  • 功效 (power) 在原假设为假的情况下,检验推翻原假设的概率。
  • 显著性(significant) 我们说某个效应具有统计显著性指的是这种情况不大可能是由偶然因素引起的。
  • 检验统计量(test statistic) 衡量观测到的效应与原假设下期望的结果之间偏差的统计量。
  • 测试集(testing set) 用做测试的数据集。
  • 训练集(training set) 用做训练的数据集。
  • 双边检验(two-sided test) 一种检验类型,关注的是出现比观测到的效应更大的效应的概率,不考虑正负。

If you link this blog, please refer to this page, thanks!
Post link:https://tsinghua-gongjing.github.io/posts/ThinkStats_hypothesis_test.html

Previous: Linux common used tricks