假设检验是经典数理统计中的一个重要主题,一个假设检验问题的提法类似于反证法,它主要用来判断统计上一些数据的规律和分布是否满足某些已知的统计分布,且其过程先提出一个和已知分布有关的假设,然后借助观察数据去否定(或不能否定,视为肯定)原来的假设(称为检验)。
一般步骤[]
假设检验问题的提法是这样的:假设有一总体及其对应的分布,我们想要对这个总体的某个性质做一个刻画,即要判断关于该总体的一个命题是否为真,这时就可以使用假设检验法。而这个我们关心的命题就可以引出一个假设,例如我们可以假设其为真然后尝试证伪。
下面我们给出一个针对特定问题的一般假设检验的过程。
- 提出假设:在上面的场景下,我们要检验的假设称为原假设,一般记作,和原假设不相容(一般选择对立面)的假设,称为备择假设,一般记作,这两个假设一给定就可以确定一个假设检验问题,一般记作注意
- 我们倾向于将不容易被否定的命题视作原假设。
- 原假设和备择假设的选择同样还可能有一定的立场,通常两个假设有对应的背景,对不同立场而言原假设未必一致。
- 原假设一般是闭域。
- 构造判断假设的依据——检验统计量:假设为真,利用一些样本来判断是否出现了小概率事件的特征,这些样本包含的信息不是十分明确的,因此需要借助样本来构造出一个统计量,称为检验统计量,它的要求是能够判断在原假设为真的条件下是否存在小概率特征的样本的函数。注意:这里有一个逻辑上的先后问题,统计量是样本的函数,但是并不是给定了样本我们才做假设检验的,而是假设先于样本的获取。
- 指出小概率事件特征——确定拒绝域:在原假设成立的条件下,给定一个检验统计量的界限,在这个界限之外是小概率的事件,这个界限称为检验的临界点,界限的确定随之也决定了检验统计量的取值会在两部分区域里——对应的是将样本空间划分为两部分。界限之内的统计量取值对应的样本空间的子集称为接受域(一般记作),反之称为拒绝域(一般记作)。
- 确定的界限导致小概率事件可能发生而犯的错误——显著性水平:上述界限不是严格地精准的,可能存在以下两种情形:
- (去真)原假设为真,检验统计量落入拒绝域,进而拒绝原假设。这类错误称为第一类错误,对应的概率称为拒真概率。
- (存伪)原假设为假,检验统计量落入接受域,进而接受原假设。这类错误称为第二类错误,对应的概率称为取伪概率。
这两类错误是对立的,一个错误控制得越低另一个犯错概率将会越大。Neyman-Pearson 原则指出拒真错误是更为致命的,我们一般选择控制它的限度,即要求原假设为真的情况下拒绝原假设的概率不超过一个特定的值,这个值称为显著性水平。
- 做出判断:在原假设为真的前提下,当样本计算得出的检验统计量的值落入拒绝域,根据小概率事件原理我们去拒绝原假设(这时一般选择接受备择假设),否则不能拒绝原假设(这是一般选择接受原假设),而衡量犯错误的风险大小的数学量正式显著水平。
参数假设检验[]
在参数分布族场合下所做的关于参数的假设检验问题,称为参数假设检验。这类问题一般可以记作 这里是的两个互不相交的非空子集。
在上面的过程中,我们选择控制犯第一类错误的概率不超过一个给定的常数,记参数对应的第一类错误概率为,那么 在连续型随机变量的场合下,上面的等号一般是可以取到的,离散型场合下我们尽可能选择接近的数值。这时的检验称为显著性水平为的检验。
这时拒绝域的形式一般依赖于备择假设的形式。利用样本的观察值计算得出的检验统计量数值如果落入拒绝域便拒绝原假设,否则选择接受。
一些对正态总体做参数假设检验的例子:U 检验、t 检验、χ² 检验、F 检验。
非参数假设检验[]
不是参数假设检验的问题称为非参数假设检验。一个课题是分布检验。这类检验问题的主要方法有χ² 拟合优度检验、Kolmogorov-Smirnov 检验和列联表独立性检验等。此外还有符号检验和符号秩和检验等。
参考资料
- 韦来生, 《数理统计(第二版)》, 科学出版社, 北京, 2015-12, ISBN
978-7-0304-6573-3.
| 假设检验(学科代码:1106715,GB/T 13745—2009) | |
|---|---|
| 基本概念 | 假设检验 ▪ 检验函数 ▪ 功效函数 ▪ p 值 |
| 参数假设检验 | U 检验 ▪ t 检验 ▪ χ² 检验 ▪ F 检验 ▪ Behrens-Fisher 问题 ▪ 似然比检验 ▪ 一致最优检验 ▪ 无偏检验 |
| 非参数 假设检验 |
χ² 拟合优度检验 ▪ Kolmogorov-Smirnov 检验 ▪ 列联表独立性检验 ▪ 符号检验和符号秩和检验 |
| 所在位置:数学(110)→ 数理统计学(11067)→ 假设检验(1106715) | |