<aside> 📖 假设检验(Hypothesis Testing)

在样本的基础上对总体的某种结论作出判断的一种统计推断方法。

过程：

先对总体的参数(或分布形式)提出某种假设，
然后利用样本信息判断假设是否成立

它在逻辑上运用反证法，在统计上依据小概率原理

<aside> 📖 参数假设检验

对总体分布中未知参数的假设检验称为参数假设检验。

研究整体为正态分布或近似正态分布

</aside>

<aside> 📖 非参数假设检验

对未知分布函数的类型或其某些特征提出的假设称为非参数假设检验。

</aside>

<aside> 📖 符号表

符号	定义
$\Kappa$	拒绝界限值
$T$	检验统计量
$D$	假设检验的拒绝域
$H_0$	原假设
$H_1$	备择假设
$\alpha$	显著性水平
$\text{p-value}$	假设$H_0$成立，被观察到的显著性水平
</aside>

1. 基本概念

假设检验中，假设是指对总体参数的某些数字特征所作的陈述。

常用的总体数字特征包括总体均值、总体方差等。

$H_0$ 为原假设（Null Hypothesis）
$H_1$ 为备择假设（Alternative Hypothesis）

假设应该在研究目的确定以后就进行假设建立，而不应该是对数堪分祈之后才建立假设。

<aside> 📖 原假设（Null Hypothesis）

研究者想收集证据予以反对的假设。
原假设又称为”0假设"。
记为 $H_0$，为一个算术表达式，包含比较符 $=,\geq,\leq$。 </aside>

<aside> 📖 备择假设（Alternative Hypothesis）

研究者想收集证据予&支持的假设。
记为$H_1$，为一个算术表达式，含比较符 $\neq,\geq,\leq$。
备择假设和原假设互补 </aside>

<aside> 📖 原假设与备择假设的比较

原假设与备择假设，选择取决于我们对问题的态度，一般而言我们希望从子样观测值取得某一陈述的强力支持，这一陈述的否定作为原假设，而陈述本身作为备择假设。

通常先确定备择假设再确定原假设。

</aside>

<aside> 📖 检验统计量 (Test Statistic)

检验统计量是根据样本观测结果计算增到的，并能够据以对原假设和备择假设作出决策的某个样本统计量。

检验统计量服从某个抽样分布（通常是我们熟知的），使得可以通过统计量的具体数值映射到抽样分布的概率中进行判断。

更进一步说，检验统计量的作用是对样本数值进行概率标准化。

</aside>

<aside> 📖 显著性水平 (Significance Level)

在假设检验中，$\alpha$ 称为显著性水平

研究者事先确定用于拒绝原假设 $H_0$ 的证据必须强到何种程度。
$\alpha$ 是一个概率值：原假设为真时，拒绝原假设的小概率水平。
$\alpha$ 根据要求不同通常分为$0.01,0.05,0.10$。 </aside>

Untitled

当原假设被拒绝时，我们称样本结果

在统计上是显著的(Statistically Significant)
当不拒绝原假设时，我们称样本结果

在统计上是不显著的

2. 两类错误

<aside> 📖 第一类错误 (Type I error)

拒真 (False Positive) 错误 / $\alpha$错误

当$H_0$为真时，若样本观测值落入拒绝域，根据检验法则拒绝$H_0$，

其发生的概率记为$\alpha$，即

$$ ⁍ $$

<aside> 💡 显著性检验

只考虑控制第一类错误概率的假设检验

</aside>

<aside> 📖 第二类错误 (Type II error)

受伪 (False Negative) 错误 / $\beta$错误

当$H_0$不真时，若样本观测值没有落入拒绝域，根据检验法则不拒绝$H_0$，

其发生的概率记为$\beta$，即

$$ P\{不拒绝H_0|H_0不真\}=\beta $$

<aside> 💡 影响第二类错误的因素

显著性水平 $\alpha$，负相关
总体标准差 $\sigma$，正相关
样本容量 $n$，负相关 </aside>

</aside>

人们当然希望能既降低I类错误的概率又减低II类错误的概率。

然而不幸的是，在样本容量固定时，I类错误的概率和II类错误的概率是矛盾的，不可能同时减小。

我们当然可以通过增大样本容量去降低犯这两类错误的概率。然而在一些个体抽样成本较大的研究中，样本容量几乎决定着研究成本，因而往往不能得到理想的大容量样本。

3. 显著性水平与p值

<aside> 📹 定义

在$H_0$ 成立的条件下，出现该实验结果或更极端情况的概率值

通常被称为被观察到的显著性水平

</aside>