参数:描述总体特征,例如总体均值或标准差。
统计量:描述样本特征,是样本的函数,它不依赖于总体参数。
⚠️区分统计量和枢轴量(检验统计量也是统计量):为什么要这么设计?适用不同场景?
- 统计量不含参,但统计量的分布含参;如 $\bar{X} \sim N(\mu, \frac{\sigma^2}{n})$;
- 枢轴量含参,但枢轴量的分布不含参。如 $Z=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}$. 枢轴量主要用于区间估计和假设检验中。
样本统计量:它是根据样本数据计算出来的一些描述样本特征的概括性数字度量,是样本的函数。如样本均值、样本标准差、样本比例等。
抽样分布:由样本统计量这个随机变量所形成的概率分布。区分样本分布:一个具体的样本数据点的分布。
标准差:一个总体或样本分布中的离中趋势度量。
标准误差(标准误、抽样平均误差):样本统计量的标准差。
在抽样调查中我们所说的“可以对抽样误差进行控制”指的就是“标准误差(又称抽样平均误差)”
抽样平均误差 | 重复抽样 | 不重复抽样(需要修正) |
---|---|---|
样本均值 | $\frac{\sigma}{\sqrt{n}}$ | $\frac{\sigma}{\sqrt{n}}\times\sqrt{\frac{N-n}{N-1}}$ |
样本比例 | $\sqrt{\frac{p(1-p)}{n}}$ | $\sqrt{\frac{p(1-p)}{n}}\times\sqrt{\frac{N-n}{N-1}}$ |
相较于不重复抽样,重复抽样抽出来的样本对总体的代表性更差(显然的)。从抽样平均误差上也可以体现出来:重复抽样的标准误>不重复抽样的标准误。
原来书上默认使用的抽样平均误差都是『重复抽样』情形的。为什么呢?
...