3.3.2 比例分配

比例分配指的是按各层单元数占总单元数的比例,也就是按各层的层权进行分配。此时:

对于分层随机抽样,总体均值 $\overline{Y}$ 的估计为:

其中,下标 prop 即 proportional(按比例)的缩写。

总体比例 $P$ 的估计为:

这是因为总体中的任意一个单元,不管它在哪一层,都以同样的概率入样。因此按比例分配的分层随机抽样,估计量的形式特别简单。这种样本也称为自加权的样本。

$\overline{y}_{\text{prop}}$ 的方差为:

$p_{\text{prop}}$ 的方差为:


3.3.3 最优分配

分层随机抽样,将样本量分配到各层,

条件:在总费用给定</span >,目标:估计量的方差达到最小</span >

条件:估计量方差给定</span >,目标:总费用最少

能满足这个条件的样本量分配就是最优分配。

如果我们考虑简单线性费用函数,总费用为:

则此时的最优分配是:

由公式 (3.25) 可以看出,如果某一层单元数较多、内部差异较大、费用比较省,则对这一层的样本量要多分配一些。


3.3.4 奈曼分配

对于分层随机抽样,作为特例,如果每层抽样的费用相同,即 $c_h = c$ 时,最优分配可简化为

这种分配称为奈曼(Neyman)分配。这时,$V(\overline{y}_{st})$ 达到最小: