3.3.2 比例分配
比例分配指的是按各层单元数占总单元数的比例,也就是按各层的层权进行分配。此时:
对于分层随机抽样,总体均值 $\overline{Y}$ 的估计为:
其中,下标 prop
即 proportional(按比例)的缩写。
总体比例 $P$ 的估计为:
这是因为总体中的任意一个单元,不管它在哪一层,都以同样的概率入样。因此按比例分配的分层随机抽样,估计量的形式特别简单。这种样本也称为自加权的样本。
$\overline{y}_{\text{prop}}$ 的方差为:
$p_{\text{prop}}$ 的方差为:
3.3.3 最优分配
分层随机抽样,将样本量分配到各层,
条件:在总费用给定</span >,目标:估计量的方差达到最小</span >
条件:估计量方差给定</span >,目标:总费用最少
能满足这个条件的样本量分配就是最优分配。
如果我们考虑简单线性费用函数,总费用为:
则此时的最优分配是:
由公式 (3.25) 可以看出,如果某一层单元数较多、内部差异较大、费用比较省,则对这一层的样本量要多分配一些。
3.3.4 奈曼分配
对于分层随机抽样,作为特例,如果每层抽样的费用相同,即 $c_h = c$ 时,最优分配可简化为
这种分配称为奈曼(Neyman)分配。这时,$V(\overline{y}_{st})$ 达到最小:
评论