抽样方案基本名词解析——总体与样本
关键词:抽样方案,样本
在一个统计问题中,称研究对象的全体为总体,构成总体的每个成员称为个体。若关心的是研究对象的某个数量指标,那么将每个个体具有的数量指标x称为个体,这样一来,总体就是某数量指标值X的全体(即一堆数字),这一堆数有一个分布,从而总体可用一个分布描述,简单地说,总体就是一个分布。统计学的主要任务就是:
- 研究总体是什么分布?
- 这个总体(即分布)的均值、方差(或标准差)是多少?
以下通过三个实例讲解总体与样本。
案例一
对某产品仅考察其合格与否,记合格品为0,不合格品为1,那么:
总体={该产品的全体}={由0或1组成的一堆数}
这一堆数的分布是什么呢?若记1在总体中所占比例为p,则该总体可用二点分布b(1,P)(n=1的二项分布)表示:
譬如,有两个工厂生产同一产品,甲乙的不合格品率p=0.01,乙厂的不合格品率p=0.08,甲乙两厂所生产的产品(即两个总体)分别用以下两个分布描述:
如此认识总体既看到总体的本质,又看到不同总体的差别。
案例二
考察某橡胶件的抗张强度,它可用0到∞上一个实数表示,这是总体可用区间[0, ∞)上的一个概率分布表示。国内外橡胶业对其抗张强度有较多研究,认为橡胶件的抗张度服从正态分布N(μ,σ2),该总体常称为正态总体。这时统计要研究的问题是:正态均值μ是多少?正态方差σ2是多少?又如若对橡胶件进行技术改进,如通过改进配料,提高了该橡胶件抗张强度的均值(如图一)。这时我们要研究的问题是:技术改进前后的正态分布均值有多大改变?
图一,技术改进前后的正态总体
案例三
用非对称分布(即偏态分布)表述的总体也是常见的。譬如某型号电视机寿命的全体所构成的总体就是一个偏态分布(如图二)。
图二,电视机寿命总体是一个偏态分布
总体与样本是统计学抽样方案的基础知识,学习统计学知识,对于从事质量管理相关行业的人员及其重要,因为毕竟一切实操工作都是以理论为基础的,学好理论基础才能从根本上理解并做好本职工作。