非参数检验(Nonparametric tests)是统计分析办法的要紧构成部分,它与参数检验一起形成统计推断的基本内容。参数检验是在总体分布形式已知的状况下,对总体分布的参数如均值、方差等进行推断的办法。然则,在数据分析过程中,因为种种原由,人们常常没法对总体分布形态作简单假定,此时参数检验的办法就再也不适用了。非参数检验正是一类基于这种思虑,在总体方差未知或晓得甚少的状况下,利用样本数据对总体分布形态等进行推断的办法。因为非参数检验办法在推断过程中不触及相关总体分布的参数,因而得名为“非参数”检验。
SPSS单样本非参数检验是对单个总体的分布形态等进行推断的办法,其中包含卡方检验、二项分布检验、K-S检验以及变量值随机性检验等办法。
总体分布的卡方检验
例如,医学家在科研心脏病人猝死人数与日期的关系时发掘:1星期之中,星期一心脏病人猝死者较多,其他日子则基本相当。当天的比例近似为2.8:1:1:1:1:1:1。现收集到心脏病人死亡日期的样本数据,推断其总体分布是不是与以上理论分布相吻合。
卡方检验办法能够按照样本数据,推断总体分布与期望分布或某一理论分布是不是存在明显差异,是一种吻合性检验,一般适于对有多项归类值的总体分布的分析。它的原假设是:样本来自的总体分布与期望分布或某一理论分布没差异。
二项分布检验
在生活中有非常多数据的取值是二值的,例如,人群能够分成男性和女性,制品能够分成合格和不合格,学生能够分成三好学生和非三好学生,投掷硬币实验的结果能够分成显现正面和显现反面等。一般将这般的二值分别用1或0暗示。倘若进行n次相同的实验,则显现两类(1或0)的次数能够用离散型随机变量X来描述。倘若随机变量X为1的概率设为P,则随机变量X值为0的概率Q便等于1-P,形成二项分布。
SPSS的二项分布检验正是要经过样本数据检验样本来自的总体是不是服从指定的概率为P的二项分布,其原假设是:样本来自的总体与指定的二项分布没明显差异。
从某制品中随机抽取23个样品进行检测并得到检测结果。用1暗示一级品,用0暗示非一级品。按照抽样结果验证该批制品的一级品率是不是为90%。
单样本K-S检验
K-S检验办法能够利用样本数据推断样本来自的总体是不是服从某一理论分布,是一种拟合优度的检验办法,适用于探索连续型随机变量的分布。
例如,收集一批周岁儿童身高的数据,需利用样本数据推断周岁儿童总体的身高是不是服从正态分布。再例如,利用收集的住房情况调查的样本数据,分析家庭人均住房面积是不是服从正态分布。
单样本K-S检验的原假设是:样本来自的总体与指定的理论分布没明显差异,SPSS的理论分布重点包含正态分布、均匀分布、指数分布和泊松分布等。
变量值随机性检验
变量值随机性检验经过对样本变量值的分析,实现对总体的变量值显现是不是随机进行检验。
例如,在投硬币时,倘若以1暗示显现的是正面,以0暗示显现的是反面,在进行了若干次投币后,将会得到一个以1,0构成的变量值序列。此时可能会分析“硬币显现正反面是不是是随机的”这般的问题。
变量值随机性检验正是处理这类问题的一个有效办法。它的原假设是:总体变量值显现是随机的。
变量随机性检验的要紧依据是游程。所说游程是样本序列中连续显现相同的变量值的次数。能够直接理解,倘若硬币的正反面显现是随机的,那样在数据序列中,许多个1或许多个0连续显现的可能性将不太大,同期,1和0频繁交叉显现的可能性亦会较小。因此呢,游程数太大或太小都将显示变量值存在不随机的现象。
例:为检验某耐压设备在某段时间内工作是不是连续正常,测试并记录下该时间段内各个时间点上的设备耐压的数据。现采用游程检验办法对这批数据进行分析。如果耐压数据的变动是随机的,可认为该设备工作始终正常,否则认为该设备有不可正常工作的现象。
检验办法
两独立样本的非参数检验
两独立样本的非参数检验是在对总体分布不甚认识的状况下,经过对两组独立样本的分析来推断样本来自的两个总体的分布等是不是存在明显差异的办法。独立样本指的是在一个总体中随机抽样对在
|