缺失值怎么处理
发布网友
发布时间:2022-04-26 19:04
我来回答
共1个回答
热心网友
时间:2023-10-22 16:39
缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing
Value)。用户缺失值指在问卷调查中,把被试不回答的一些选项当作缺失值来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为“?”。
一、定义缺失值
SPSS有系统缺失值和用户缺失值两类缺失值,系统默认为None(无)。当需要定义缺失值时,单击Missing下的含有“None”单元格,便进入图2-4的“缺失值”窗口。缺失值有以下3种选项:
No missing values:没有缺失值。
Discrete missing values:定义1~3个单一数为缺失值。
Range plus one optional discrete missing
values:定义指定范围为缺失值,同时指定另外一个不在这一范围的单一数为缺失值。
至于其他如单元格列长度(Columns)、单元格字符排列方向(Align)和数据量度(Measure)等均是不常用,一般使用系统默认值就可以了,以便减少工作量。
二、缺失值的处理
一般情况下,定义缺失值后的变量可以进行描述统计、相关分析等统计分析。但是,由于缺失值的出现往往会给统计分析带来一些麻烦和误差,尤其在时间序列分析中更是如此。在COMPUTE命令中,某个变量带有缺失值,则带有缺失值的个案也变成缺失值了。如图所示:
一般地,对缺失值的处理可采用如下方法:
第一,替代法。即采用统计命令Transform→Replace Missing
Values进行替代,或在相关统计功能中利用其【Opions】等参数进行替代。例如对上图表中的数据缺失值的处理:以T49这个变量中的所有数据的平均数为替代值,然后再进行COMPUTE命令处理。如图所示:
第二,剔除法。即剔除有缺失值的题目,或剔除有缺失值的整份问卷。