spss问卷分析中的缺失值如何处理

2025-02-23 06:14:47
推荐回答(1个)
回答1:

缺失值(missing data)大致上可分为三种型态,MNAR (missing not at random)指缺失值不是随机的,有可能是问卷的设计,比如说,年收入大于十万请回答A题,小于十万请回答B题,这类的缺失是设计上的,不能称作随机缺失.另一种叫MAR(missing at random),指缺失和前面的回答有某些程度的相关,这类的缺失很难界定或测试,第三种叫MCAR(missing completely at random),这种就是称作随机的缺失,这种缺失和其它的数据完全是独立的.第三种缺失相对的比较容易处理. 如果样本够大的话,把有缺失的样本完全去除,这种方法叫作listwise deletion.如果能够确信样本的缺失值是MCAR,你又没有足够的样本的话,可用填补的方法(imputation).通常可填上平均值,或者回归的预测值,这两种方法都有它的缺点.SPSS有个MISSING DATA MODULE,就是用EM(expectation and maximization)的填补,它的方法是把有同样缺失的样本放在同一组,计算它的covariance matrix,然後再跟据每组的样本数来较正它对整个样本的权重(weight),从这里再重新填补每个缺失值.这重方法算是现在比较精确的缺失值填补的方法.