可疑值如何处理?
发布网友
发布时间:2022-04-29 03:58
我来回答
共2个回答
热心网友
时间:2023-10-10 02:59
可疑值也叫离群值,处理方法有:
一、剔除离群值,不追加观测值;
二、剔除离群值,追加观测值;或剔除离群值,适宜地插补替代;
三、找到实际原因修正离群值,否则予以保留的。
简介:
离群值(outlier)是指在数据中有一个或几个数值与其他数值相比差异较大。
特征:
发现离群值也可以通过观察值的频数表或直方图来初步判断,也可通过统计软件作观察值的箱式图来判断,如果观测值距箱式图底线Q1(第25百分位数)或顶线Q3(第75百分位数)过远,如超出箱体高度(四分位数间距)的两倍以上,则可视该观测值为离群值。当数据近似正态分布时,有一种较为简单的方法,可用均数加减2.5s来判断,如观测值在此范围以外,可视为离群值。在统计学上也可用线性回归的方法来对离群值进行判断。当出现离群值的时候,要慎重处理,要将专业知识和统计学方法结合起来,首先应认真检查原始数据,看能否从专业上加以合理的解释,如数据存在逻辑错误而原始记录又确实如此,又无法在找到该观察对象进行核实,则只能将该观测值删除。如果数据间无明显的逻辑错误,则可将离群值删除前后各做一次统计分析,若前后结果不矛盾,则该例观测值可予以保留。
热心网友
时间:2023-10-10 03:00
楼主,您好。 对可疑值应做如下处理: 1.在分析过程中已经知道数据是可疑的应将可疑值立即弃去;2.复查分析结果时已经找出出现可疑值的原因,应将可疑值立即弃去;3.找不出可疑值出现的原因,不应随意弃去或保留,而应根据数理统计原则来处理。 Q检验法:1.按测得值的大小顺序排列;2.计算可疑值与最邻近数据之差,除以最大值与最小值之差,所得商称为Q值。由于测得值是按顺序排列,所以可疑值可能出现在首项或末项。3.查Q值表,若计算N次测量的Q值比表中查到的N次测量的Q值大则弃去,若小则保留。N次测量的Q值(置信水平90%) 3 4 5 6 7 8 9 10 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41 详情请参考国家标准物质网www.rmhot.com
热心网友
时间:2023-10-10 02:59
可疑值也叫离群值,处理方法有:
一、剔除离群值,不追加观测值;
二、剔除离群值,追加观测值;或剔除离群值,适宜地插补替代;
三、找到实际原因修正离群值,否则予以保留的。
简介:
离群值(outlier)是指在数据中有一个或几个数值与其他数值相比差异较大。
特征:
发现离群值也可以通过观察值的频数表或直方图来初步判断,也可通过统计软件作观察值的箱式图来判断,如果观测值距箱式图底线Q1(第25百分位数)或顶线Q3(第75百分位数)过远,如超出箱体高度(四分位数间距)的两倍以上,则可视该观测值为离群值。当数据近似正态分布时,有一种较为简单的方法,可用均数加减2.5s来判断,如观测值在此范围以外,可视为离群值。在统计学上也可用线性回归的方法来对离群值进行判断。当出现离群值的时候,要慎重处理,要将专业知识和统计学方法结合起来,首先应认真检查原始数据,看能否从专业上加以合理的解释,如数据存在逻辑错误而原始记录又确实如此,又无法在找到该观察对象进行核实,则只能将该观测值删除。如果数据间无明显的逻辑错误,则可将离群值删除前后各做一次统计分析,若前后结果不矛盾,则该例观测值可予以保留。
热心网友
时间:2023-10-10 03:00
楼主,您好。 对可疑值应做如下处理: 1.在分析过程中已经知道数据是可疑的应将可疑值立即弃去;2.复查分析结果时已经找出出现可疑值的原因,应将可疑值立即弃去;3.找不出可疑值出现的原因,不应随意弃去或保留,而应根据数理统计原则来处理。 Q检验法:1.按测得值的大小顺序排列;2.计算可疑值与最邻近数据之差,除以最大值与最小值之差,所得商称为Q值。由于测得值是按顺序排列,所以可疑值可能出现在首项或末项。3.查Q值表,若计算N次测量的Q值比表中查到的N次测量的Q值大则弃去,若小则保留。N次测量的Q值(置信水平90%) 3 4 5 6 7 8 9 10 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41 详情请参考国家标准物质网www.rmhot.com