请问对于不服从正态分布的数据如何剔除奇异点?
发布网友
发布时间:2022-05-11 07:32
我来回答
共1个回答
热心网友
时间:2023-10-08 21:25
第一:针对一楼,如果你是想做回归模型,在数据不服从正态假设的情况下,你可以对数据进行变换再做回归分析,至于用什么样的变换,建议你使用Box-Cox变换族,通过参数来控制变换类型,你举的例子都是特例,详细可参见王松桂等著的《线性模型引论》P175.
第二:如果你是想做回归模型,但是侧重于对数据的影响分析,建议你采用广义线性模型,详细可参见韦博成等著的《统计诊断》,或者相关的一些其他资料,这个网上很多。
第三,你只是想单纯的提出一些奇异点或者高影响点,并且不知道任何样本分布的先验信息,建议你采用一些非参的方法,这个处理一般来说是比较好的,但是数据要多一点效果才好,一种典型的非参数方法就是bootstrap。