多元统计学分析:在数据处理时,为什么通常要进行标准化处理?
发布网友
发布时间:2022-05-09 05:45
我来回答
共1个回答
热心网友
时间:2024-01-28 18:30
数据标准化是统计学中对数据进行分析前处理的一种方法,目的在于消除数据计量单位及变异程度。
例如:第1个变量的单位是kg,第2个变量的单位是cm,那么在计算绝对距离时将出现将两个事例中第1个变量观察值之差的绝对值(单位是kg)与第2个变量观察值之差的绝对值(单位是cm
)相加的情况。使用者会说5kg的差异怎么可以与3cm的差异相加?不同变量自身具有相差较大的变异时,会使在计算出的关系系数中,不同变量所占的比重大不相同。例如如果第1个变量(两水稻品种米粒中的脂肪含量)的数值在2%到4%之间,而第2个变量(两水稻品种的亩产量)的数值范围都在1000与5000之间。为了消除量纲影响和变量自身变异大小和数值大小的影响,故将数据标准化。