1、全样而非抽样:过去,由于数据存储和处理能力的限制,在科学分许中,通常采用抽样的方法,即从全集数据中抽取一部分样本数据,通过对样本数据的分析来推断全集数据的总体特征。现在,大数据时代的到来,为我们提供了海量数据的存储和处理。因此,在大数据技术的支持下,科学分析完全可以在全集数据中进行分析,并快速得到结果。
2、效率而非精确:过去,科学分析中采用抽样的分析方法,此方法要求分析方法的精确性,因为抽样方法只是针对部分样本的分析,分析结果应用到全集数据后,误差会被放大。就是说,许多微小的误差会造成较大的误差。这导致了传统的算法更加注重提高精确性,而非效率。而在大数据时代,采用的是全样分析法而不是抽样法,就不存在误差的放大。所以,大数据具有“秒级相应”特征,要求在几秒内就能对海量的数据分析得到实时结果,否则就会丧失数据价值。
3、相关而非因果过去。数据分析的目的,一方面是解释事物背后的发展机理;另一方面是用于预测未来可能发生的事情。现在,大数据时代,因果关系不再重要,人们转而追求“相关性”,而非因果性。
下载本文