发布网友 发布时间:2022-04-20 03:35
共1个回答
热心网友 时间:2023-08-05 22:52
数据规约的种类包括维度规约和数值规约。
什么是数据规约:数据规约的意义
在大数据集上进行复杂的数据分析和挖掘需要很长的时间,数据规约产生更小但保持原数据完整性的新数据集。在规约后的数据集上进行分析和挖掘将更有效率。
数据规约的意义在于:
降低无效、错误数据对建模的影响,提高建模的准确性。
少量且具代表性的数据将大幅缩减数据挖掘所需的时间。
降低储存数据的成本。
途径
数据归约主要有两个途径:属性选择和数据采样,分别针对原始数据集中的属性和记录。
假定在公司的数据仓库选择了数据,用于分析。这样数据集将非常大。在海量数据上进行复杂的数据分析扣挖掘将需要很长时间,使得这种分析不现实或不可行。
数据归约技术可以用来得到数据集的归约表示,它虽然小,但仍大致保持原数据的完整性。这样,在归约后的数据集上挖掘将更有效,并产生相同(或几乎相同)的分析结果。