数据分类是什么意思?4
发布网友
发布时间:2023-10-15 17:38
我来回答
共4个回答
热心网友
时间:2024-11-25 07:04
数据分类调研分析的基础是数据,而数据的类型可以分为连续性的变量和分类变量。数据分类就是把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征来对数据进行区别。换句话说,就是相同内容、相同性质的信息以及要求统一管理的信息集合在一起,而把相异的和需要分别管理的信息区分开来,然后确定各个集合之间的关系,形成一个有条理的分类系统。
数据分类的目的是根据新数据对象的属性,将其分配到一个正确的类别中。分类分析用预测方法预测给定数据对象的类标号,被广泛地应用到信誉证实、医疗诊断及选择购物等领域。[2]
我们都知道调研分析的基础是数据,而数据的类型可以分为:
连续性的变量:比如,身高,体重,化验值等等,这些变量的特点可以有小数点,可以直接录入;
2. 分类变量:其变量值是定性的,表现为互不相容的类别或属性。实际上在调研当中运用最多的就是分类变量,可分为无序变量和有序变量两类。
①无序分类变量是指所分类别或属性之间无程度和顺序的差别,例如二项分类,性别(男、女),药物反应(阴性、阳性)等。例如多项分类,血型( O、A、B、AB),职业(工、农、商、学、兵)等。
②有序分类变量是指各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。
热心网友
时间:2024-11-25 07:04
数据分类是数据保护工作中的一个关键部分,是建立统一、准确、完善的数据架构的基础,是实现集中化、专业化、标准化数据管理的基础。行业机构按照统一的数据分类方法,依据自身业务特点对产生、采集、加工、使用或管理的数据进行分类,可以全面清晰地了解数据资产,对数据资产实现规范化管理,并有利于数据的维护和扩充。数据分类为数据分级管理奠定基础。安华金和最近对于数据分类分级说的比较多,你可以找他们交流下。
热心网友
时间:2024-11-25 07:05
数据分类就是把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征来对数据进行区别。
热心网友
时间:2024-11-25 07:06
数据分析之数据分类了解 原创
2018-07-27 21:47:18
1点赞
Eric_zh69
码龄5年
关注
一、分类数据
分类数据代表着对象的属性特点。诸如人群的性别、语言、国籍大都属于分类数据。分类数据通常也可以用数值表示(例如1表示女性而0表示男性),但需要注意的是这一数值并没有数学上的意义仅仅是分类的标记而已。
1、定类数据
是指没有内在固有大小或高低顺序,一般以数值或字符表示的分类数据。如性别变量中的男、女取值,可以分别用1、 2表示,民族变量中的各个民族,可以用‘汉’‘回’‘满’等字符表示等。这里,无论是数值型的1、 2 还是字符型的‘汉’‘回’‘满’,都不存在内部固有的大小或高低顺序,而只是一种名义上的指代。下图中表示的便是一个样本典型的分类数据,分别描述了个体的性别和语言属性
2、定序数据
具有内在固有大小或高低顺序,一般可以用数值或字符表示。它相对于定类数据类型来说存在一种程度有序现象
如职称变量可以有低级、中级、高级三个取值,可以分别用1、2、3等表示,年龄段变量可以有老、中、青三个取值,分别用A B C表示等。这里,无论是数值型的1、2 、3 还是字符型的A B C ,都是有大小或高低顺序的,但数据之间却是不等距的。因为,低级和中级职称之间的差距与中级和高级职称之间的差距是不相等的;
上图中的四个选项依次表示了不同的受教育程度,但却无法量化初级教育与高中的差别和高中与大学差别间的不同。定序数据缺乏对于特征间差别的量化使得它更多的只能用于评价利于情绪和用户满意度等一系列非数值特征。
二、数值数据
1. 定距数据
通常是指诸如身高、体重、血压等的连续型数据,也包括诸如人数、商品件数等离散型数据;
定距变量用于表示对象等差属性的描述方法。当我们使用定距变量时我们可以明确的知道数值间的顺序和差别,并计量这种差别。对于温度的描述就是一个定距数据典型的例子。
但定距变量存在的问题在于它没有一个绝对的基准零值,对于上图中的温度来说0度并不意味着没有温度。对于定距变量来说我们可以进行加减操作却无法进行乘除或者比例计算操作。由于不存在绝对零值使得描述性和推理性的统计方法都无法在定距数据上应用。
2. 定比数据
定比数据和定距数据一样都是有序的数据排列,但定比数据存在一个绝对的零值,所描述的都是具有零值基准的变