发布网友 发布时间:2022-05-06 18:39
共1个回答
热心网友 时间:2023-08-05 19:29
数值型特征常用的特征工程方法有交叉特征,离散型变量处理。
交叉特征算是特征工程中非常重要的方法之一,它将两个或更多的类别属性组合成一个。当组合的特征要比单个特征更好时,这是一项非常有用的技术。数学上来说,是对类别特征的所有值进行交叉相乘。
定义
数据形式在计算机中的表示主要有两大类:数值型变量和非数值型变量(如,字符、汉字等)。数值型变量指,被人为定义的数字(如整数、小数、有理数等)在计算机中的表示。这种被定义的数据形式可直接载入内存或寄存器进行加、减、乘、除的运算。一般不经过数据类型的转换,所以运算速度快。具有计算意义。