发布网友 发布时间:2022-04-10 19:30
共1个回答
热心网友 时间:2022-04-10 20:59
数据挖掘(data mining),简单来讲就是从大量数据中抽取或挖掘知识。首先,要明确的是,数据挖掘对象可以来自任何数据源,在进行适当的格式转换等预处理后,根据应用要求选择相应算法进行挖掘。最常见的数据源类型有以下几种:关系型数据库、数据仓库、事务数据库、面向对象数据库、空间数据库、时序数据库、文本数据库、多媒体数据库、混合型数据库、历史数据库、互联*息。数据挖掘的过程一般分为以下几个步骤:1)数据整理:即删除噪声和不一致的数据;2)数据集成:即将多源数据综合起来(可以采用数据仓库技术);3)数据筛选:抽取与分析任务相关的数据;4)数据转换:数据转换或合并成适当的形式,以利于挖掘;5)数据挖掘:采用智能化的方法来抽取数据中隐藏着的模式与知识;6)模式评估:根据一定价值标准对挖掘的结果进行评估;7)知识表达:采用可视化和知识表达技术,表示挖掘结果。