发布网友 发布时间:2024-10-12 17:31
共1个回答
热心网友 时间:2024-11-04 00:31
在1996年,Fayyad、Piatetsky-Shapiro和Smyth三位学者首次提出了KDD(知识发现与数据挖掘)的五个核心步骤,这为后续的各种KDD过程模型奠定了基础。这些模型主要可以分为学术研究模型和工业实践模型两大类,以适应不同的应用场景和需求。
首先,1996年的"九步骤模型"(nine-steps model)由Fayyad等人提出,它详细描述了从数据理解、数据清洗、数据集成、数据转换、数据建模、模型评估到模型部署的完整流程,为学术研究提供了指导框架。
然后,1999年欧洲委员会提出的CRISP-DM模型(cross-instry standard process for data mining),即跨行业数据挖掘标准流程,是一个更为全面且实用的工业模型。它包括业务理解、数据理解、数据准备、建模、评估、部署和业务实施等阶段,旨在帮助企业在实际操作中更有效地进行数据挖掘。
无论是学术研究还是工业实践,KDD过程模型都是数据挖掘和知识发现的重要指导工具,它们通过标准化和规范化的方式,帮助用户更好地理解和应用数据挖掘技术,推动了数据驱动决策的发展。
知识发现(KDD:Knowledge Discovery in Databases)是从数据集中别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。该术语于1989年出现,Fayyad定义为"KDD"是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程”。