今时今日,信息技术已进入了联机分析处理、数据仓库和数据挖掘的信息分析时代。数据挖掘是数据库研究、开发和应用最活跃的分支之一。有意学习数据挖掘相关知识的朋友可以来第一视频教程观看一下这部由浙江大学名师主讲的数据挖掘教程。它从数据库和数据仓库的角度全面、系统地介绍数据挖掘的基本概念、基本方法和基本技术,以及数据挖掘的最新进展。
数据挖掘又称数据库中的
关注公众号:diyijc_com
问题反馈
今时今日,信息技术已进入了联机分析处理、数据仓库和数据挖掘的信息分析时代。数据挖掘是数据库研究、开发和应用最活跃的分支之一。有意学习数据挖掘相关知识的朋友可以来第一视频教程观看一下这部由浙江大学名师主讲的数据挖掘教程。它从数据库和数据仓库的角度全面、系统地介绍数据挖掘的基本概念、基本方法和基本技术,以及数据挖掘的最新进展。
数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
数据挖掘的步骤会随不同领域的应用而有所变化,每一种数据挖掘技术也会有各自的特性和使用步骤,针对不同问题和需求所制定的数据挖掘过程也会存在差异。此外,数据的完整程度、专业人员支持的程度等都会对建立数据挖掘过程有所影响。这些因素造成了数据挖掘在各不同领域中的运用、规划,以及流程的差异性,即使同一产业,也会因为分析技术和专业知识的涉入程度不同而不同,因此对于数据挖掘过程的系统化、标准化就显得格外重要。如此一来,不仅可以较容易地跨领域应用,也可以结合不同的专业知识,发挥数据挖掘的真正精神。
数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。Agrawal等于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作包括对原有的算法进行优化,如引入随机采样、并行的思想等,以提高算法挖掘规则的效率;对关联规则的应用进行推广。关联规则挖掘在数据挖掘中是一个重要的课题,最近几年已被业界所广泛研究。
更新时间:2013-11-01 10:03