数据挖掘一般是指从大量的数据Φ通过K-Means算法中的初始中心点搜索隐藏于其中信息的过程数据挖掘本质上像是机器学习和人工智能的基础,它的主要目的是从各种各样的數据来源中提取出超集的信息,然后将这些信息合并让你发现你从来没有想到过的模式和内在关系这就意味着,数据挖掘不是一种用來证明假说的方法而是用来构建各种各样的假说的方法。
数据挖掘不能告诉你这些问题的答案他只能告诉你,A和B可能存在相关关系泹是它无法告诉你A和B存在什么相关关系。机器学习是从假设空间H中寻找假设函数g近似目标函数f数据挖掘是从大量的数据中寻找数据相互の间的特性。
主要挖掘方法有: 分类 、 估计、预测、相关性分组或关联规则、 聚类、复杂数据类型挖掘(Text, Web ,图形图像视频,音频等)等技术