博客 找到与“数据挖掘”相关的博文共521篇
按相关性排序  按时间排序
我制作的软件-西南财大数据挖掘系统   2009-12-16 14:03:22
是在吸取了美国几个著名数据挖掘软件优点的基础上,结合多年...
聚类算法学习指南(一)   2009-12-15 15:57:57
由于研究的需要,现在将重点放在数据挖掘中聚类方法的应用上。数据挖掘中对聚类的典型要求如下:(1)可伸缩性。一般的聚类算法使用鱼规模小于200的数据集合上,而现在很多大型数据库的数据量达到百万个,这就要求聚类有好的可伸缩性。(2)处理不同类型属性的能力...
什么是数据挖掘技术   2009-12-15 15:55:50
清晰地定义出业务问题,确定数据挖掘的目的。#9333;数据准备:数据准备包括:选择数据--在大型数据库和数据仓库目标中提取数据挖掘的目标数据集;数据预处理--进行数据再加工,包括检查数据的完整性及数据的一致性、去噪声,填补丢失的域,删除无效数据等。#9334;...
数据挖掘常用聚类算法性能比较   2009-12-15 15:51:20
BIRCH算法只适用于类的分布呈凸形及球形的情况,并且由于BIRCH算法需提供正确的聚类个数和簇直径限制,对不可视的高维数据不可行。2CURE算法 CURE算法即使用代表点的聚类方法。该算法先把每个数据点看成一类,然后合并距离最近的类直至类个数为所要求的个数为止。CURE...
聚类算法   2009-12-15 15:41:33
它作为数据挖掘中的一个模块,可以作为一个单独的工具以发现数据库中分布的一些深层的信息,并且概括出每一类的特点...或者把注意力放在某一个特定的类上以作进一步的分析;并且,聚类分析也可以作为数据挖掘算法中其他分析算法的一个预处理步骤。聚类分析的算法可以分为分...
数据挖掘聚类算法一览   2009-12-15 15:35:55
聚类分析是数据挖掘中的一个很活跃的研究领域,并提出了许多聚类算法。这些算法可以被分为划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法。1 划分方法(PAM:PArtitioning method) 首先创建k个划分,k为要创建的划分个数;然后利用一个循环定位技术通过将对...
[转] 关于数据挖掘(协同过滤、关联推荐、聚类分类)   2009-12-15 15:22:46
比如Lunece,呵呵,当年看的一点Java还是能派上用处的复旦大学的数据挖掘讨论组还是蛮不错的,呵呵主要带头人就是写《...数据挖掘》那本是的朱老师...manhattandistance or minkowski distance今天刚看到的车东推荐的:数据挖掘工具集Christian Borgelt's Webpages...
关联规则数据挖掘算法浅析   2009-12-15 15:09:04
可能有用的和最终可理解的,又可称为数据采掘。DM的定义还有一些不同的表达形式,但其本质都是一样的,即从数据库中提出隐含的、高水平的模式,其目的是为数据库理解与应用提供自动化、智能化的手段。关联规则是数据挖掘的一个重要课题,目前已受到越来越多研究者的关注...
数据仓库基础[ch15-20]-读书笔记③   2009-12-14 15:08:42
数据挖掘基础 Joseph P.Bigus在《数据挖掘和神经网络》中写道,数据挖掘是从一个大的数据聚合中有效地发现不明显却有价值的信息。数据挖掘以新事实和数据关系的自动发现为中心。1 关系2模式发现步骤1:定义商业目标步骤2:准备数据。挖掘算法影响数据的选择。为数据挖掘...
数据挖掘中一些重要问题(1)   2009-12-13 09:30:30
数据挖掘发现的模式可能存在如下问题:一、不真实的知识1.发现的知识并不代表“底层的”、本质的规律。一些“模式”具有“预言性”例如月亮的圆缺、季节的更迭,电视节目在一周类某固定时段播出;另一些可能完全不具有预言性,利于抛一枚硬币连续5次出现正面向上,第...
相关搜索