您现在的位置:网站首页答辩论文计算机毕业设计

毕业设计 一个基于网格和密度的聚类算法的实现

  • 简介:毕业设计-一个基于网格和密度的聚类算法的实现,正文共24页,13762字。,【摘要】,权威的Gartner调查组报告显示,数据挖掘将是今后几年全球范围内重点投资研究的十大新技术之一,它引起了学术界和工业界的广泛关注,是当今数据库系统研
    类型:word    页数:24    字数:13762   
    资料包括:论文   
    • 请与管理员联系购买资料 QQ:5739126
  • 论文简介
  • 相关论文
  • 论文下载
文件大小:6.64MB
适用专业:计算机网络
适用年级:大学
论文编号:201761

论文简介:
毕业设计-一个基于网格和密度的聚类算法的实现,正文共24页,13762字。
【摘要】
权威的Gartner调查组报告显示,数据挖掘将是今后几年全球范围内重点投资研究的十大新技术之一,它引起了学术界和工业界的广泛关注,是当今数据库系统研究和应用领域内的一个热点问题。本文讨论数据挖掘中聚类的相关概念、技术和算法。在已提出的聚类算法中,一大类都是基于“距离”的概念,不管是传统的欧氏几何距离还是其它意义上的距离,如常见的k-means、k-medoids算法,这类算法的缺点在于处理大数据集和高维数据集时不够有效,另一方面它能发现的聚类个数常常依赖于用户参数的指定,而这对用户来说经常是很困难的。这里要讨论的算法与此有根本的不同,既它抛弃了距离的概念,而采取一种新的思路,我们称之为基于网格和密度的算法,它的优点在于能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;另一方面它能很好的处理高维数据和大数据集的数据表格。算法将最后的结果用DNF的形式表示出来。
【关键词】
数据挖掘、聚类规则/分析、网格、密度、高维数据、字空间、最大区域、DNF表达式

1 索引 2
2 摘要 3
3 关键词 3
4 正文 4
4.1 数据挖掘 4
4.2 聚类分析 8
4.3 算法实现及其应用背景 10
4.3.1 背景 10
4.3.2 问题描述 12
4.3.3 算法实现 15
4.3.3.1.1 找出包含聚类的子空间 15
4.3.3.1.2 找出给定子空间中的聚类 17
4.3.3.1.3 生成对聚类的一个描述 19
4.3.4 算法运行的一个实例 20
5 结束语 22
6 参考文献 23
7 致谢 23


论文文件预览:
共1文件夹,1个文件,文件总大小:6.64MB,压缩后大小:528.61KB

  • 毕业设计-一个基于网格和密度的聚类算法的实现
  • doc基于网格和密度的聚类算法的实现.doc  [6.64MB]

查看评论 已有0位网友发表了看法
  • 验证码: