简介
我们每个人的生活都离不开数据。大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观察微生物一样,大数据正改变我们的生活和理解世界的方式,成为新发明和新服务的源泉。数据挖掘是信息产业界近来非常热门的研究方向,聚类分析是数据挖掘中的核心技术。聚类分析广泛应用于模式识别、信息检索、图像处理、机器学习等领域。K-均值算法是基于原型的聚类技术,具有简单、快速并有效处理大规模数据的优点,是应用最广泛的聚类方法之一。本讲主要介绍K-means聚类技术,及在R软件上的算法实现。
授课对象
授课对象: 了解R软件的简单应用和简单的距离概念即可。适用于大一至大四等有兴趣的同学。
课程内容
本讲的主要内容: 1.K-means算大简介。 2.算法要点。 3.算法示例。 4.算法性能分析。 5.算法改进。 6.R语言实现K-均值聚类建模。
授课方式
课时:4课时,2小时讲课,2小时上机实习。
上课地点
仙林校区综合实验楼丙区-504
上课时间
周二晚上18:30-21:00或周四晚上18:30-21:00
参考资料
1. 数据挖掘导论,Pang-Ning Tan,Michael Steinbach,Vipin Kumar著,范明,范宏建等译(2010),人民邮电出版社
2. 大数据时代,Viktor Mayer-Sch nberger , Kenneth Cukier著 盛杨燕 ,周涛译(2013)浙江人民出版社
3. 百度文库 http://www.baidu.com.
下载文件
登录查看文件