机器学习(1)

今天学习的是K-means聚类算法

现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。

今天学习的是K-means聚类算法

K-means聚类算法

K-means聚类的思想其实还挺简单,输入的参数:1、要聚类的类别数量 2、无标签的数据集

经过不断迭代后,最终收敛为想要的类别数。

其中Ci表示对于每一个点Xi它到每一个聚类中心最近的一个,也就是他的值为1……k
对于划分后的Xi,重新求得相同Ci的类的聚类中心,更新Uk,如此迭代,知道收敛。

  • 步骤