华教网 考试资讯 k-means聚类算法的优缺点

k-means聚类算法的优缺点

k-means聚类算法能根据较少的已知聚类样本的类别对树进行剪枝确定部分样本的分类,还能优化初始监督学习样本分类不合理的地方,但是在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的,而且当数据量非常大时,算法的时间开销是非常大的。

k-means聚类算法的优缺点

K-means算法的优点:

首先,算法能根据较少的已知聚类样本的类别对树进行剪枝确定部分样本的分类;其次,为克服少量样本聚类的不准确性,该算法本身具有优化迭代功能,在已经求得的聚类上再次进行迭代修正剪枝确定部分样本的聚类,优化了初始监督学习样本分类不合理的地方;第三,由于只是针对部分小样本可以降低总的聚类时间复杂度。

K-means算法的缺点:

首先,在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适;其次,在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。这个初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择的不好,可能无法得到有效的聚类结果;最后,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的。

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部