CyberCoder
  • 首页 (current)
  • 问答

重复样本

如何解决K-均值算法中重复样本占比过大的情况?
1686245024

在使用K-均值算法时,重复的样本可能会导致一些问题,特别是当重复样本占比太大时。这会导致簇中心不稳定,聚类效果不佳。所以,如何解决这个问题呢?我使用K-均值算法对大量数据集进行了聚类,发现一些解决方法。首先可以通过移除重复的样本数据。另一种方法是对于每个簇,选择最近...

提问者:Street_Soul
cyberCoder.cn