预览截图
应用介绍
如果把所有数据全部喂入模型,可能会导致糟糕的结果。在高维数据集中,往往只有部分特征有良好的预测能力,很多特征纯粹是噪音(没有预测能力),很多特征彼此之间也可能高度相关,这些因素会降低模型的预测精度,训练模型的时间也更长。降低数据集的维度在某种程度上能解决这些问题。
因此,首先采用PCA来降低数据维度,使得线性相关的特征重组为1个特征,再进行聚类,可提高聚类效果
©版权声明:本文内容由互联网用户自发贡献,版权归原创作者所有,本站不拥有所有权,也不承担相关法律责任。如果您发现本站中有涉嫌抄袭的内容,欢迎发送邮件至: www_apollocode_net@163.com 进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
转载请注明出处: apollocode » PCA降维+GMM,AHC,Kmeans聚类,采用轮廓系数和CH作为评价指标
文件列表(部分)
名称 | 大小 | 修改日期 |
---|---|---|
kmeans聚类指标.py | 1.08 KB | 2022-05-09 |
PCA贡献度.py | 0.78 KB | 2022-05-06 |
GMM聚类.py | 1.03 KB | 2022-05-08 |
GMM聚类结果.py | 1.17 KB | 2022-05-09 |
HC聚类.py | 1.06 KB | 2022-05-09 |
Hc聚类指标.py | 0.70 KB | 2022-05-09 |
K-means.py | 1.78 KB | 2022-03-31 |
发表评论 取消回复