🌟K-Means聚类算法:Python实现🌟
在数据分析和机器学习的世界里,K-Means聚类算法是一个非常实用且高效的工具。它能够将数据集划分为多个簇(cluster),每个簇内的数据点彼此相似,而不同簇之间的差异较大。👀
首先,我们需要导入必要的库,如`numpy`用于数值计算,`matplotlib`用于可视化展示结果。接着,定义一个简单的函数来初始化质心(centroids)。然后通过迭代更新质心位置,直到达到收敛条件为止。💻
下面是一个简单的代码示例:
```python
import numpy as np
from sklearn.datasets import make_blobs
创建模拟数据
X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)
K-Means算法实现
def k_means(X, k=4):
centroids = X[np.random.choice(X.shape[0], k, replace=False)]
while True:
distances = np.linalg.norm(X[:, None] - centroids, axis=2)
labels = np.argmin(distances, axis=1)
new_centroids = np.array([X[labels == i].mean(axis=0) for i in range(k)])
if np.all(centroids == new_centroids):
break
centroids = new_centroids
return labels, centroids
labels, centroids = k_means(X)
```
最后,利用`matplotlib`绘制聚类结果,直观地观察分组情况。🎉
通过这个过程,我们可以轻松地对数据进行分类,为后续分析提供基础支持!✨
免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。