K-Means

类型：非监督学习
目的：解决聚类问题
K == K 类
Means 代表的是中心
本质：确定 K 类的中心点

工作原理

选择 K 点作为初始的类中心点
将每个点分配到最近的类中心点
重复第二部直到状态稳定

数据

根目录下面的 kmeans-master文件夹

示例文件

# coding=utf-8
from sklearn.cluster import KMeans
from sklearn import preprocessing
import pandas as pd
import numpy as np

# 输入数据
data = pd.read_csv('data.csv', encoding='gbk')
train_x = data[["2019 年国际排名 ", "2018 世界杯 ", "2015 亚洲杯 "]]
df = pd.DataFrame(train_x)
kmeans = KMeans(n_clusters=3)
# 规范化到 [0,1] 空间
min_max_scaler = preprocessing.MinMaxScaler()
train_x = min_max_scaler.fit_transform(train_x)
# kmeans 算法
kmeans.fit(train_x)
predict_y = kmeans.predict(train_x)
# 合并聚类结果，插入到原数据中
result = pd.concat((data, pd.DataFrame(predict_y)), axis=1)
result.rename({0: u'聚类'}, axis=1, inplace=True)
print(result)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

K-Means

工作原理

数据

示例文件

Files

README.md

Latest commit

History

README.md

File metadata and controls

K-Means

工作原理

数据

示例文件