Cluster K-means

Formula magica per fare un raggruppamento in N(=20) cluster a partire da un csv in cui la colonna 3 contiene il valore sui cui raggruppare:

import pandas as pd
a=pd.read_csv("C:/TMP_TEST/DATI.csv", sep=",")
numrighe=a.shape[0]

from sklearn.cluster import KMeans
y = KMeans(n_clusters=10).fit_predict((a.values[:,2]).reshape(-1,1))

import numpy as np
np.savetxt('C:/TMP_TEST/ouc.csv', y, delimiter=',')

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *