sklearnでクラスタリング(その1)
データ形式がこうなっていれば、直接KMeansに渡せる。2次元データ6件分。
array([[ 1, 2], [ 1, 4], [ 1, 0], [10, 2], [10, 4], [10, 0]])
以降、確認に使ったコード
>>> import numpy as np >>> from sklearn.cluster import KMeans >>> X = np.array([[1, 2], [1, 4], [1, 0],[10, 2], [10, 4], [10, 0]]) >>> >>> X array([[ 1, 2], [ 1, 4], [ 1, 0], [10, 2], [10, 4], [10, 0]]) >>> kmeans = KMeans(n_clusters=2, random_state=0).fit(X) >>> kmeans.labels_ array([1, 1, 1, 0, 0, 0]) >>> kmeans.predict([[0, 0], [12, 3]]) array([1, 0])