调用WEKA包进行kmeans聚类（java）

本文主要是介绍调用WEKA包进行kmeans聚类（java），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

所用数据文件：data1.txt

[plain]  view plain copy  
 print ? 
 @RELATION data1  
   
   
 @ATTRIBUTE one REAL  
 @ATTRIBUTE two REAL  
   
   
   
   
 @DATA  
184000 0.482000  
152000 0.540000  
152000 0.596000  
178000 0.626000  
206000 0.598000  
230000 0.562000  
224000 0.524000  
204000 0.540000  
190000 0.572000  
216000 0.608000  
240000 0.626000  
256000 0.584000  
272000 0.546000  
234000 0.468000  
222000 0.490000  
214000 0.414000  
252000 0.336000  
298000 0.336000  
316000 0.376000  
318000 0.434000  
308000 0.480000  
272000 0.408000  
272000 0.462000  
280000 0.524000  
296000 0.544000  
340000 0.534000  
346000 0.422000  
354000 0.356000  
160000 0.282000  
160000 0.282000  
156000 0.398000  
138000 0.466000  
154000 0.442000  
180000 0.334000  
184000 0.300000  
684000 0.420000  
678000 0.494000  
710000 0.592000  
716000 0.508000  
744000 0.528000  
716000 0.540000  
692000 0.540000  
696000 0.494000  
722000 0.466000  
738000 0.474000  
746000 0.484000  
750000 0.500000  
746000 0.440000  
718000 0.446000  
692000 0.466000  
746000 0.418000  
768000 0.460000  
272000 0.290000  
240000 0.376000  
212000 0.410000  
154000 0.564000  
252000 0.704000  
298000 0.714000  
314000 0.668000  
326000 0.566000  
344000 0.468000  
324000 0.632000  
164000 0.688000  
216000 0.684000  
392000 0.682000  
392000 0.628000  
392000 0.518000  
398000 0.502000  
392000 0.364000  
360000 0.308000  
326000 0.308000  
402000 0.342000  
404000 0.418000  
634000 0.458000  
650000 0.378000  
698000 0.348000  
732000 0.350000  
766000 0.364000  
800000 0.388000  
808000 0.428000  
826000 0.466000  
842000 0.510000  
842000 0.556000  
830000 0.594000  
772000 0.646000  
708000 0.654000  
632000 0.640000  
628000 0.564000  
624000 0.352000  
650000 0.286000  
694000 0.242000  
732000 0.214000  
832000 0.214000  
832000 0.264000  
796000 0.280000  
778000 0.288000  
770000 0.294000  
892000 0.342000  
910000 0.366000  
910000 0.394000  
872000 0.382000  
774000 0.314000  
718000 0.252000  
688000 0.284000  
648000 0.322000  
602000 0.460000  
596000 0.496000  
570000 0.550000  
564000 0.592000  
574000 0.624000  
582000 0.644000  
596000 0.664000  
662000 0.704000  
692000 0.722000  
710000 0.736000  
848000 0.732000  
888000 0.686000  
924000 0.514000  
914000 0.470000  
880000 0.492000  
848000 0.706000  
730000 0.736000  
676000 0.734000  
628000 0.732000  
782000 0.708000  
806000 0.674000  
830000 0.630000  
564000 0.730000  
554000 0.538000  
570000 0.502000  
572000 0.432000  
590000 0.356000  
652000 0.232000  
676000 0.178000  
684000 0.152000  
728000 0.172000  
758000 0.148000  
864000 0.176000  
646000 0.242000  
638000 0.254000  
766000 0.276000  
882000 0.278000  
900000 0.278000  
906000 0.302000  
892000 0.316000  
570000 0.324000  
798000 0.150000  
832000 0.114000  
714000 0.156000  
648000 0.154000  
644000 0.212000  
642000 0.250000  
658000 0.284000  
710000 0.296000  
794000 0.288000  
846000 0.260000  
856000 0.304000  
858000 0.392000  
858000 0.476000  
778000 0.640000  
736000 0.662000  
718000 0.690000  
634000 0.692000  
596000 0.710000  
570000 0.720000  
554000 0.732000  
548000 0.686000  
524000 0.740000  
598000 0.768000  
660000 0.796000  

前言：Kmeans是一种非常经典的聚类算法。它利用簇的中心到对象的距离来分配每个对象的簇所属关系。同时迭代的进行簇的中心的更新以及簇分配的更新，直到收敛。

下面是调用weka包中实现的kmeans的代码

[java]  view plain copy  
 print ? 
 package others;  
   
 import java.io.File;  
   
 import weka.clusterers.SimpleKMeans;  
 import weka.core.DistanceFunction;  
 import weka.core.Instances;  
 import weka.core.converters.ArffLoader;  
   
 public class ArrayListTest {  
   
     public static void main(String[] args){  
         Instances ins = null;  
           
         SimpleKMeans KM = null;  
         DistanceFunction disFun = null;  
           
         try {  
             // 读入样本数据  
             File file = new File("data/data1.txt");  
             ArffLoader loader = new ArffLoader();  
             loader.setFile(file);  
             ins = loader.getDataSet();  
               
             // 初始化聚类器 （加载算法）  
             KM = new SimpleKMeans();  
             KM.setNumClusters(4);       //设置聚类要得到的类别数量  
             KM.buildClusterer(ins);     //开始进行聚类  
             System.out.println(KM.preserveInstancesOrderTipText());  
             // 打印聚类结果  
             System.out.println(KM.toString());  
               
         } catch(Exception e) {  
             e.printStackTrace();  
         }  
     }  
 }