调用WEKA包进行kmeans聚类(java)

2024-06-20 17:08

本文主要是介绍调用WEKA包进行kmeans聚类(java),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

所用数据文件:data1.txt

[plain]  view plain copy
print ?
  1. @RELATION data1  
  2.   
  3.   
  4. @ATTRIBUTE one REAL  
  5. @ATTRIBUTE two REAL  
  6.   
  7.   
  8.   
  9.   
  10. @DATA  
  11. 0.184000 0.482000  
  12. 0.152000 0.540000  
  13. 0.152000 0.596000  
  14. 0.178000 0.626000  
  15. 0.206000 0.598000  
  16. 0.230000 0.562000  
  17. 0.224000 0.524000  
  18. 0.204000 0.540000  
  19. 0.190000 0.572000  
  20. 0.216000 0.608000  
  21. 0.240000 0.626000  
  22. 0.256000 0.584000  
  23. 0.272000 0.546000  
  24. 0.234000 0.468000  
  25. 0.222000 0.490000  
  26. 0.214000 0.414000  
  27. 0.252000 0.336000  
  28. 0.298000 0.336000  
  29. 0.316000 0.376000  
  30. 0.318000 0.434000  
  31. 0.308000 0.480000  
  32. 0.272000 0.408000  
  33. 0.272000 0.462000  
  34. 0.280000 0.524000  
  35. 0.296000 0.544000  
  36. 0.340000 0.534000  
  37. 0.346000 0.422000  
  38. 0.354000 0.356000  
  39. 0.160000 0.282000  
  40. 0.160000 0.282000  
  41. 0.156000 0.398000  
  42. 0.138000 0.466000  
  43. 0.154000 0.442000  
  44. 0.180000 0.334000  
  45. 0.184000 0.300000  
  46. 0.684000 0.420000  
  47. 0.678000 0.494000  
  48. 0.710000 0.592000  
  49. 0.716000 0.508000  
  50. 0.744000 0.528000  
  51. 0.716000 0.540000  
  52. 0.692000 0.540000  
  53. 0.696000 0.494000  
  54. 0.722000 0.466000  
  55. 0.738000 0.474000  
  56. 0.746000 0.484000  
  57. 0.750000 0.500000  
  58. 0.746000 0.440000  
  59. 0.718000 0.446000  
  60. 0.692000 0.466000  
  61. 0.746000 0.418000  
  62. 0.768000 0.460000  
  63. 0.272000 0.290000  
  64. 0.240000 0.376000  
  65. 0.212000 0.410000  
  66. 0.154000 0.564000  
  67. 0.252000 0.704000  
  68. 0.298000 0.714000  
  69. 0.314000 0.668000  
  70. 0.326000 0.566000  
  71. 0.344000 0.468000  
  72. 0.324000 0.632000  
  73. 0.164000 0.688000  
  74. 0.216000 0.684000  
  75. 0.392000 0.682000  
  76. 0.392000 0.628000  
  77. 0.392000 0.518000  
  78. 0.398000 0.502000  
  79. 0.392000 0.364000  
  80. 0.360000 0.308000  
  81. 0.326000 0.308000  
  82. 0.402000 0.342000  
  83. 0.404000 0.418000  
  84. 0.634000 0.458000  
  85. 0.650000 0.378000  
  86. 0.698000 0.348000  
  87. 0.732000 0.350000  
  88. 0.766000 0.364000  
  89. 0.800000 0.388000  
  90. 0.808000 0.428000  
  91. 0.826000 0.466000  
  92. 0.842000 0.510000  
  93. 0.842000 0.556000  
  94. 0.830000 0.594000  
  95. 0.772000 0.646000  
  96. 0.708000 0.654000  
  97. 0.632000 0.640000  
  98. 0.628000 0.564000  
  99. 0.624000 0.352000  
  100. 0.650000 0.286000  
  101. 0.694000 0.242000  
  102. 0.732000 0.214000  
  103. 0.832000 0.214000  
  104. 0.832000 0.264000  
  105. 0.796000 0.280000  
  106. 0.778000 0.288000  
  107. 0.770000 0.294000  
  108. 0.892000 0.342000  
  109. 0.910000 0.366000  
  110. 0.910000 0.394000  
  111. 0.872000 0.382000  
  112. 0.774000 0.314000  
  113. 0.718000 0.252000  
  114. 0.688000 0.284000  
  115. 0.648000 0.322000  
  116. 0.602000 0.460000  
  117. 0.596000 0.496000  
  118. 0.570000 0.550000  
  119. 0.564000 0.592000  
  120. 0.574000 0.624000  
  121. 0.582000 0.644000  
  122. 0.596000 0.664000  
  123. 0.662000 0.704000  
  124. 0.692000 0.722000  
  125. 0.710000 0.736000  
  126. 0.848000 0.732000  
  127. 0.888000 0.686000  
  128. 0.924000 0.514000  
  129. 0.914000 0.470000  
  130. 0.880000 0.492000  
  131. 0.848000 0.706000  
  132. 0.730000 0.736000  
  133. 0.676000 0.734000  
  134. 0.628000 0.732000  
  135. 0.782000 0.708000  
  136. 0.806000 0.674000  
  137. 0.830000 0.630000  
  138. 0.564000 0.730000  
  139. 0.554000 0.538000  
  140. 0.570000 0.502000  
  141. 0.572000 0.432000  
  142. 0.590000 0.356000  
  143. 0.652000 0.232000  
  144. 0.676000 0.178000  
  145. 0.684000 0.152000  
  146. 0.728000 0.172000  
  147. 0.758000 0.148000  
  148. 0.864000 0.176000  
  149. 0.646000 0.242000  
  150. 0.638000 0.254000  
  151. 0.766000 0.276000  
  152. 0.882000 0.278000  
  153. 0.900000 0.278000  
  154. 0.906000 0.302000  
  155. 0.892000 0.316000  
  156. 0.570000 0.324000  
  157. 0.798000 0.150000  
  158. 0.832000 0.114000  
  159. 0.714000 0.156000  
  160. 0.648000 0.154000  
  161. 0.644000 0.212000  
  162. 0.642000 0.250000  
  163. 0.658000 0.284000  
  164. 0.710000 0.296000  
  165. 0.794000 0.288000  
  166. 0.846000 0.260000  
  167. 0.856000 0.304000  
  168. 0.858000 0.392000  
  169. 0.858000 0.476000  
  170. 0.778000 0.640000  
  171. 0.736000 0.662000  
  172. 0.718000 0.690000  
  173. 0.634000 0.692000  
  174. 0.596000 0.710000  
  175. 0.570000 0.720000  
  176. 0.554000 0.732000  
  177. 0.548000 0.686000  
  178. 0.524000 0.740000  
  179. 0.598000 0.768000  
  180. 0.660000 0.796000  

前言:Kmeans是一种非常经典的聚类算法。它利用簇的中心到对象的距离来分配每个对象的簇所属关系。同时迭代的进行簇的中心的更新以及簇分配的更新,直到收敛。


下面是调用weka包中实现的kmeans的代码


[java]  view plain copy
print ?
  1. package others;  
  2.   
  3. import java.io.File;  
  4.   
  5. import weka.clusterers.SimpleKMeans;  
  6. import weka.core.DistanceFunction;  
  7. import weka.core.Instances;  
  8. import weka.core.converters.ArffLoader;  
  9.   
  10. public class ArrayListTest {  
  11.   
  12.     public static void main(String[] args){  
  13.         Instances ins = null;  
  14.           
  15.         SimpleKMeans KM = null;  
  16.         DistanceFunction disFun = null;  
  17.           
  18.         try {  
  19.             // 读入样本数据  
  20.             File file = new File("data/data1.txt");  
  21.             ArffLoader loader = new ArffLoader();  
  22.             loader.setFile(file);  
  23.             ins = loader.getDataSet();  
  24.               
  25.             // 初始化聚类器 (加载算法)  
  26.             KM = new SimpleKMeans();  
  27.             KM.setNumClusters(4);       //设置聚类要得到的类别数量  
  28.             KM.buildClusterer(ins);     //开始进行聚类  
  29.             System.out.println(KM.preserveInstancesOrderTipText());  
  30.             // 打印聚类结果  
  31.             System.out.println(KM.toString());  
  32.               
  33.         } catch(Exception e) {  
  34.             e.printStackTrace();  
  35.         }  
  36.     }  
  37. }  

这篇关于调用WEKA包进行kmeans聚类(java)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1078742

相关文章

springboot集成easypoi导出word换行处理过程

《springboot集成easypoi导出word换行处理过程》SpringBoot集成Easypoi导出Word时,换行符n失效显示为空格,解决方法包括生成段落或替换模板中n为回车,同时需确... 目录项目场景问题描述解决方案第一种:生成段落的方式第二种:替换模板的情况,换行符替换成回车总结项目场景s

SpringBoot集成redisson实现延时队列教程

《SpringBoot集成redisson实现延时队列教程》文章介绍了使用Redisson实现延迟队列的完整步骤,包括依赖导入、Redis配置、工具类封装、业务枚举定义、执行器实现、Bean创建、消费... 目录1、先给项目导入Redisson依赖2、配置redis3、创建 RedissonConfig 配

SpringBoot中@Value注入静态变量方式

《SpringBoot中@Value注入静态变量方式》SpringBoot中静态变量无法直接用@Value注入,需通过setter方法,@Value(${})从属性文件获取值,@Value(#{})用... 目录项目场景解决方案注解说明1、@Value("${}")使用示例2、@Value("#{}"php

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

基于 Cursor 开发 Spring Boot 项目详细攻略

《基于Cursor开发SpringBoot项目详细攻略》Cursor是集成GPT4、Claude3.5等LLM的VSCode类AI编程工具,支持SpringBoot项目开发全流程,涵盖环境配... 目录cursor是什么?基于 Cursor 开发 Spring Boot 项目完整指南1. 环境准备2. 创建

Spring Security简介、使用与最佳实践

《SpringSecurity简介、使用与最佳实践》SpringSecurity是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架,本文给大家介绍SpringSec... 目录一、如何理解 Spring Security?—— 核心思想二、如何在 Java 项目中使用?——

SpringBoot+RustFS 实现文件切片极速上传的实例代码

《SpringBoot+RustFS实现文件切片极速上传的实例代码》本文介绍利用SpringBoot和RustFS构建高性能文件切片上传系统,实现大文件秒传、断点续传和分片上传等功能,具有一定的参考... 目录一、为什么选择 RustFS + SpringBoot?二、环境准备与部署2.1 安装 RustF

springboot中使用okhttp3的小结

《springboot中使用okhttp3的小结》OkHttp3是一个JavaHTTP客户端,可以处理各种请求类型,比如GET、POST、PUT等,并且支持高效的HTTP连接池、请求和响应缓存、以及异... 在 Spring Boot 项目中使用 OkHttp3 进行 HTTP 请求是一个高效且流行的方式。

java.sql.SQLTransientConnectionException连接超时异常原因及解决方案

《java.sql.SQLTransientConnectionException连接超时异常原因及解决方案》:本文主要介绍java.sql.SQLTransientConnectionExcep... 目录一、引言二、异常信息分析三、可能的原因3.1 连接池配置不合理3.2 数据库负载过高3.3 连接泄漏