Weka是什么

2024-03-18 18:18
文章标签 weka

本文主要是介绍Weka是什么,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。它和它的源代码可在其官方网站下载。有趣的是,该软件的缩写WEKA也是New Zealand独有的一种鸟名,而Weka的主要开发者同时恰好来自New Zealand的the University of Waikato。

WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。
weka
WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、 关联规则以及在新的交互式界面上的可视化。
如果想自己实现数据挖掘算法的话,可以参考weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。
2005年8月,在第11届ACM SIGKDD国际会议上,怀卡托大学的Weka小组荣获了数据挖掘和知识探索领域的最高服务奖,Weka系统得到了广泛的认可,被誉为数据挖掘和机器学习 历史上的里程碑,是现今最完备的数据挖掘工具之一(已有11年的发展历史)。Weka的每月下载次数已超过万次。 [1]  
2014年3月起,新西兰怀卡托大学将推出Weka免费网课,课程分为初级和高级两个部分,每个部分时长5周。初级课程将于2014年3月3日开课,高级课程于2014年4月下旬开课。课程具体内容参见怀卡托大学网站Weka MOOC。课程在优酷网站也有专辑。

这篇关于Weka是什么的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/823211

相关文章

Weka的初步介绍

Weka无疑是数据挖掘入门的最好工具,初学者可以直接使用图形界面了解数据挖掘的相关算法(如何使用网上有很多教程,可以参考 http://download.csdn.net/detail/u013422712/8649239)。     进阶阶段就必须学会使用和了解Weka的源码,这会在接下去的文章中写道。

如何获取Weka源码

要研究数据挖掘,Weka是不可或缺的工具,下面就来说说如何在myeclipse中引入Weka源码。 1.首先官网上下载weka源码,有两种方式,一种是下载安装文件,安装后在安装目录中会有一个 weka-src.jar ,解压后即为源码,另一种是通过SVN下载: https://svn.cms.waikato.ac.nz/svn/weka/trunk/weka  机子上需要SVN工具

Java集成Weka做线性回归的例子

之前研究完分类的逻辑回归,继续搞一下线性回归看看。线性回归在数据挖掘领域应也是非常常见,即根据现有的数据集(行向量组成的矩阵),(训练)模拟出一个合适的规律(函数),来推测任何新给出的数据组合(向量)应该得到的值。 具体的描述可以参见各种博客,怎么推导的看来看去一知半解,但总而言之结果也简单,就是计算得到一个“适当”的多元线性函数Y=a0+a1*x1+a2*x2+a3*x3+…+ak*xk。

调用WEKA包进行kmeans聚类(java)

所用数据文件:data1.txt [plain]  view plain copy print ? @RELATION data1         @ATTRIBUTE one REAL   @ATTRIBUTE two REAL               @DATA   0.184000 0.482000   0.152000 0.540000   0.152000 0.5

weka数据预测 分类回归 方法 参数 总结

1.线性回归(LinearRegression) 1.1原理 在统计学中,线性回归是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。 1.2最小二乘法原理 线性回归模型经常用最小二乘逼近来拟合,但他们也可能

weka的二次开发

http://www.programcreek.com/java-api-examples/index.php?api=weka.classifiers.trees.RandomForest 搜索关键词 Java Code Examples for weka.classifiers.trees.RandomForest

通过weka.jar包来进行数据预处理

打开eclipse ,在对应的工程下右击,选择Build Path ->选择Configure Build Path  ->选择Libraries  ->点击Add External JARs  ->然后到你的jar包所在路径选择它。即可。 一、特征选择 [java]  view plain copy print ? package learning;

weka打开csv提示attribute names are not unique! Cause:

谢邀,人在实验室,没有中文补丁我要死了,希望weka没事 如题,初学weka,自己设了个CSV,想要试试weka的转换格式功能,没想到出现了提示attribute names are not unique! Cause:‘’ 这里的 Causes:‘85’,意思是自动识别首行的列名时,识别到了纯数字(数据如下图,首行有个 “85”),而纯数字不能作为列名* 加上列名后再导入就可以了

weka实战005:基于HashSet实现的apriori关联规则算法

这个一个apriori算法的演示版本,所有的代码都在一个类。仅供研究算法参考 package test;import java.util.Collections;import java.util.HashMap;import java.util.HashSet;import java.util.Iterator;import java.util.Vector;//用set写的a

weka实战004:fp-growth关联规则算法

apriori算法的计算量太大,如果数据集略大一些,会比较慢,非常容易内存溢出。 我们可以算一下复杂度:假设样本数有N个,样本属性为M个,每个样本属性平均有K个nominal值。 1. 计算一项频繁集的时间复杂度是O(N*M*K)。 2. 假设具有最小支持度的频繁项是q个,根据它们则依次生成一项频繁集,二项频繁集,....,r项频繁集合,它们的元素数量分别是:c(q, 1), c(q,