Matlab数据挖掘工具箱 spider + Weka

2023-12-15 11:08

本文主要是介绍Matlab数据挖掘工具箱 spider + Weka,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

http://blog.sciencenet.cn/home.php?mod=space&uid=242887&do=blog&id=263095

转自数据挖掘青年 http://blogger.org.cn/blog/more.asp?name=DMman&id=27375

一 spider主页http://www.kyb.mpg.de/bs/people/spider/ (也可以在google上搜索spider matlab得到),关于它的介绍可以参考网址资料

二 使用时为matlab+spider+Weka;因为spider中的一些算法引用了Weka,比如j48

安装注意:

1 matlab7(R14)

  6.5版本对java的支持不够,还没有开发javaclasspath等函数

??? Undefined function or variable 'javaclasspath'.
??? Undefined function or variable 'javaaddclasspath'.

2 jre1.4.2

 matlab7自带的是1.4.2;matlab6自带的是1.3.可以在D:\MATLAB7\sys\java\jre\win32下看到。如果装了matlab7,使用它自带的1.4.2就可以了,尤其不要使用1.6,因为1.6太新了,matlab还不支持。可以在Matlab下使用 version -java查看JVM版本。

 如果你想使用1.5的话,C:\Program Files\Java\jre1.5.0_10;把jre1.5.0_10这个文件夹拷贝到D:\MATLAB7\sys\java\jre\win32下,然后增加环境变量MATLAB_JAVA:D:\MATLAB7\sys\java\jre\win32\jre1.5.0_10。这一步如果有问题的话,重启Matlab会给出错误提示。找不到什么什么文件...

3 Weka3.4.10

  使用weka版本低一些即可,高的不行,因为高版本的weka可能是用高版本的jvm支持的。

我使用的组合是 matlab7(R14)+jre1.4.2(matlab7自带的,不需要任何设置)+Weka3.4.10

weka 下载:http://www.cs.waikato.ac.nz/ml/weka/

三 使用方法

1 下载spider,有core和extra两个压缩包,把他们解压到同一个文件夹spider下面,然后放到$matlabroot\toolbox下面

2下载weka3.4.10,找到weka.jar放到$matlabroot\java\jar下面

3 启动Matlab打开$matlabroot\toolbox\spider\use_spider.m运行

提示spider的一些信息和 WEKA support enabled!表示成功了。

然后可以使用 help spider命令查看信息,他的功能列出如附录,然后就可以训练了。

四 一个简单的例子

X=rand(50)-0.5; Y=sign(sum(X,2));
dtrain=data(X,Y);
%生成训练集,也可以使用load()从文件读取

model=train(svm,dtrain));
%使用函数train()训练模型

rtest=test(dtest,model);
%使用训练好的模型对验证集dtest测试,返回测试结果

五 附录spider信息

最新spider Version 1.71 (24/7/2006)

 Basic library objects. 
    data         - Storing input data and output results 
    data_global  - Implementation of data object that limits memory overhead
    algorithm    - Generic algorithm object
    group        - Groups sets of objects together (algorithms or data) 
    loss         - Evaluates loss functions
    get_mean     - Takes mean loss over groups of algs
    chain        - Builds chains of objects: output of one to input of another
    param        - To train and test different hyperparameters of an object
    cv           - Cross validation using objects given data
    kernel       - Evaluates and caches kernel functions
    distance     - Evaluates and caches distance functions
 
  Statistical Tests objects.
    wilcoxon     - Wilcoxon test of statistical significance of results
    corrt_test   - Corrected resampled t-test - for dependent trials
 
  Dataset objects.
    spiral       - Spiral dataset generator.
    toy          - Generator of dataset with only a few relevant features
    toy2d        - Simple 2d Gaussian problem generator
    toyreg       - Linear Regression with o outputs and n inputs 
 
  Pre-Processing objects
    normalize    - Simple normalization of data
    map          - General user specified mapping function of data
 
  Density Estimation objects.
    parzen       - Parzen's windows kernel density estimator
    indep        - Density estimator which assumes feature independence
    bayes        - Classifer based on density estimation for each class
    gauss        - Normal distribution density estimator
                     
  Pattern Recognition objects.
    svm          - Support Vector Machine (svm)
    c45          - C4.5 for binary or multi-class 
    knn          - k-nearest neighbours
    platt        - Conditional Probability estimation for margin classifiers
    mksvm        - Multi-Kernel LP-SVM
    anorm        - Minimize the a-norm in alpha space using kernels
    lgcz         - Local and Global Consistent Learner 
    bagging      - Bagging Classifier
    adaboost     - ADABoost method
    hmm          - Hidden Markov Model 
    loom         - Leave One Out Machine 
    l1           - Minimize l1 norm of w for a linear separator 
    kde          - Kernel Dependency Estimation: general input/output machine
    dualperceptron       - Kernel Perceptron
    ord_reg_perceptron   - Ordinal Regression Perceptron (Shen et al.)
    splitting_perceptron - Splitting Perceptron (Shen et al.)
    budget_perceptron    - Sparse, online Pereceptron (Crammer et al.)
    randomforest - Random Forest Decision Trees         WEKA-Required
    j48          - J48 Decision Trees for binary        WEKA-Required
 
  Multi-Class and Multi-label objects. 
    one_vs_rest  - Voting method of one against the rest (also for multi-label)
    one_vs_one   - Voting method of one against one
    mc_svm       - Multi-class Support Vector Machine by J.Weston
    c45          - C4.5 for binary or multi-class 
    knn          - k-nearest neighbours
                
  Feature Selection objects.
    feat_sel     - Generic object for feature selection + classifier
    r2w2_sel     - SVM Bound-based feature selection
    rfe          - Recursive Feature Elimination (also for the non-linear case)
    l0           - Dual zero-norm minimization (Weston, Elisseeff)
    fsv          - Primal zero-norm based feature selection (Mangasarian)
    fisher       - Fisher criterion feature selection
    mars         - selection algorithm of Friedman (greedy selection)
    clustub      - Multi-class feature selection using spectral clustering
    mutinf       - Mutual Information for feature selection.
       
  Regression objects.
    svr          - Support Vector Regression
    gproc        - Gaussian Process Regression 
    relvm_r      - Relevance vector machine 
    multi_rr     - (possibly multi-dimensional) ridge regression   
    mrs          - Multivariate Regression via Stiefel Constraints      
    knn          - k-nearest neighbours
    multi_reg    - meta method for independent multiple output regression
    kmp          - kernel matching pursuit
    kpls         - kernel partial least squares
    lms          - least mean squared regression [now obselete due to multi_rr]
    rbfnet       - Radial Basis Function Network (with moving centers)
    reptree      - Reduced Error Pruning Tree       WEKA-Required
 
  Model Selection objects.
    gridsel      - select parameters from a grid of values 
    r2w2_sel     - Selecting SVM parameters by generalization bound
    bayessel     - Bayessian parameter selection 
 
  Unsupervised objects.
    one_class_svm - One class SVM
    kmeans       - K means clustering
    kvq          - Kernel Vector Quantization
    kpca         - Kernel Principal Components Analysis
    ppca         - Probabilistic Principal Component Analysis
    nmf          - Non-negative Matrix factorization
    spectral     - Spectral clustering
    mrank        - Manifold ranking
    ppca         - Probabilistic PCA
 
  Reduced Set and Pre-Image objects.
    pmg_mds      - Calculate Pre-Images based on multi-dimensional scaling
    pmg_rr       - Calculate Pre-Images based on learning and ridge regression
    rsc_burges   - Bottom Up Reduced Set; calculates reduced set based on gradient descent
    rsc_fp       - Bottom Up Reduced Set; calculates reduced set for rbf with fixed-point iteration schemes
    rsc_mds      - Top Down Reduced Set; calculates reduced set with multi-dimensional scaling
    rsc_learn    - Top Down Reduced Set; calculates reduced set with ridge regression
    rss_l1       - Reduced Set Selection via L1 penalization
    rss_l0       - Reduced Set Selection via L0 penalization
    rss_mp       - Reduced Set Selection via matching pursuit

这篇关于Matlab数据挖掘工具箱 spider + Weka的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/496228

相关文章

matlab读取NC文件(含group)

matlab读取NC文件(含group): NC文件数据结构: 代码: % 打开 NetCDF 文件filename = 'your_file.nc'; % 替换为你的文件名% 使用 netcdf.open 函数打开文件ncid = netcdf.open(filename, 'NC_NOWRITE');% 查看文件中的组% 假设我们想读取名为 "group1" 的组groupName

利用matlab bar函数绘制较为复杂的柱状图,并在图中进行适当标注

示例代码和结果如下:小疑问:如何自动选择合适的坐标位置对柱状图的数值大小进行标注?😂 clear; close all;x = 1:3;aa=[28.6321521955954 26.2453660695847 21.69102348512086.93747104431360 6.25442246899816 3.342835958564245.51365061796319 4.87

C# double[] 和Matlab数组MWArray[]转换

C# double[] 转换成MWArray[], 直接赋值就行             MWNumericArray[] ma = new MWNumericArray[4];             double[] dT = new double[] { 0 };             double[] dT1 = new double[] { 0,2 };

安卓玩机工具------小米工具箱扩展工具 小米机型功能拓展

小米工具箱扩展版                     小米工具箱扩展版 iO_Box_Mi_Ext是由@晨钟酱开发的一款适用于小米(MIUI)、多亲(2、2Pro)、多看(多看电纸书)的多功能工具箱。该工具所有功能均可以免root实现,使用前,请打开开发者选项中的“USB调试”  功能特点 【小米工具箱】 1:冻结MIUI全家桶,隐藏状态栏图标,修改下拉通知栏图块数量;冻结

libsvm在matlab中的使用方法

原文地址:libsvm在matlab中的使用方法 作者: lwenqu_8lbsk 前段时间,gyp326曾在论坛里问libsvm如何在matlab中使用,我还奇怪,认为libsvm是C的程序,应该不能。没想到今天又有人问道,难道matlab真的能运行libsvm。我到官方网站看了下,原来,真的提供了matlab的使用接口。 接口下载在: http://www.csie.ntu.edu.

Matlab/Simulink中PMSM模型的反电动势系数和转矩系数

Matlab/Simulink中PMSM模型的反电动势系数和转矩系数_matlab pmsm-CSDN博客

MATLAB层次聚类分析法

转自:http://blog.163.com/lxg_1123@126/blog/static/74841406201022774051963/ 层次聚类是基于距离的聚类方法,MATLAB中通过pdist、linkage、dendrogram、cluster等函数来完成。层次聚类的过程可以分这么几步: (1) 确定对象(实际上就是数据集中的每个数据点)之间的相似性,实际上就是定义一个表征

PSINS工具箱函数介绍——pvtplot

关于工具箱 pvtplot是绘图函数,用于绘制位置、速度、时间信息 本文所述的代码需要基于PSINS工具箱,工具箱的讲解: PSINS初学指导:https://blog.csdn.net/callmeup/article/details/137087932 使用方法 使用例程: pvtplot(pvt, 't0h'); 例程实践 运行代码 运行程序“test_GPS_PVT.

MATLAB的fix(),floor()和ceil()函数的区别与联系

fix(x),floor(x)和ceil(x)函数都是对x取整,只不过取整方向不同而已。 这里的方向是以x轴作为横坐标来看的,向右就是朝着正轴方向,向左就是朝着负轴方向。 fix(x):向0取整(也可以理解为向中间取整) floor(x):向左取整 ceil(x):向右取整 举例: 4个数:a=3.3、b=3.7、c=-3.3、d=-3.7 fix(a)=3 fl

MATLAB中的eig函数

在MATLAB中,计算矩阵A的特征值和特征向量的函数是eig(A),常用的调用格式有5种: E=eig(A):求矩阵A的全部特征值,构成向量E。 [V,D]=eig(A):求矩阵A的全部特征值,构成对角阵D,并求A的特征向量构成V的列向量。 [V,D]=eig(A,'nobalance'):与第2种格式类似,但第2种格式中先对A作相似变换后求矩阵A的特征值和特征向量,而格式3直接求矩阵A的特