【域适应】基于散度成分分析(SCA)的四分类任务典型方法实现

2024-04-11 21:20

本文主要是介绍【域适应】基于散度成分分析(SCA)的四分类任务典型方法实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关于

SCA(scatter component analysis)是基于一种简单的几何测量,即分散,它在再现内核希尔伯特空间上进行操作。 SCA找到一种在最大化类的可分离性、最小化域之间的不匹配和最大化数据的可分离性之间进行权衡的表示;每一个都通过分散进行量化。 

参考论文:Shibboleth Authentication Request

工具

MATLAB

方法实现

SCA变换实现
function [test_accuracy, predicted_labels, Zs, Zt] = SCA(X_s_cell, Y_s_cell, X_t, Y_t, params)INPUT(params is optional):X_s_cell          - cell of (n_s*d) matrix, each matrix corresponds to the instance features of a source domainY_s_cell          - cell of (n_s*1) matrix, each matrix corresponds to the instance labels of a source domainX_t               - (n_t*d) matrix, rows correspond to instances and columns correspond to featuresY_t               - (n_t*1) matrix, each row is the class label of corresponding instances in X_t[params]          - params.beta:      vector of validated values of betaparams.delta:     vector of validated values of deltaparams.k_list:    vector of validated dimension of the transformed spaceparams.X_v:       (n_v*d) matrix of instance features of validation set (use the source instances if not provided)params.Y_v:       (n_v*1) matrix of instance labels of validation set (use the source instances if not provided)params.verbose:   if true, show the validation accuracy of each parameter settingOUTPUT:test_accuracy     - test accuracy on target instancespredicted_labels  - predicted labels of target instancesZs                - projected source domain instancesZt                - projected target domain instancesShoubo Hu (shoubo.sub [at] gmail.com)
2019-06-02Reference
[1] Ghifary, M., Balduzzi, D., Kleijn, W. B., & Zhang, M. (2017). Scatter component analysis: A unified framework for domain adaptation and domain generalization. IEEE transactions on pattern analysis and machine intelligence, 39(7), 1414-1430.
%}if nargin < 4error('Error. \nOnly %d input arguments! At least 4 required', nargin);elseif nargin == 4% default params valuesbeta = [0.1 0.3 0.5 0.7 0.9];delta = [1e-3 1e-2 1e-1 1 1e1 1e2 1e3 1e4 1e5 1e6];k_list = [2];X_v = cat(1, X_s_cell{:});Y_v = cat(1, Y_s_cell{:});verbose = false;elseif nargin == 5if ~isfield(params, 'beta')beta = [0.1 0.3 0.5 0.7 0.9];elsebeta = params.beta;endif ~isfield(params, 'delta')delta = [1e-3 1e-2 1e-1 1 1e1 1e2 1e3 1e4 1e5 1e6];elsedelta = params.delta;endif ~isfield(params, 'k_list')k_list = [2];elsek_list = params.k_list;endif ~isfield(params, 'verbose')verbose = false;elseverbose = params.verbose;endif ~isfield(params, 'X_v')X_v = cat(1, X_s_cell{:});Y_v = cat(1, Y_s_cell{:});elseif ~isfield(params, 'Y_v')error('Error. Labels of validation set needed!');endX_v = params.X_v;Y_v = params.Y_v;endend% ----- training phase% ----- ----- source domainsX_s = cat(1, X_s_cell{:});Y_s = cat(1, Y_s_cell{:});fprintf('Number of source domains: %d, Number of classes: %d.\n', length(X_s_cell), length(unique(Y_s)) );fprintf('Validating hyper-parameters ...\n');dist_s_s = pdist2(X_s, X_s);dist_s_s = dist_s_s.^2;sgm_s = compute_width(dist_s_s);% ----- ----- validation setdist_s_v = pdist2(X_s, X_v);dist_s_v = dist_s_v.^2;sgm_v = compute_width(dist_s_s);n_s = size(X_s, 1);n_v = size(X_v, 1);H_s = eye(n_s) - ones(n_s)./n_s;H_v = eye(n_v) - ones(n_v)./n_v;K_s_s = exp(-dist_s_s./(2 * sgm_s * sgm_s));K_s_v = exp(-dist_s_v./(2 * sgm_v * sgm_v));K_s_v_bar = H_s * K_s_v * H_v;[P, T, D, Q, K_s_s_bar] = SCA_terms(K_s_s, X_s_cell, Y_s_cell);acc_mat = zeros(length(k_list), length(beta), length(delta));for i = 1:length(beta)cur_beta = beta(i);for j = 1:length(delta)cur_delta = delta(j);[B, A] = SCA_trans(P, T, D, Q, K_s_s_bar, cur_beta, cur_delta, 1e-5);for k = 1:length(k_list)[acc, ~, ~, ~] = SCA_test(B, A, K_s_s_bar, K_s_v_bar, Y_s, Y_v, k_list( k ) );acc_mat(k, i, j) = acc;if verbosefprintf('beta: %f, delta: %f, acc: %f\n', cur_beta, cur_delta, acc);endendendendfprintf('Validation done! Classifying the target domain instances ...\n');% ----- test phase% ----- ----- get optimal parametersacc_tr_best = max( acc_mat(:) );ind = find( acc_mat == acc_tr_best );[k, i, j] = size( acc_mat );[best_k, best_i, best_j] = ind2sub([k, i, j], ind(1));best_beta = beta(best_i);best_delta = delta(best_j);best_k = k_list(best_k);% ----- ----- test on the target domaindist_s_t = pdist2(X_s, X_t);dist_s_t = dist_s_t.^2;sgm = compute_width(dist_s_t);K_s_t = exp(-dist_s_t./(2 * sgm * sgm));n_s = size(X_s, 1);H_s = eye(n_s) - ones(n_s)./n_s;n_t = size(X_t, 1);H_t = eye(n_t) - ones(n_t)./n_t;K_s_t_bar = H_s * K_s_t * H_t;[B, A] = SCA_trans(P, T, D, Q, K_s_s_bar, best_beta, best_delta, 1e-5);[test_accuracy, predicted_labels, Zs, Zt] = SCA_test(B, A, K_s_s_bar, K_s_t_bar, Y_s, Y_t, best_k );fprintf('Test accuracy: %f\n', test_accuracy);end
基于SCA的域迁移分类实现
clear all
clcaddpath('./modules');
load('./syn_data/data.mat');% ----- parameters
% target / all / source domains
tgt_dm = [5];
val_dm = [3 4];
src_dm = [1 2];data_cell = XY_cell;
X_t = data_cell{tgt_dm(1)}(:, 1:2);
Y_t = data_cell{tgt_dm(1)}(:, 3);% ----- training data
X_s_cell = cell(1,length(src_dm));
Y_s_cell = cell(1,length(src_dm));    
for idx = 1:length(src_dm)cu_dm = src_dm(1, idx);X_s_cell{idx} = data_cell{cu_dm}(:, 1:2);Y_s_cell{idx} = data_cell{cu_dm}(:, 3);
end
% ----- validation data
X_v = [];
Y_v = [];
for idx = 1:length(val_dm)cu_dm = val_dm(1, idx);X_v = [X_v; data_cell{cu_dm}(:, 1:2)];Y_v = [Y_v; data_cell{cu_dm}(:, 3)];
endparams.X_v = X_v;
params.Y_v = Y_v;
params.verbose = true;
[test_accuracy, predicted_labels, Zs, Zt] = SCA(X_s_cell, Y_s_cell, X_t, Y_t, params);

代码获取

相关问题和代码开发,可后台私信沟通交流。

这篇关于【域适应】基于散度成分分析(SCA)的四分类任务典型方法实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/895216

相关文章

Java实现检查多个时间段是否有重合

《Java实现检查多个时间段是否有重合》这篇文章主要为大家详细介绍了如何使用Java实现检查多个时间段是否有重合,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录流程概述步骤详解China编程步骤1:定义时间段类步骤2:添加时间段步骤3:检查时间段是否有重合步骤4:输出结果示例代码结语作

Nginx设置连接超时并进行测试的方法步骤

《Nginx设置连接超时并进行测试的方法步骤》在高并发场景下,如果客户端与服务器的连接长时间未响应,会占用大量的系统资源,影响其他正常请求的处理效率,为了解决这个问题,可以通过设置Nginx的连接... 目录设置连接超时目的操作步骤测试连接超时测试方法:总结:设置连接超时目的设置客户端与服务器之间的连接

Java判断多个时间段是否重合的方法小结

《Java判断多个时间段是否重合的方法小结》这篇文章主要为大家详细介绍了Java中判断多个时间段是否重合的方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录判断多个时间段是否有间隔判断时间段集合是否与某时间段重合判断多个时间段是否有间隔实体类内容public class D

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

IDEA编译报错“java: 常量字符串过长”的原因及解决方法

《IDEA编译报错“java:常量字符串过长”的原因及解决方法》今天在开发过程中,由于尝试将一个文件的Base64字符串设置为常量,结果导致IDEA编译的时候出现了如下报错java:常量字符串过长,... 目录一、问题描述二、问题原因2.1 理论角度2.2 源码角度三、解决方案解决方案①:StringBui

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

Java覆盖第三方jar包中的某一个类的实现方法

《Java覆盖第三方jar包中的某一个类的实现方法》在我们日常的开发中,经常需要使用第三方的jar包,有时候我们会发现第三方的jar包中的某一个类有问题,或者我们需要定制化修改其中的逻辑,那么应该如何... 目录一、需求描述二、示例描述三、操作步骤四、验证结果五、实现原理一、需求描述需求描述如下:需要在

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

C#中读取XML文件的四种常用方法

《C#中读取XML文件的四种常用方法》Xml是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具,下面我们就来看看C#中读取XML文件的方法都有哪些吧... 目录XML简介格式C#读取XML文件方法使用XmlDocument使用XmlTextReader/XmlTextWr