为什么在反向传播中感知器初始值不能为0_ICLR2019少样本学习新思路：利用转导(Transductive)和标签传播...

2024-03-14 09:59

文章标签 学习不能标签传播反向样本感知器初始值新思路 transductive 转导 iclr2019

本文主要是介绍为什么在反向传播中感知器初始值不能为0_ICLR2019少样本学习新思路：利用转导(Transductive)和标签传播...，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning

文章链接：https://arxiv.org/pdf/1805.10002.pdf

代码链接：https://github.com/csyanbin/TPN

1. Motivation: 少样本学习问题为什么要用转导(Transductive)？

目前大部分深度学习的算法依赖于大量的标准数据，这些数据的采集、标注需要耗费大量的人力成本。然而在标注数据比较少的情况下，深度学习的应用和效果都受到了限制。与之相反，人类具有从少量数据中学习的能力，例如给一个小朋友看过几张苹果的图片之后，他就可以很快学会“苹果”这个类别。
少样本学习(few-shot learning)的目标是在已知类别(Seen Class)训练一个分类模型，使它能够在只有少量数据的未知类别(Unseen Class)上面具有很好的泛化性能。少样本学习面临两个重要的问题：（1）已知类别和未知类别之间没有交集，导致它们的数据分布差别很大，不能直接通过训练分类器和微调(finetune)的方式得到很好的性能；（2）未知类别只有极少量数据(每个类别1或者5个训练样本)，导致分类器学习不可靠。
对于第一个问题，Matching Networks提出了episodic training的策略。一个episode就是一个少样本学习的子任务，包含训练集和测试集。这里的episode类似于深度学习中的mini-batch的概念。
对于第二个问题，目前解决方法较少。我们提出利用转导(Transductive)的思想，拿到所有无标注数据，建立权重图，得到全部预测结果，如下图：

转导推理(Transduction) vs 归纳推理(Induction)

我们提出的转导方法将全部无标注数据和有标注数据一起建立一个无向图，通过标签传播的方式得到全部无标注数据的标签。相比较归纳推理(Inductive)方法，我们可以利用无标注数据的分布实现更好的预测。

2. Method: 如何进行标签传播

算法流程

这篇文章提出了转导传播网络(Transductive Propagation Network)，主要分成四个模块：

1) 特征编码。这一部分我们参考常用方法，使用一个四层神经网络，将每张图片编码成64x5x5 = 1600维的特征向量。

2) 建立无向图。我们对任意两个特征向量，使用高斯相似函数计算它们在无向图上的权重：

。这里

我们通过一个两层网络学习得到。

建立图这一步非常重要，因为图中包含的是有标注和无标注数据两两之间的相似性关系，这个关系可以指导后面一步的标签传播。

3) 标签传播。有了上一步的图结构，标签信息就可以在图上面从有标注数据依次传播到无标注数据。这一步可以通过一个公式直接给出结果：

，

是预测结果，

是归一化之后的图权重，

是初始标签。

4) 计算损失。得到

之后，我们和真正的标签计算交叉熵损失函数，然后通过反向传播，更新特征编码和无向图部分的网络参数。

在第2)步中，我们通过一个网络

学习一个样本相关的图结构，针对每一个子任务(episode)我们学习一个单独的图结构，图的权重根据不同的任务和数据动态调整。在第3)步中，我们利用了标签传播算法存在解析解的良好特性，使每个子任务的求解一步完成，而不是像其他方法比如MAML那样，需要多次迭代。

2)和3)两个步骤，体现了我们论文题目中的"Learning to Propagate Label"的思想。

3. Experiment：算法性能

我们的方法在常见的miniImagenet和tieredImagenet数据集上，取得了最佳性能。对比算法包括MAML(ICML2017)，Prototypical Network(NIPS2017)和Relation Network(CVPR2018)等。

miniImagenet

tieredImagenet

同时我们的算法还可以进行半监督(semi-supervised) 少样本学习，同样取得了非常好的性能，具体可以参考我们的论文。

4. Future：未来方向

本文提供了在训练数据较少的情况下，如何更好地利用无标注数据的一个思路。

如何改进图的结构，有没有比标签传播更好的方式，这些都是未来可以研究很探讨的方向。

这篇关于为什么在反向传播中感知器初始值不能为0_ICLR2019少样本学习新思路：利用转导(Transductive)和标签传播...的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/808046。 23002807@qq.com

相关文章

Spring事务传播机制最佳实践

Spring事务传播机制最佳实践

《Spring事务传播机制最佳实践》Spring的事务传播机制为我们提供了优雅的解决方案,本文将带您深入理解这一机制,掌握不同场景下的最佳实践,感兴趣的朋友一起看看吧... 目录1. 什么是事务传播行为2. Spring支持的七种事务传播行为2.1 REQUIRED（默认）2.2 SUPPORTS2

阅读更多...

HTML中meta标签的常见使用案例(示例详解)

HTML中meta标签的常见使用案例(示例详解)

《HTML中meta标签的常见使用案例(示例详解)》HTMLmeta标签用于提供文档元数据,涵盖字符编码、SEO优化、社交媒体集成、移动设备适配、浏览器控制及安全隐私设置,优化页面显示与搜索引擎索引... 目录html中meta标签的常见使用案例一、基础功能二、搜索引擎优化（seo）三、社交媒体集成四、移动

阅读更多...

HTML input 标签示例详解

HTML input 标签示例详解

《HTMLinput标签示例详解》input标签主要用于接收用户的输入，随type属性值的不同，变换其具体功能,本文通过实例图文并茂的形式给大家介绍HTMLinput标签，感兴趣的朋友一... 目录通用属性输入框单行文本输入框 text密码输入框 password数字输入框 number电子邮件输入编程框

阅读更多...

HTML img标签和超链接标签详细介绍

HTML img标签和超链接标签详细介绍

《HTMLimg标签和超链接标签详细介绍》：本文主要介绍了HTML中img标签的使用，包括src属性（指定图片路径）、相对/绝对路径区别、alt替代文本、title提示、宽高控制及边框设置等，详细内容请阅读本文，希望能对你有所帮助... 目录img 标签src 属性alt 属性title 属性width/h

阅读更多...

HTML5 中的＜button＞标签用法和特征

HTML5 中的＜button＞标签用法和特征

《HTML5中的＜button＞标签用法和特征》在HTML5中，button标签用于定义一个可点击的按钮，它是创建交互式网页的重要元素之一，本文将深入解析HTML5中的button标签，详细介绍其属... 目录引言<button> 标签的基本用法<button> 标签的属性typevaluedisabled

阅读更多...

全面解析HTML5中Checkbox标签

全面解析HTML5中Checkbox标签

《全面解析HTML5中Checkbox标签》Checkbox是HTML5中非常重要的表单元素之一，通过合理使用其属性和样式自定义方法，可以为用户提供丰富多样的交互体验，这篇文章给大家介绍HTML5中C... 在html5中，Checkbox（复选框）是一种常用的表单元素，允许用户在一组选项中选择多个项目。本

阅读更多...

Go学习记录之runtime包深入解析

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,：本文主要介绍Go学习记录之runtime包的... 目录前言：一、runtime包内容学习1、作用：① Goroutine和并发控制：② 垃圾回收：③ 栈和

阅读更多...

Android学习总结之Java和kotlin区别超详细分析

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,：本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1：Kotlin 如何解决 Java 的 NullPointerExceptio

阅读更多...

使用Python和Tkinter实现html标签去除工具

使用Python和Tkinter实现html标签去除工具

《使用Python和Tkinter实现html标签去除工具》本文介绍用Python和Tkinter开发的HTML标签去除工具,支持去除HTML标签、转义实体并输出纯文本,提供图形界面操作及复制功能,需... 目录html 标签去除工具功能介绍创作过程1. 技术选型2. 核心实现逻辑3. 用户体验增强如何运行

阅读更多...

Spring Boot 事务详解(事务传播行为、事务属性)

Spring Boot 事务详解(事务传播行为、事务属性)

《SpringBoot事务详解(事务传播行为、事务属性)》SpringBoot提供了强大的事务管理功能,通过@Transactional注解可以方便地配置事务的传播行为和属性,本文将详细介绍Spr... 目录Spring Boot 事务详解引言声明式事务管理示例编程式事务管理示例事务传播行为1. REQUI

阅读更多...