论文阅读笔记:A brief introduction to weakly supervised learning

本文主要是介绍论文阅读笔记:A brief introduction to weakly supervised learning,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文:A brief introduction to weakly supervised learning / 对弱监督学习的简要介绍
作者:Zhi-Hua Zhou / 周志华
发表刊物:National Science Review
发表年度:2018
下载地址:https://academic.oup.com/nsr/article/5/1/44/4093912

Abstract / 摘要

   监督学习旨在通过从大量训练样本中学习来构建预测模型,其中每个训练样本都有标示其真实输出的标签。虽然如今监督学习技术取得了巨大成功,但值得注意的是,由于数据标注过程成本较高,在许多任务中,我们很难获取到像全部训练数据的真实标签这样的强监督信息。因此我们需要能够在弱监督信息下工作的机器学习模型。本文关注弱监督学习的一些研究进展,主要聚焦在三种弱监督类型不完全监督——只有一部分训练数据有标签不确切监督——训练数据只有粗粒度的标签不准确监督——给定的训练样本标签不一定正确

Introduction / 引言

  机器学习在各种任务中都取得了巨大成功,尤其是像分类和回归这样的监督学习技术。一般地,监督学习从包含大量训练样本的训练集中学习预测模型,训练样本由两部分组成:用于描述对象的特征向量和用于标示输出的标签。在分类中,标签表明样本所属类别;在回归中,标签表明样本对应的实值。许多成功的技术都依赖于大量带有真实标签的训练数据,然而,获取到这些强监督信息的成本是比较高的。因此,需要能够在弱监督信息下工作的机器学习模型。
  弱监督学习分为三种类型:一、不完全监督——只有一部分训练数据有标签,比如在执行图片分类任务时,图片的标签往往是由人工标注员标注的,当从网上获得大量图片后,由于成本的关系,我们只能标注其中的一小部分数据;二、不确切监督——训练数据只有粗粒度的标签,比如在进行图片分类任务时,我们希望把图片中的每个对象都标出来,但我们往往只进行图片级的标注而不考虑对象级的标注;三、不准确监督——给定的训练样本标签不一定正确,比如在图像分类任务中,当标注员粗心或疲惫,又或者图像难以识别的时候,标注员可能会出错。
  弱监督学习是一个概括性术语,涵盖了各种尝试在弱监督信息下构建预测模型的研究。本文将对以上三种弱监督学习类型进行介绍,但值得一提的是,在真实场景下,这三种类型的弱监督信息往往同时存在。为了简化,本文仅考虑二分类任务。三种类型的弱监督学习示意图如图1所示。

图1 三种类型的弱监督学习示意图

Incomplete Supervision / 不完全监督

  不完全监督涉及只有小部分训练数据有标签,其余大部分数据无标签的场景。解决不完全监督学习问题的两种主要技术分别是主动学习半监督学习主动学习假设有人类专家,可以咨询专家来获得无标签样本的真实标签。半监督学习尝试在没有人工干预的情况下,自动利用有标记数据和无标记数据来提高学习性能。有一类特殊的半监督学习叫直推式学习,它与纯半监督学习的区别在于它们对测试数据的假设不同,即用训练好的模型预测的数据不同。直推式学习有一个“封闭世界”假设,即预先给定测试数据,目标是优化在测试数据上的性能,换言之,无标签的数据就是测试数据;纯半监督学习持有“开放世界”假设,即测试数据是未知的,且无标签数据不一定是测试数据。图2展示了主动学习、纯半监督学习和直推式学习的概念示意图。

图2 主动学习、纯半监督学习和直推式学习的概念示意图

有人类干预

  在主动学习中,为了简化,假设数据标注成本只取决于要标注的样本的数量,因此,主动学习的目标可以定义为最小化需要标注的样本的数量从而使得训练一个好模型的标注成本最小
  给定一小部分有标签的样本和大量无标签的样本,主动学习尝试选择最有价值的无标签样本提交给专家进行标注。一般有类样本选择标准:信息性标准和代表性标准。信息性测度一个无标签样本能够在多大程度上减少统计模型的不确定性;代表性衡量的是一个样本能够在多大程度上代表输入数据的结构。不确定性采样委员会选择是两种典型的基于信息性标准的样本选择方法,基于代表性标准的样本选择方法一般是使用聚类算法探索无标签样本的类簇结构。基于信息性标准的样本选择方法的主要缺点是它们严重依赖于有标签样本构建初始的无标签样本选择模型,且该方法在只有少量有标签样本可用时性能通常不稳定;基于代表性标准的样本选择方法的主要缺点是其性能严重依赖于以无标签样本为主的数据的聚类结果。因此,最近关于主动学习的研究尝试同时利用样本的信息性和代表性。

无人类干预

  尽管无标签样本不携带显式的标签信息,但是它们隐式地传达了一些关于数据分布的信息,这些信息能够有助于构建模型。在半监督学习中有两类基本假设:聚类假设流形假设,这两个假设都是关于数据分布的,前者假设数据具有固定的集群结构,落入同一集群的样本具有相同的类标签;后者假设数据位于一个流形上,因此临近的样本具有类似的预测结果。这两个假设的立足点在于相似的样本点应当具有相似的输出,无标签样本有助于揭示哪些样本是相似的。当前有四种半监督学习方法:基于生成的方法、基于图的方法、基于低密度隔离的方法和基于不一致性的方法。

  • 基于生成的方法:假设所有的有标签、无标签样本都是从同一个分布生成的,可以认为缺失了部分标签,可以用EM算法估计;
  • 基于图的方法:将样本作为点、样本之间的关系作为边,标签根据某种规则在图上传播;
  • 基于低密度隔离的方法:分类边界位于样本空间中较为稀疏的区域;
  • 基于不一致性的方法:多个学习器合作利用未标注数据。

Inexact Supervision / 不确切监督

  不确切监督对应标签粒度较粗且与待解决任务不完全一致的场景,关键在于如何使标签为目标任务提供监督信息。如今,不确切监督一般指多实例学习:训练数据中没有每一个实例的标签,只知道一组样本的标签,认为是预测一组新的实例的标签。多实例学习被成功应用到图片分类/检索/标注、文本分类等多个领域中。

Inaccurate Supervision / 不准确监督

  图3为不准确监督的解决思路示意图。

图3 不准确学习的概念示意图

Conclusion / 结论

  弱监督学习正变得越来越重要

这篇关于论文阅读笔记:A brief introduction to weakly supervised learning的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/932784

相关文章

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

《offer来了》第二章学习笔记

1.集合 Java四种集合:List、Queue、Set和Map 1.1.List:可重复 有序的Collection ArrayList: 基于数组实现,增删慢,查询快,线程不安全 Vector: 基于数组实现,增删慢,查询快,线程安全 LinkedList: 基于双向链实现,增删快,查询慢,线程不安全 1.2.Queue:队列 ArrayBlockingQueue:

操作系统实训复习笔记(1)

目录 Linux vi/vim编辑器(简单) (1)vi/vim基本用法。 (2)vi/vim基础操作。 进程基础操作(简单) (1)fork()函数。 写文件系统函数(中等) ​编辑 (1)C语言读取文件。 (2)C语言写入文件。 1、write()函数。  读文件系统函数(简单) (1)read()函数。 作者本人的操作系统实训复习笔记 Linux

LVGL快速入门笔记

目录 一、基础知识 1. 基础对象(lv_obj) 2. 基础对象的大小(size) 3. 基础对象的位置(position) 3.1 直接设置方式 3.2 参照父对象对齐 3.3 获取位置 4. 基础对象的盒子模型(border-box) 5. 基础对象的样式(styles) 5.1 样式的状态和部分 5.1.1 对象可以处于以下状态States的组合: 5.1.2 对象

DDS信号的发生器(验证篇)——FPGA学习笔记8

前言:第一部分详细讲解DDS核心框图,还请读者深入阅读第一部分,以便理解DDS核心思想 三刷小梅哥视频总结! 小梅哥https://www.corecourse.com/lander 一、DDS简介         DDS(Direct Digital Synthesizer)即数字合成器,是一种新型的频率合成技术,具有低成本、低功耗、高分辨率、频率转换时间短、相位连续性好等优点,对数字信

数据库原理与安全复习笔记(未完待续)

1 概念 产生与发展:人工管理阶段 → \to → 文件系统阶段 → \to → 数据库系统阶段。 数据库系统特点:数据的管理者(DBMS);数据结构化;数据共享性高,冗余度低,易于扩充;数据独立性高。DBMS 对数据的控制功能:数据的安全性保护;数据的完整性检查;并发控制;数据库恢复。 数据库技术研究领域:数据库管理系统软件的研发;数据库设计;数据库理论。数据模型要素 数据结构:描述数据库

【软考】信息系统项目管理师(高项)备考笔记——信息系统项目管理基础

信息系统项目管理基础 日常笔记 项目的特点:临时性(一次性)、独特的产品、服务或成果、逐步完善、资源约束、目的性。 临时性是指每一个项目都有确定的开始和结束日期独特性,创造独特的可交付成果,如产品、服务或成果逐步完善意味着分步、连续的积累。例如,在项目早期,项目范围的说明是粗略的,随着项目团队对目标和可交付成果的理解更完整和深入时,项目的范围也就更具体和详细。 战略管理包括以下三个过程

【软考】信息系统项目管理师(高项)备考笔记——信息化与信息系统

信息化与信息系统 最近在备考信息系统项目管理师软考证书,特记录笔记留念,也希望可以帮到有需求的人。 因为这是从notion里导出来的,格式上可能有点问题,懒的逐条修改了,还望见谅! 日常笔记 核心知识 信息的质量属性:1.精确性 2.完整性 3.可靠性 4.及时性 5.经济性 6.可验证下 7.安全性 信息的传输技术(通常指通信、网络)是信息技术的核心。另外,噪声影响的是信道

flex布局学习笔记(flex布局教程)

前端笔试⾯试经常会问到:不定宽⾼如何⽔平垂直居中。最简单的实现⽅法就是flex布局,⽗元素加上如下代码即 可: display: flex; justify-content: center; align-items :center; 。下⾯详细介绍下flex布局吧。   2009年,W3C提出了 Flex布局,可以简便⼂完整⼂响应式地实现各种页⾯布局。⽬前已得到了所有浏览器的⽀持,这意味着,现