[SimCLR v2] Big Self-Supervised Models are Strong Semi-Supervised Learners

2024-08-29 22:12

文章标签 v2 self models big supervised semi learners strong simclr

本文主要是介绍[SimCLR v2] Big Self-Supervised Models are Strong Semi-Supervised Learners，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1、目的

借助无监督预训练来提升半监督学习的效果

2、方法

1）unsupervised/self-supervised pretrain

-> task-agnostic

-> big (deep and wide) neural network可以有效提升准确性

-> improvements upon SimCLR

larger ResNet models；deeper but less wide

deeper（3-layer） non-linear network（projection head）

incorporate the memory mechanism from MoCo

2）supervised fine-tuning

fine-tune from the first layer of the MLP head

3）self-training / knowledge distillation using unlabeled data

-> no real labels are used

-> 当labeled example数据量较大时，可以结合进loss计算中

-> encourage the student network to mimic the teacher network's label predictions

-> fix teacher network, train (smaller) student network

-> 大模型先self-distillation，再向小模型做knowledge distillation

3、结论

1）半监督学习的可用label越少，越能从大模型中获益

2）用于具体任务时，大模型不是必要的，因此可以transfer到小模型上

3）用一个较深的projection head，可以提升半监督的结果

这篇关于[SimCLR v2] Big Self-Supervised Models are Strong Semi-Supervised Learners的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1118986。 23002807@qq.com

相关文章

论文翻译：arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

论文翻译：arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染：一项综述文章目录大规模语言模型的基准数据污染：一项综述摘要1 引言摘要大规模语言模型（LLMs），如GPT-4、Claude-3和Gemini的快

阅读更多...

论文翻译：ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

论文翻译：ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中文章目录验证测试集污染在黑盒语言模型中摘要1 引言摘要大型语言模型是在大量互联网数据上训练的，这引发了人们的担忧和猜测，即它们可能已

阅读更多...

速通GPT-3：Language Models are Few-Shot Learners全文解读

速通GPT-3：Language Models are Few-Shot Learners全文解读

文章目录论文实验总览1. 任务设置与测试策略2. 任务类别3. 关键实验结果4. 数据污染与实验局限性5. 总结与贡献 Abstract1. 概括2. 具体分析3. 摘要全文翻译4. 为什么不需要梯度更新或微调⭐ Introduction1. 概括2. 具体分析3. 进一步分析 Approach1. 概括2. 具体分析3. 进一步分析 Results1. 概括2. 具体分析2.1 语言模型

阅读更多...

野火霸天虎V2学习记录

野火霸天虎V2学习记录

文章目录嵌入式开发常识汇总1、嵌入式Linux和stm32之间的区别和联系2、stm32程序下载方式3、Keil5安装芯片包4、芯片封装种类5、STM32命名6、数据手册和参考手册7、什么是寄存器、寄存器映射和内存映射8、芯片引脚顺序9、stm32芯片里有什么10、存储器空间的划分11、如何理解寄存器说明12、如何操作寄存器的某一位 STM32F407芯片学习1、stm32单片机启动流程s

阅读更多...

论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes

论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes

论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes 优势 1、构建了一个用于监督原始视频去噪的基准数据集。为了多次捕捉瞬间，我们手动为对象s创建运动。在高ISO模式下捕获每一时刻的噪声帧，并通过对多个噪声帧进行平均得到相应的干净帧。 2、有效的原始视频去噪网络(RViDeNet)，通过探

阅读更多...

[论文笔记]Making Large Language Models A Better Foundation For Dense Retrieval

[论文笔记]Making Large Language Models A Better Foundation For Dense Retrieval

引言今天带来北京智源研究院(BAAI)团队带来的一篇关于如何微调LLM变成密集检索器的论文笔记——Making Large Language Models A Better Foundation For Dense Retrieval。为了简单，下文中以翻译的口吻记录，比如替换"作者"为"我们"。密集检索需要学习具有区分性的文本嵌入，以表示查询和文档之间的语义关系。考虑到大语言模

阅读更多...

翻译Houdini官方对UE4新版插件的介绍：Houdini Engine for Unreal - V2

翻译Houdini官方对UE4新版插件的介绍：Houdini Engine for Unreal - V2

原视频：Houdini For Unreal - YouTube 目录介绍0. 总览1. 简介HoudiniEngine2. UE4的HoudiniEngine - 第二版为什么要做“第二版” ？What's new? - 核心What's new? - 输出（1）What's new? - 输出（2）What's new? - 输入What's new? - 参数What's new?

阅读更多...

ModuleNotFoundError: No module named ‘diffusers.models.dual_transformer_2d‘解决方法

ModuleNotFoundError: No module named ‘diffusers.models.dual_transformer_2d‘解决方法

Python应用运行报错，部分错误信息如下： Traceback (most recent call last): File “\pipelines_ootd\unet_vton_2d_blocks.py”, line 29, in from diffusers.models.dual_transformer_2d import DualTransformer2DModel ModuleNotF

阅读更多...

阅读笔记--Guiding Attention in End-to-End Driving Models

阅读笔记--Guiding Attention in End-to-End Driving Models

作者：Diego Porres1, Yi Xiao1, Gabriel Villalonga1, Alexandre Levy1, Antonio M. L ́ opez1,2 出版时间：arXiv:2405.00242v1 [cs.CV] 30 Apr 2024 这篇论文研究了如何引导基于视觉的端到端自动驾驶模型的注意力，以提高它们的驾驶质量和获得更直观的激活图。摘要介绍

阅读更多...

COD论文笔记 ECCV2024 Just a Hint: Point-Supervised Camouflaged Object Detection

COD论文笔记 ECCV2024 Just a Hint: Point-Supervised Camouflaged Object Detection

这篇论文的主要动机、现有方法的不足、拟解决的问题、主要贡献和创新点： 1. 动机伪装物体检测（Camouflaged Object Detection, COD）旨在检测隐藏在环境中的伪装物体，这是一个具有挑战性的任务。由于伪装物体与背景的细微差别和模糊的边界，手动标注像素级的物体非常耗时，例如每张图片可能需要 60 分钟来标注。因此，作者希望通过减少标注负担，提出了一种仅依赖“点标注”的弱

阅读更多...