teacher forcing training速览

2024-04-30 12:04

文章标签 速览 training teacher forcing

本文主要是介绍teacher forcing training速览，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

参考:https://blog.csdn.net/qq_30219017/article/details/89090690

前言

teacher forcing不局限于rnn，序列数据都可以用。

是什么

假设模型想要预测Mary had a little lamb whose fleece was white as snow。

当模型预测到had的时候倘若预测成了shit（任意一个不是had的词），那么后面的其实会出现偏差。因为本来是had a little，会变成shit a little。

teacher forcing会强制把预测错的词用正确的代替，消除这种偏差。具体的说，假设模型出现了上述情况，在预测a little的a的时候，会强制把shit（前面模型预测错的）换成had（ground truth），来帮助模型训练。

优缺点

优点已经说了，而缺点是模型的cross-domain能力往往会降低。

这篇关于teacher forcing training速览的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/948813。 23002807@qq.com

相关文章

2014 Multi-University Training Contest 8小记

2014 Multi-University Training Contest 8小记

1002 计算几何最大的速度才可能拥有无限的面积。最大的速度的点求凸包，凸包上的点（注意不是端点）才拥有无限的面积注意：凸包上如果有重点则不满足。另外最大的速度为0也不行的。 int cmp(double x){if(fabs(x) < 1e-8) return 0 ;if(x > 0) return 1 ;return -1 ;}struct poin

阅读更多...

2014 Multi-University Training Contest 7小记

2014 Multi-University Training Contest 7小记

1003 数学，先暴力再解方程。在b进制下是个2 ， 3 位数的大概是10000进制以上。这部分解方程 2-10000 直接暴力 typedef long long LL ;LL n ;int ok(int b){LL m = n ;int c ;while(m){c = m % b ;if(c == 3 || c == 4 || c == 5 ||

阅读更多...

2014 Multi-University Training Contest 6小记

2014 Multi-University Training Contest 6小记

1003 贪心对于111...10....000 这样的序列， a 为1的个数，b为0的个数，易得当 x= a / (a + b) 时 f最小。讲串分成若干段 1..10..0 , 1..10..0 , 要满足x非递减。对于 xi > xi+1 这样的合并即可。 const int maxn = 100008 ;struct Node{int

阅读更多...

Post-Training有多重要？一文带你了解全部细节

Post-Training有多重要？一文带你了解全部细节

1. 简介随着LLM学界和工业界日新月异的发展，不仅预训练所用的算力和数据正在疯狂内卷，后训练（post-training）的对齐和微调方法也在不断更新。InstructGPT、WebGPT等较早发布的模型使用标准RLHF方法，其中的数据管理风格和规模似乎已经过时。近来，Meta、谷歌和英伟达等AI巨头纷纷发布开源模型，附带发布详尽的论文或报告，包括Llama 3.1、Nemotron 340

阅读更多...

AI推介-多模态视觉语言模型VLMs论文速览（arXiv方向）：2024.08.20-2024.08.25

AI推介-多模态视觉语言模型VLMs论文速览（arXiv方向）：2024.08.20-2024.08.25

文章目录～ 1.LowCLIP: Adapting the CLIP Model Architecture for Low-Resource Languages in Multimodal Image Retrieval Task2.Evaluating Attribute Comprehension in Large Vision-Language Models3.PropSAM: A P

阅读更多...

2015 Multi-University Training Contest 5 1009 MZL#39;s Border

2015 Multi-University Training Contest 5 1009 MZL#39;s Border

MZL's Border Problem's Link: http://acm.hdu.edu.cn/showproblem.php?pid=5351 Mean: 给出一个类似斐波那契数列的字符串序列,要你求给出的f[n]字符串中截取前m位的字符串s中s[1...i] = s[s.size()-i+1....s.size()]的最大长度。 analyse: 过计算

阅读更多...

[论文解读]Genre Separation Network with Adversarial Training for Cross-genre Relation Extraction

[论文解读]Genre Separation Network with Adversarial Training for Cross-genre Relation Extraction

论文地址：https://www.aclweb.org/anthology/D18-1125.pdf发表会议：EMNLP2019 本论文的主要任务是跨领域的关系抽取，具体来说，利用某个领域的数据训练好的关系抽取模型，很难去直接抽取另一个领域中的关系，比如我们拿某个领域训练好的模型，把另一个领域的数据直接输入整个模型，很难抽取出来正确的实体关系。这主要是因为源领域和目标领域特征表达的不同，在源

阅读更多...

2014 Multi-University Training Contest 1/HDU4861_Couple doubi(数论/规律)

2014 Multi-University Training Contest 1/HDU4861_Couple doubi(数论/规律)

解题报告两人轮流取球，大的人赢，，，贴官方题解，，，反正我看不懂，，，先留着理解关于费马小定理关于原根找规律找到的，，，sad，，，很容易找到循环节为p-1，每一个循环节中有一个非零的球，所以只要判断有多少完整循环节，在判断奇偶，，， #include <iostream>#include <cstdio>#include <cstring>

阅读更多...

AI推介-多模态视觉语言模型VLMs论文速览（arXiv方向）：2024.08.15-2024.08.20

AI推介-多模态视觉语言模型VLMs论文速览（arXiv方向）：2024.08.15-2024.08.20

文章目录～ 1.Out-of-Distribution Detection with Attention Head Masking for Multimodal Document Classification2.Open-FinLLMs: Open Multimodal Large Language Models for Financial Applications3.HiRED: Atte

阅读更多...

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.08.10-2024.08.15

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.08.10-2024.08.15

文章目录～ 1.W-RAG: Weakly Supervised Dense Retrieval in RAG for Open-domain Question Answering2.Dynamic Adaptive Optimization for Effective Sentiment Analysis Fine-Tuning on Large Language Models3.Fact

阅读更多...