本文主要是介绍机器学习和深度学习-- 李宏毅(笔记与个人理解)Day22,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Day 22 Transformer
seqence to seqence
有什么用呢?
Encoder
how Block work
仔细讲讲Residual 的过程?
重构
Decoder - AutoRegressive
Mask
由于是文字接龙,所以无法考虑右边的 info
另一种decoder
Encoder to Decoder – Cross Attend
怀疑begin那里没有做 Norm是bug
Training
很像分类的问题
Teacher Forcing : using the ground truth as input
Tips
how to resolve that?
这篇关于机器学习和深度学习-- 李宏毅(笔记与个人理解)Day22的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!