王树森专题

【王树森】Few-Shot Learning (2/3): Siamese Network 孪生网络（个人向笔记）

Learning Pairwise Similarity Scores Training Data 训练集有很多个类别的图片，每个类别的图片都有标注 Positive Sample：我们需要正样本来告诉神经网路什么东西是同一类 Negative Sample：负样本可以告诉神经网路事物之间的区别我们用CNN来提取图片的特征：把两张图片用同一个CNN提取特征向量，然后把得到的

【王树森】RNN模型与NLP应用(8/9)：Attention（个人向笔记）

前言基于RNN的Seq2Seq模型无法记住长序列Attentnion机制可以大幅度提升Seq2Seq模型 Seq2Seq Model with Attention Attention可以让句子在逐步变长的时候不忘记前面的输入信息Attention还可以告诉Decoder应该关注哪一个状态优点：Attention可以大幅度提高准确率缺点：Attention计算量比较大 Simpl

【王树森】BERT：预训练Transformer模型（个人向笔记）

前言 BERT：Bidirectional Encoder Representations from TransformerBERT是用来预训练Transformer模型的encoder的本节课只讲述主要思想BERT用两个主要思想来训练Transformer的encoder网络：①随机遮挡单词，让encoder根据上下文来预测被遮挡的单词。②把两句话放在一起，让encoder判断是不是原文相邻的

【王树森】Vision Transformer (ViT) 用于图片分类（个人向笔记）

图片分类任务给定一张图片，现在要求神经网络能够输出它对这个图片的分类结果。下图表示神经网络有40%的信心认定这个图片是狗 ResNet（CNN）曾经是是图像分类的最好模型在有足够大数据做预训练的情况下，ViT要强于ResNetViT 就是Transformer Encoder网络 Split Image into Patches 在划分图片的时候，需要指定两个超参数 patch siz

【王树森】RNN模型与NLP应用(9/9)：Self-Attention（个人向笔记）

前言上节课讲到的attention用到了Seq2Seq模型上，而Attention并不局限与Seq2Seq模型，而是可以用在所有RNN模型上。Self-attention在原论文中用到了LSTM上，而本节课做了简单的替换：换成了 Simple RNN。 SimpleRNN + Self-Attention 下面的 h 0 h_0 h0 为初始状态，是一个全0向量无 Self-A

【王树森】RNN模型与NLP应用(7/9)：机器翻译与Seq2Seq模型（个人向笔记）

Machine Translation Data 做机器学习任务的第一步都是处理数据，我们首先需要准备机器翻译的数据。由于我们是学习用途，因此拿一个小规模数据集即可：http://www.manythings.org/anki/下面的数据集中：一个英语句子对应多个德语句子，如果翻译的时候能命中其中的一个则算作完全正确。 1. Preprocessing 将大写全部转化为小写去掉标点符号

【王树森】深度强化学习(DRL)学习笔记

目录第一部分：基础知识1.机器学习基础2.蒙特卡洛估计3.强化学习基础知识3.1 马尔科夫决策过程马尔可夫决策过程（Markov decision process，MDP）智能体环境状态状态空间动作动作空间奖励状态转移状态转移概率 3.2 策略策略定义 3.3 随机性的来源随机性的两个来源马尔科夫性质(无后效性)轨迹 3.4 回报与折扣汇报回报折扣回报回报中的随机性 3.5 价值函数动作-

深度强化学习（王树森）笔记07

深度强化学习（DRL）本文是学习笔记，如有侵权，请联系删除。本文在ChatGPT辅助下完成。参考链接 Deep Reinforcement Learning官方链接：https://github.com/wangshusen/DRL 源代码链接：https://github.com/DeepRLChinese/DeepRL-Chinese B站视频：【王树森】深度强化学习(DRL)

王树森《RNN Transformer》系列公开课

本课程主要介绍NLP相关，包括RNN、LSTM、Attention、Transformer、BERT等模型，以及情感识别、文本生成、机器翻译等应用 ShusenWang的个人空间-ShusenWang个人主页-哔哩哔哩视频 (bilibili.com) （一）NLP基础 1、数据处理基础数值特征（Numeric Features，特点是可以比较大小）和类别特征（Categorica

深度强化学习（王树森）笔记11

深度强化学习（DRL）本文是学习笔记，如有侵权，请联系删除。本文在ChatGPT辅助下完成。参考链接 Deep Reinforcement Learning官方链接：https://github.com/wangshusen/DRL 源代码链接：https://github.com/DeepRLChinese/DeepRL-Chinese B站视频：【王树森】深度强化学习(DRL)

深度强化学习（王树森）笔记10

深度强化学习（DRL）本文是学习笔记，如有侵权，请联系删除。本文在ChatGPT辅助下完成。参考链接 Deep Reinforcement Learning官方链接：https://github.com/wangshusen/DRL 源代码链接：https://github.com/DeepRLChinese/DeepRL-Chinese B站视频：【王树森】深度强化学习(DRL)

深度强化学习（王树森）笔记09

深度强化学习（DRL）本文是学习笔记，如有侵权，请联系删除。本文在ChatGPT辅助下完成。参考链接 Deep Reinforcement Learning官方链接：https://github.com/wangshusen/DRL 源代码链接：https://github.com/DeepRLChinese/DeepRL-Chinese B站视频：【王树森】深度强化学习(DRL)

深度强化学习（王树森）笔记08

深度强化学习（DRL）本文是学习笔记，如有侵权，请联系删除。本文在ChatGPT辅助下完成。参考链接 Deep Reinforcement Learning官方链接：https://github.com/wangshusen/DRL 源代码链接：https://github.com/DeepRLChinese/DeepRL-Chinese B站视频：【王树森】深度强化学习(DRL)

深度强化学习（王树森）笔记07

深度强化学习（DRL）本文是学习笔记，如有侵权，请联系删除。本文在ChatGPT辅助下完成。参考链接 Deep Reinforcement Learning官方链接：https://github.com/wangshusen/DRL 源代码链接：https://github.com/DeepRLChinese/DeepRL-Chinese B站视频：【王树森】深度强化学习(DRL)

深度强化学习（王树森）笔记06

深度强化学习（DRL）本文是学习笔记，如有侵权，请联系删除。本文在ChatGPT辅助下完成。参考链接 Deep Reinforcement Learning官方链接：https://github.com/wangshusen/DRL 源代码链接：https://github.com/DeepRLChinese/DeepRL-Chinese B站视频：【王树森】深度强化学习(DRL)

深度强化学习（王树森）笔记05

深度强化学习（DRL）本文是学习笔记，如有侵权，请联系删除。本文在ChatGPT辅助下完成。参考链接 Deep Reinforcement Learning官方链接：https://github.com/wangshusen/DRL 源代码链接：https://github.com/DeepRLChinese/DeepRL-Chinese B站视频：【王树森】深度强化学习(DRL)

深度强化学习（王树森）笔记04

深度强化学习（DRL）本文是学习笔记，如有侵权，请联系删除。本文在ChatGPT辅助下完成。参考链接 Deep Reinforcement Learning官方链接：https://github.com/wangshusen/DRL 源代码链接：https://github.com/DeepRLChinese/DeepRL-Chinese B站视频：【王树森】深度强化学习(DRL)