【pytorch】nn.linear 中为什么是y=xA^T+b

2024-01-31 19:52

文章标签 pytorch nn linear xa

本文主要是介绍【pytorch】nn.linear 中为什么是y=xA^T+b，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

我记得读教材的时候是y=Wx+b, 左乘矩阵W，这样才能表示线性变化。
但是pytorch中的nn.linear中，计算方式是y=xA^T+b，其中A是权重矩阵。
为什么右乘也能表示线性变化操作呢？因为pytorch中，照顾到输入是多个样本一起算的（第一个维度是多个样本数，所以输入默认是行向量），所以用y=xA^T+b，输出的y也是行向量。

在这里插入图片描述

我们的教材中默认输入是列向量的，而pytorch为了用户方便，输入当作列向量，维度为（batch, dim），每行是特征

m = nn.Linear(20, 30)
input = torch.randn(128, 20)
output = m(input)print(output.size())
>>> torch.Size([128, 30])
print(m.weight.shape)
>>>torch.Size([30, 20])  # 注意这里的权重维度

我们再看一张图片，理解一下代码中的实现逻辑：
在这里插入图片描述

至此应该对代码的实现很理解了，但是需要注意，大家写文章中用的都还是Wx+b的写法。
不管怎样，文章和代码都是能对应上的，最多是表示方式的区别（有的用行向量，有的用列向量）

这篇关于【pytorch】nn.linear 中为什么是y=xA^T+b的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/664887。 23002807@qq.com

相关文章

使用PyTorch实现手写数字识别功能

使用PyTorch实现手写数字识别功能

《使用PyTorch实现手写数字识别功能》在人工智能的世界里,计算机视觉是最具魅力的领域之一,通过PyTorch这一强大的深度学习框架,我们将在经典的MNIST数据集上,见证一个神经网络从零开始学会识... 目录当计算机学会“看”数字搭建开发环境MNIST数据集解析1. 认识手写数字数据库2. 数据预处理的

阅读更多...

Pytorch微调BERT实现命名实体识别

Pytorch微调BERT实现命名实体识别

《Pytorch微调BERT实现命名实体识别》命名实体识别（NER）是自然语言处理（NLP）中的一项关键任务,它涉及识别和分类文本中的关键实体,BERT是一种强大的语言表示模型,在各种NLP任务中显著... 目录环境准备加载预训练BERT模型准备数据集标记与对齐微调 BERT最后总结环境准备在继续之前，确

阅读更多...

pytorch+torchvision+python版本对应及环境安装

pytorch+torchvision+python版本对应及环境安装

《pytorch+torchvision+python版本对应及环境安装》本文主要介绍了pytorch+torchvision+python版本对应及环境安装,安装过程中需要注意Numpy版本的降级,... 目录一、版本对应二、安装命令（pip）1. 版本2. 安装全过程3. 命令相关解释参考文章一、版本对

阅读更多...

从零教你安装pytorch并在pycharm中使用

从零教你安装pytorch并在pycharm中使用

《从零教你安装pytorch并在pycharm中使用》本文详细介绍了如何使用Anaconda包管理工具创建虚拟环境,并安装CUDA加速平台和PyTorch库,同时在PyCharm中配置和使用PyTor... 目录背景介绍安装Anaconda安装CUDA安装pytorch报错解决——fbgemm.dll连接p

阅读更多...

pycharm远程连接服务器运行pytorch的过程详解

pycharm远程连接服务器运行pytorch的过程详解

《pycharm远程连接服务器运行pytorch的过程详解》：本文主要介绍在Linux环境下使用Anaconda管理不同版本的Python环境,并通过PyCharm远程连接服务器来运行PyTorc... 目录linux部署pytorch背景介绍Anaconda安装Linux安装pytorch虚拟环境安装cu

阅读更多...

PyTorch使用教程之Tensor包详解

PyTorch使用教程之Tensor包详解

《PyTorch使用教程之Tensor包详解》这篇文章介绍了PyTorch中的张量（Tensor）数据结构,包括张量的数据类型、初始化、常用操作、属性等,张量是PyTorch框架中的核心数据结构,支持... 目录1、张量Tensor2、数据类型3、初始化（构造张量）4、常用操作5、常用属性5.1 存储（st

阅读更多...

理解分类器（linear）为什么可以做语义方向的指导？（解纠缠）

理解分类器（linear）为什么可以做语义方向的指导？（解纠缠）

Attribute Manipulation（属性编辑）、disentanglement（解纠缠）常用的两种做法：线性探针和PCA_disentanglement和alignment-CSDN博客在解纠缠的过程中，有一种非常简单的方法来引导G向某个方向进行生成，然后我们通过向不同的方向进行行走，那么就会得到这个属性上的图像。那么你利用多个方向进行生成，便得到了各种方向的图像，每个方向对应了很多

阅读更多...

Nn criterions don’t compute the gradient w.r.t. targets error「pytorch」 (debug笔记)

Nn criterions don’t compute the gradient w.r.t. targets error「pytorch」 (debug笔记)

Nn criterions don’t compute the gradient w.r.t. targets error「pytorch」 ##一、缘由及解决方法把这个pytorch-ddpg|github搬到jupyter notebook上运行时，出现错误Nn criterions don’t compute the gradient w.r.t. targets error。注：我用

阅读更多...

【超级干货】2天速成PyTorch深度学习入门教程，缓解研究生焦虑

【超级干货】2天速成PyTorch深度学习入门教程，缓解研究生焦虑

3、cnn基础卷积神经网络输入层 —输入图片矩阵输入层一般是 RGB 图像或单通道的灰度图像，图片像素值在[0,255]，可以用矩阵表示图片卷积层 —特征提取人通过特征进行图像识别，根据左图直的笔画判断X，右图曲的笔画判断圆卷积操作激活层 —加强特征池化层 —压缩数据全连接层 —进行分类输出层 —输出分类概率 4、基于LeNet

阅读更多...

pytorch torch.nn.functional.one_hot函数介绍

pytorch torch.nn.functional.one_hot函数介绍

torch.nn.functional.one_hot 是 PyTorch 中用于生成独热编码（one-hot encoding）张量的函数。独热编码是一种常用的编码方式，特别适用于分类任务或对离散的类别标签进行处理。该函数将整数张量的每个元素转换为一个独热向量。函数签名 torch.nn.functional.one_hot(tensor, num_classes=-1) 参数 t

阅读更多...