计算图与动态图机制

2024-01-02 08:28
文章标签 计算 机制 动态图

本文主要是介绍计算图与动态图机制,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、计算图

计算图是用来描述运算的有向无环图

计算图有两个主要元素:结点(Node)和边(Edge)

  • 结点表示数据,如向量,矩阵,张量
  • 边表示运算,如加减乘除卷积等

用计算图表示:

  • y = (x+ w) * (w+1)
  • a = x + w
  • b = w + 1
  • y = a * b

在这里插入图片描述

y = (x + w) * (w + 1)
a = x + w
b = w + 1
y = a * b
∂y/∂w = (∂y/∂a) * (∂a/∂w) + (∂y/∂b) * (∂b/∂w)= b * 1 + a * 1= b + a= (w + 1) + (x + w)= 2w + x + 1= 2 * 1 + 2 + 1= 5

在这里插入图片描述

计算图与梯度求导 y = (x+ w) * (w+1)

叶子结点:用户创建的结点称为叶子结点,如X 与 W

is_leaf: 指示张量是否为叶子结点

在这里插入图片描述
grad_fn: 记录创建该张量时所用的方法(函数)
y.grad_fn =
a.grad_fn =
b.grad_fn =

在这里插入图片描述
在这里插入图片描述

动态图

动态图vs 静态图

在这里插入图片描述

动态图 PyTorch

在这里插入图片描述

静态图 TensorFlow

在这里插入图片描述

在这里插入图片描述

import torch
w = torch.tensor([1.], requires_grad=True)  # 创建张量w,并设置requires_grad=True以计算梯度
x = torch.tensor([2.], requires_grad=True)  # 创建张量x,并设置requires_grad=True以计算梯度a = torch.add(w, x)     # 执行加法操作,计算w + x,得到张量a
b = torch.add(w, 1)     # 执行加法操作,计算w + 1,得到张量b
y = torch.mul(a, b)     # 执行乘法操作,计算a * b,得到张量yy.backward()            # 自动计算y对所有需要梯度的叶子结点的梯度
print(w.grad)           # 打印w的梯度# 查看叶子结点
# print("is_leaf:\n", w.is_leaf, x.is_leaf, a.is_leaf, b.is_leaf, y.is_leaf)# 查看梯度
# print("gradient:\n", w.grad, x.grad, a.grad, b.grad, y.grad)# 查看 grad_fn
print("grad_fn:\n", w.grad_fn, x.grad_fn, a.grad_fn, b.grad_fn, y.grad_fn)

在这段代码中,我们定义了两个张量wx,并且将它们设置为需要计算梯度(requires_grad=True)。然后我们定义了计算图中的各个操作:加法a = w + x,加法b = w + 1,乘法y = a * b
接下来,我们调用y.backward()来自动计算y对于所有需要梯度的叶子结点的梯度。在这个例子中,叶子结点是wx。然后,我们打印出w的梯度w.grad
运行这段代码,我们得到的输出是tensor([5.]),即w的梯度为5。

这篇关于计算图与动态图机制的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/561886

相关文章

Spring使用@Retryable实现自动重试机制

《Spring使用@Retryable实现自动重试机制》在微服务架构中,服务之间的调用可能会因为一些暂时性的错误而失败,例如网络波动、数据库连接超时或第三方服务不可用等,在本文中,我们将介绍如何在Sp... 目录引言1. 什么是 @Retryable?2. 如何在 Spring 中使用 @Retryable

如何用Java结合经纬度位置计算目标点的日出日落时间详解

《如何用Java结合经纬度位置计算目标点的日出日落时间详解》这篇文章主详细讲解了如何基于目标点的经纬度计算日出日落时间,提供了在线API和Java库两种计算方法,并通过实际案例展示了其应用,需要的朋友... 目录前言一、应用示例1、天安门升旗时间2、湖南省日出日落信息二、Java日出日落计算1、在线API2

JVM 的类初始化机制

前言 当你在 Java 程序中new对象时,有没有考虑过 JVM 是如何把静态的字节码(byte code)转化为运行时对象的呢,这个问题看似简单,但清楚的同学相信也不会太多,这篇文章首先介绍 JVM 类初始化的机制,然后给出几个易出错的实例来分析,帮助大家更好理解这个知识点。 JVM 将字节码转化为运行时对象分为三个阶段,分别是:loading 、Linking、initialization

poj 1113 凸包+简单几何计算

题意: 给N个平面上的点,现在要在离点外L米处建城墙,使得城墙把所有点都包含进去且城墙的长度最短。 解析: 韬哥出的某次训练赛上A出的第一道计算几何,算是大水题吧。 用convexhull算法把凸包求出来,然后加加减减就A了。 计算见下图: 好久没玩画图了啊好开心。 代码: #include <iostream>#include <cstdio>#inclu

uva 1342 欧拉定理(计算几何模板)

题意: 给几个点,把这几个点用直线连起来,求这些直线把平面分成了几个。 解析: 欧拉定理: 顶点数 + 面数 - 边数= 2。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#inc

uva 11178 计算集合模板题

题意: 求三角形行三个角三等分点射线交出的内三角形坐标。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <stack>#include <vector>#include <

Java ArrayList扩容机制 (源码解读)

结论:初始长度为10,若所需长度小于1.5倍原长度,则按照1.5倍扩容。若不够用则按照所需长度扩容。 一. 明确类内部重要变量含义         1:数组默认长度         2:这是一个共享的空数组实例,用于明确创建长度为0时的ArrayList ,比如通过 new ArrayList<>(0),ArrayList 内部的数组 elementData 会指向这个 EMPTY_EL

XTU 1237 计算几何

题面: Magic Triangle Problem Description: Huangriq is a respectful acmer in ACM team of XTU because he brought the best place in regional contest in history of XTU. Huangriq works in a big compa

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

【Tools】大模型中的自注意力机制

摇来摇去摇碎点点的金黄 伸手牵来一片梦的霞光 南方的小巷推开多情的门窗 年轻和我们歌唱 摇来摇去摇着温柔的阳光 轻轻托起一件梦的衣裳 古老的都市每天都改变模样                      🎵 方芳《摇太阳》 自注意力机制(Self-Attention)是一种在Transformer等大模型中经常使用的注意力机制。该机制通过对输入序列中的每个元素计算与其他元素之间的相似性,