以太坊存储类型(memory,storage)及变量存储详解

2024-09-03 08:18

本文主要是介绍以太坊存储类型(memory,storage)及变量存储详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1数据存储位置(Data location)概念

1.1 storage, memory, calldata, stack区分

在 Solidity 中,有两个地方可以存储变量 :存储(storage)以及内存(memory)

Storage变量是指永久存储在区块链中的变量。

Memory 变量则是临时的,当外部函数对某合约调用完成时,内存型变量即被移除。

内存(memory)位置还包含2种类型的存储数据位置,一种是calldata,一种是栈(stack)。

(1) calldata

这是一块只读的,且不会永久存储的位置,用来存储函数参数

外部函数的参数(非返回参数)的数据位置被强制指定为 calldata ,效果跟 memory 差不多。

(2) 栈(stack)

另外,EVM是一个基于栈的语言,栈实际是在内存(memory)的一个数据结构,每个栈元素占为256位,栈最大长度为1024。

值类型的局部变量是存储在栈上。

不同存储的消耗(gas消耗)是不一样的,说明如下:

  • storage永久保存合约状态变量,开销最大;

  • memory 仅保存临时变量,函数调用之后释放,开销很小;

  • stack 保存很小的局部变量,免费使用,但有数量限制(16个变量);

  • calldata的数据包含消息体的数据,其计算需要增加n*68的GAS费用;

storage 存储结构是在合约创建的时候就确定好了的,它取决于合约所声明状态变量。但是内容可以被(交易)调用改变。

Solidity 称这个为状态改变,这也是合约级变量称为状态变量的原因。也可以更好的理解为什么状态变量都是storage存储。

memory 只能用于函数内部,memory 声明用来告知EVM在运行时创建一块(固定大小)内存区域给变量使用。

storage 在区块链中是用key/value的形式存储,而

memory则表现为字节数组

 

1.2 栈(stack)的延伸阅读

EVM是一个基于的虚拟机。这就意味着对于大多数操作都使用栈,而不是寄存器

基于栈的机器往往比较简单,且易于优化,但其缺点就是比起基于寄存器的机器所需要的opcode更多。

所以EVM有许多特有的操作,大多数都只在栈上使用。比如SWAP和DUP系列操作等,具体请参见EVM文档。现在我们试着编译如下合约:

pragma solidity ^0.4.13;contract Something{function foo(address a1, address a2, address a3, address a4, address a5, address a6){address a7;address a8;address a9;address a10;address a11;address a12;address a13;address a14;address a15;address a16;address a17;}}

你将看到如下错误:

CompilerError: Stack too deep, try removing local variables.

这个错误是因为当栈深超过16时发生了溢出。官方的“解决方案”是建议开发者减少变量的使用,并使函数尽量小。

当然还有其他几种变通方法,比如把变量封装到struct或数组中,或是采用关键字memory(不知道出于何种原因,无法用于普通变量)。

既然如此,让我们试一试这个采用struct的解决方案:

pragma solidity ^0.4.13;contract Something{struct meh{address x;}function foo(address a1, address a2, address a3, address a4, address a5, address a6){address a7;address a8;address a9;address a10; address a11;address a12;address a13; meh memory a14;meh memory a15;meh memory a16;meh memory a17;}}

结果呢?

CompilerError: Stack too deep, try removing local variables.

我们明明采用了memory关键字,为什么还是有问题呢?关键在于,虽然这次我们没有在栈上存放17个256bit整数,但我们试图存放13个整数和4个256bit内存地址

这当中包含一些Solidity本身的问题,但主要问题还是EVM无法对栈进行随机访问

据我所知,其他一些虚拟机往往采用以下两种方法之一来解决这个问题:

  • 鼓励使用较小的栈深,但可以很方便地实现栈元素和内存或其他存储(比如.NET中的本地变量)的交换;

  • 实现pick或类似的指令用于实现对栈元素的随机访问;

然而,在EVM中,栈是唯一免费的存放数据的区域,其他区域都需要支付gas。

因此,这相当于鼓励尽量使用栈,因为其他区域都要收费。正因为如此,我们才会遇到上文所述的基本的语言实现问题。

2不同数据类型的存储位置

Solidity 类型分为两类: 值类型(Value Type) 及 引用类型(Reference Types)。 

Solidity 提供了几种基本类型,可以用来组合出复杂类型。

(1)值类型(Value Type) 

是指 变量在赋值或传参时总是进行值拷贝,包含:

  • 布尔类型(Booleans)

  • 整型(Integers)

  • 定长浮点型(Fixed Point Numbers)

  • 定长字节数组(Fixed-size byte arrays)

  • 有理数和整型常量(Rational and Integer Literals)

  • 字符串常量(String literals)

  • 十六进制常量(Hexadecimal literals)

  • 枚举(Enums)

  • 函数(Function Types)

  • 地址(Address)

  • 地址常量(Address Literals)

(2)引用类型(Reference Types)

是指赋值时我们可以值传递也可以引用即地址传递,包括:

  • 不定长字节数组(bytes)

  • 字符串(string)

  • 数组(Array)

  • 结构体(Struts)

引用类型是一个复杂类型,占用的空间通常超过256位, 拷贝时开销很大

所有的复杂类型,即 数组 和 结构 类型,都有一个额外属性:“数据位置”,说明数据是保存在内存(memory ,数据不是永久存在)中还是存储(storage永久存储在区块链中)中。 根据上下文不同,大多数时候数据有默认的位置,但也可以通过在类型名后增加关键字( storage )或 (memory) 进行修改。

变量默认存储位置:

  • 函数参数(包含返回的参数)默认是memory

  • 局部变量(local variables)默认是storage

  • 状态变量(state variables)默认是storage

局部变量:局部作用域(越过作用域即不可被访问,等待被回收)的变量,如函数内的变量。

状态变量:合约内声明的公共变量

数据位置指定非常重要,因为他们影响着赋值行为。

memory和storage之间或与状态变量之间相互赋值,总是会创建一个完全独立的拷贝

而将一个storage的状态变量,赋值给一个storage的局部变量,是通过引用传递。所以对于局部变量的修改,同时修改关联的状态变量。

另一方面,将一个memory的引用类型赋值给另一个memory的引用,不会创建拷贝(即:memory之间是引用传递)。

注意: 不能将memory赋值给局部变量。 对于值类型,总是会进行拷贝

下面引用一段合约代码作说明:

pragma solidity ^0.4.0;contract C {uint[] x; // x 的数据存储位置是 storage// memoryArray 的数据存储位置是 memoryfunction f(uint[] memoryArray) public {x = memoryArray; // 将整个数组拷贝到 storage 中,可行var y = x;  // 分配一个指针(其中 y 的数据存储位置是 storage),可行y[7]; // 返回第 8 个元素,可行y.length = 2; // 通过 y 修改 x,可行delete x; // 清除数组,同时修改 y,可行// 下面的就不可行了;需要在 storage 中创建新的未命名的临时数组, /// 但 storage 是“静态”分配的:// y = memoryArray;// 下面这一行也不可行,因为这会“重置”指针,// 但并没有可以让它指向的合适的存储位置。// delete y;g(x); // 调用 g 函数,同时移交对 x 的引用h(x); // 调用 h 函数,同时在 memory 中创建一个独立的临时拷贝}function g(uint[] storage storageArray) internal {}function h(uint[] memoryArray) public {}

 

3变量具体存储位置举例

3.1 定位固定大小的值

在这个存模型中,究竟是怎么样存储的呢?对于具有固定大小的已知变量,在内存中给予它们保留空间是合理的。

Solidity编程语言就是这样做的。

contract StorageTest {uint256 a;uint256[2] b;    struct Entry {uint256 id;uint256 value;}Entry c;
}

在上面的代码中:

  • a存储在下标0处。(solidity表示内存中存储位置的术语是“下标(slot)”。)

  • b存储在下标1和2(数组的每个元素一个)。

  • c从插槽3开始并消耗两个插槽,因为该结构体Entry存储两个32字节的值。

image

这些下标位置是在编译时确定的,严格基于变量出现在合同代码中的顺序。

3.2 查找动态大小的值

使用保留下标的方法适用于存储固定大小的状态变量,但适用于动态数组和映射(mapping),因为无法知道需要保留多少个槽。

如果您想将计算机RAM或硬盘驱动器作为比喻,您可能会希望有一个“分配”步骤来查找可用空间,然后执行“释放”步骤,将该空间放回可用存储池中。

但是这是不必要的,因为智能合约存储是一个天文数字级别的规模。存储器中有2^256个位置可供选择,大约是已知可观察宇宙中的原子数。您可以随意选择存储位置,而不会遇到碰撞。您选择的位置相隔太远以至于您可以在每个位置存储尽可能多的数据,而无需进入下一个位置。

当然,随机选择地点不会很有帮助,因为您无法再次查找数据。

Solidity改为使用散列函数来统一并可重复计算动态大小值的位置。

3.3 动态大小的数组

动态数组需要一个地方来存储它的大小以及它的元素

contract StorageTest {uint256 a;     // slot 0uint256[2] b;  // slots 1-2struct Entry {uint256 id;uint256 value;}Entry c;       // slots 3-4Entry[] d;}

在上面的代码中,动态大小的数组d存在下标5的位置,但是存储的唯一数据是数组的大小

数组d中的值从下标的散列值hash(5)开始连续存储

image

下面的Solidity函数计算动态数组元素的位置

function arrLocation(uint256 slot, uint256 index, uint256 elementSize) public pure returns (uint256)
{return uint256(keccak256(slot)) + (index * elementSize);}

3.4 映射(Mappings)

一个映射mapping需要有效的方法来找到与给定的键相对应的位置。

计算键的哈希值是一个好的开始,但必须注意确保不同的mappings产生不同的位置。

contract StorageTest {uint256 a;     // slot 0uint256[2] b;  // slots 1-2struct Entry {uint256 id;uint256 value;}Entry c;       // slots 3-4Entry[] d;     // slot 5 for length, keccak256(5)+ for datamapping(uint256 => uint256) e;mapping(uint256 => uint256) f;}

在上面的代码中,e的“位置” 是下标6,f的位置是下标7,但实际上没有任何内容存储在这些位置。(不知道多长需要存储,并且独立的值需要位于其他地方。)

要在映射中查找特定值的位置,和映射存储的下标会一起进行哈希运算

image

以下Solidity函数计算值的位置:

function mapLocation(uint256 slot, uint256 key) public pure returns (uint256) 
{return uint256(keccak256(key, slot));}

请注意,当keccak256函数有多个参数时,在哈希运算之前先将这些参数连接在一起

由于下标和键都是哈希函数的输入,因此不同mappings之间不会发生冲突。

3.5 复杂类型的组合

动态大小的数组和mappings可以递归地嵌套在一起。

当发生这种情况时,通过递归地应用上面定义的计算来找到值的位置。这听起来比它更复杂。

contract StorageTest {uint256 a;     // slot 0uint256[2] b;  // slots 1-2struct Entry {uint256 id;uint256 value;}Entry c;       // slots 3-4Entry[] d;     // slot 5 for length, keccak256(5)+ for datamapping(uint256 => uint256) e;    // slot 6, data at h(k . 6)mapping(uint256 => uint256) f;    // slot 7, data at h(k . 7) mapping(uint256 => uint256[]) g;  // slot 8mapping(uint256 => uint256)[] h;  // slot 9}

要找到这些复杂类型中的项目,我们可以使用上面定义的函数。

要找到g123:

// first find arr = g[123]arrLoc = mapLocation(8, 123);  // g is at slot 8// then find arr[0]itemLoc = arrLocation(arrLoc, 0, 1);

要找到h2:

// first find map = h[2]mapLoc = arrLocation(9, 2, 1);  // h is at slot 9// then find map[456]itemLoc = mapLocation(mapLoc, 456);

3.6 总结

  • 每个智能合约都以2^25632字节值数组形式存储,全部初始化为零。

  • 零没有明确存储,因此将值设置为零会回收该存储。

  • Solidity中,确定占内存大小的值从第0号下标开始放。

  • Solidity利用存储的稀疏性散列输出的均匀分布来安全地定位动态大小的值。

下表显示了如何计算不同类型的存储位置。“下标”是指在编译时遇到状态变量时的下一个可用下标,而点表示二进制串联:

image

本文作者:HiBlock区块链社区技术布道者辉哥

原文发布于简书

https://www.e-learn.cn/topic/3154772 

这篇关于以太坊存储类型(memory,storage)及变量存储详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1132499

相关文章

python管理工具之conda安装部署及使用详解

《python管理工具之conda安装部署及使用详解》这篇文章详细介绍了如何安装和使用conda来管理Python环境,它涵盖了从安装部署、镜像源配置到具体的conda使用方法,包括创建、激活、安装包... 目录pytpshheraerUhon管理工具:conda部署+使用一、安装部署1、 下载2、 安装3

详解Java如何向http/https接口发出请求

《详解Java如何向http/https接口发出请求》这篇文章主要为大家详细介绍了Java如何实现向http/https接口发出请求,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 用Java发送web请求所用到的包都在java.net下,在具体使用时可以用如下代码,你可以把它封装成一

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

JAVA系统中Spring Boot应用程序的配置文件application.yml使用详解

《JAVA系统中SpringBoot应用程序的配置文件application.yml使用详解》:本文主要介绍JAVA系统中SpringBoot应用程序的配置文件application.yml的... 目录文件路径文件内容解释1. Server 配置2. Spring 配置3. Logging 配置4. Ma

IDEA如何将String类型转json格式

《IDEA如何将String类型转json格式》在Java中,字符串字面量中的转义字符会被自动转换,但通过网络获取的字符串可能不会自动转换,为了解决IDEA无法识别JSON字符串的问题,可以在本地对字... 目录问题描述问题原因解决方案总结问题描述最近做项目需要使用Ai生成json,可生成String类型

mac中资源库在哪? macOS资源库文件夹详解

《mac中资源库在哪?macOS资源库文件夹详解》经常使用Mac电脑的用户会发现,找不到Mac电脑的资源库,我们怎么打开资源库并使用呢?下面我们就来看看macOS资源库文件夹详解... 在 MACOS 系统中,「资源库」文件夹是用来存放操作系统和 App 设置的核心位置。虽然平时我们很少直接跟它打交道,但了

关于Maven中pom.xml文件配置详解

《关于Maven中pom.xml文件配置详解》pom.xml是Maven项目的核心配置文件,它描述了项目的结构、依赖关系、构建配置等信息,通过合理配置pom.xml,可以提高项目的可维护性和构建效率... 目录1. POM文件的基本结构1.1 项目基本信息2. 项目属性2.1 引用属性3. 项目依赖4. 构

Rust 数据类型详解

《Rust数据类型详解》本文介绍了Rust编程语言中的标量类型和复合类型,标量类型包括整数、浮点数、布尔和字符,而复合类型则包括元组和数组,标量类型用于表示单个值,具有不同的表示和范围,本文介绍的非... 目录一、标量类型(Scalar Types)1. 整数类型(Integer Types)1.1 整数字

Java操作ElasticSearch的实例详解

《Java操作ElasticSearch的实例详解》Elasticsearch是一个分布式的搜索和分析引擎,广泛用于全文搜索、日志分析等场景,本文将介绍如何在Java应用中使用Elastics... 目录简介环境准备1. 安装 Elasticsearch2. 添加依赖连接 Elasticsearch1. 创

Redis缓存问题与缓存更新机制详解

《Redis缓存问题与缓存更新机制详解》本文主要介绍了缓存问题及其解决方案,包括缓存穿透、缓存击穿、缓存雪崩等问题的成因以及相应的预防和解决方法,同时,还详细探讨了缓存更新机制,包括不同情况下的缓存更... 目录一、缓存问题1.1 缓存穿透1.1.1 问题来源1.1.2 解决方案1.2 缓存击穿1.2.1