Rust能力养成系列之(39):内存管理:生命周期收尾和指针初步

本文主要是介绍Rust能力养成系列之(39):内存管理:生命周期收尾和指针初步,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

上篇结尾谈及了生命周期子类型,本篇就从这里开始。

 

生命周期子类型(lifetime subtyping)

我们可以指定生命周期之间的关系,以指定两个引用是否可以在同一位置使用。继续上一篇Decoder结构体的例子,可以在impl块中指定生命周期之间的关系,如下所示:

// lifetime_subtyping.rsstruct Decoder<'a, 'b, S, R> {schema: &'a S,reader: &'b R
}impl<'a, 'b, S, R> Decoder<'a, 'b, S, R>
where 'a: 'b {}fn main() {let a: Vec<u8> = vec![];let b: Vec<u8> = vec![];let decoder = Decoder {schema: &a, reader: &b};

这里在impl块中使用where子句指定了关系:'a: 'b。意味着a比b生命周期的存在时间要长

 

指定泛型类型的生命周期

除了使用特行来约束泛型函数可以接受的类型之外,还可以使用生命周期注释来约束泛型类型参数。比如,这里有一个logger库,其中logger对象的定义如下:

// lifetime_bounds.rsenum Level {Error
}struct Logger<'a>(&'a str, Level);fn configure_logger<T>(_t: T) where T: Send + 'static {// configure the logger here
}fn main() {let name = "Global";let log1 = Logger(name, Level::Error);configure_logger(log1);
}

在以上代码中,有名为Logger的结构体和名为Level的枚举,还有一个名为configure_logger的泛型函数,接收一个类型为T的参数,用Send + 'static进行约束。在main中,我们用'static, 、字符串' Global '创建一个Logger变量,并调用configure_logger进行传参。

看下第9行,除了规定send绑定信息之外,还规定该类型必须与'static生命周期具有相同时间。比如设要使用一个Logger,其引用了一连串更短的生命周期,如下所示:

// lifetime_bounds_short.rsenum Level {Error
}struct Logger<'a>(&'a str, Level);fn configure_logger<T>(_t: T) where T: Send + 'static {// configure the logger here
}fn main() {let other = String::from("Local");let log2 = Logger(&other, Level::Error);configure_logger(&log2);
}

编译不会通过,并报错如下:

错误消息明确指出,借用的值必须对静态生命周期有效,但上述代码给它传递了一个字符串过去,该生命周期名为'a,在main函数中 ,比'static的生命周期更短。

要理清这里面的问题,需要看一下Rust中的指针。

 

Rust中的指针类型

不谈指针,有关内存管理的讨论将是不完整的,应该说,指针是所有低级语言中操作内存的主要方式。众所周知,指针只是指向进程地址空间中的内存位置的变量(variables that point to memory locations in the process's address space)。在Rust中, 主要处理三种指针。

 

引用--安全指针(References – safe pointers)

这种指针在借用(borrowing)一节中介绍过,很像C语言中的指针,但是要其正确性需要得到检查,永远不能为null,并且总是会指向任意变量所拥有的数据:所指向的数据要么在栈上,要么在堆上,要么在二进制文件的数据段上。在创建时,会使用到&或者是&mut运算符:这些符号在类型T上作为前缀时,会创建一个引用类型,对于不可变引用,用&T表示,对于可变引用,用&mut表示。让我们再来回顾一下:

  • &T: 这是对T类型的一个不可变引用。一个 &T指针是一个Copy类型,这意味着可以有很多对值T的不可变引用。如果把这个赋值给另一个变量,会得到一个指向相同数据的指针的副本。允许创建对一个引用的引用,比如&&T。
  • &mut T: 这是对T类型的一个可变引用。在任何范围内,由于借用规则,不能有两个对值T的可变引用。这意味着T类型不实现Copy特性,也不能被发送到线程。

 

原始指针(Raw pointers)

这种指针在类型签名上有一个非常奇怪的标志,会在前缀位置加一个*,而这显然跟接触引用的操作符是一样的。一般而言,原始指针主要用于所谓的非安全代码(unsafe code),需要在一个非安全的区域(unsafe block)来对其解除引用。在Rust中,主要有两种原始指针。

  • *const T: 指向类型T的不可变原始指针,为Copy类型,类似于&T,只是*const T可以是null。
  • *mut T: 指向值T的可变原始指针,为Non-Copy类型。

需要注意的是,引用可以转换为原始指针,可见如下代码:

let a = &56;
let a_raw_ptr = a as *const u32;
// or
let b = &mut 5634.3;
let b_mut_ptr = b as *mut T;

然而,不能将&T转换为*mut,因为这样会违反只允许一个可变借用的规则。

对于可变引用,可以将其转换为*mut甚至*const T,这被称为指针弱化,也就是说,是从强一点的指针&mut转换为弱一点的*const T指针。对于不可变引用,只能将其转换为*const T。

不难想见,对原始指针进行解除引用是一个不安全的操作,在后续篇章中,会谈一下原始指针的用途。

 

前言

上篇结尾谈及了生命周期子类型,本篇就从这里开始。

 

生命周期子类型(lifetime subtyping)

我们可以指定生命周期之间的关系,以指定两个引用是否可以在同一位置使用。继续上一篇Decoder结构体的例子,可以在impl块中指定生命周期之间的关系,如下所示:

// lifetime_subtyping.rsstruct Decoder<'a, 'b, S, R> {schema: &'a S,reader: &'b R
}impl<'a, 'b, S, R> Decoder<'a, 'b, S, R>
where 'a: 'b {}fn main() {let a: Vec<u8> = vec![];let b: Vec<u8> = vec![];let decoder = Decoder {schema: &a, reader: &b};

这里在impl块中使用where子句指定了关系:'a: 'b。意味着a比b生命周期的存在时间要长

 

指定泛型类型的生命周期

除了使用特行来约束泛型函数可以接受的类型之外,还可以使用生命周期注释来约束泛型类型参数。比如,这里有一个logger库,其中logger对象的定义如下:

// lifetime_bounds.rsenum Level {Error
}struct Logger<'a>(&'a str, Level);fn configure_logger<T>(_t: T) where T: Send + 'static {// configure the logger here
}fn main() {let name = "Global";let log1 = Logger(name, Level::Error);configure_logger(log1);
}

在以上代码中,有名为Logger的结构体和名为Level的枚举,还有一个名为configure_logger的泛型函数,接收一个类型为T的参数,用Send + 'static进行约束。在main中,我们用'static, 、字符串' Global '创建一个Logger变量,并调用configure_logger进行传参。

 

看下第9行,除了规定send绑定信息之外,还规定该类型必须与'static生命周期具有相同时间。比如设要使用一个Logger,其引用了一连串更短的生命周期,如下所示:

// lifetime_bounds_short.rsenum Level {Error
}struct Logger<'a>(&'a str, Level);fn configure_logger<T>(_t: T) where T: Send + 'static {// configure the logger here
}fn main() {let other = String::from("Local");let log2 = Logger(&other, Level::Error);configure_logger(&log2);
}

编译不会通过,并报错如下:

错误消息明确指出,借用的值必须对静态生命周期有效,但上述代码给它传递了一个字符串过去,该生命周期名为'a,在main函数中 ,比'static的生命周期更短。

要理清这里面的问题,需要看一下Rust中的指针。

 

Rust中的指针类型

不谈指针,有关内存管理的讨论将是不完整的,应该说,指针是所有低级语言中操作内存的主要方式。众所周知,指针只是指向进程地址空间中的内存位置的变量(variables that point to memory locations in the process's address space)。在Rust中, 主要处理三种指针。

 

引用--安全指针(References – safe pointers)

这种指针在借用(borrowing)一节中介绍过,很像C语言中的指针,但是要其正确性需要得到检查,永远不能为null,并且总是会指向任意变量所拥有的数据:所指向的数据要么在栈上,要么在堆上,要么在二进制文件的数据段上。在创建时,会使用到&或者是&mut运算符:这些符号在类型T上作为前缀时,会创建一个引用类型,对于不可变引用,用&T表示,对于可变引用,用&mut表示。让我们再来回顾一下:

  • &T: 这是对T类型的一个不可变引用。一个 &T指针是一个Copy类型,这意味着可以有很多对值T的不可变引用。如果把这个赋值给另一个变量,会得到一个指向相同数据的指针的副本。允许创建对一个引用的引用,比如&&T。
  • &mut T: 这是对T类型的一个可变引用。在任何范围内,由于借用规则,不能有两个对值T的可变引用。这意味着T类型不实现Copy特性,也不能被发送到线程。

 

原始指针(Raw pointers)

这种指针在类型签名上有一个非常奇怪的标志,会在前缀位置加一个*,而这显然跟接触引用的操作符是一样的。一般而言,原始指针主要用于所谓的非安全代码(unsafe code),需要在一个非安全的区域(unsafe block)来对其解除引用。在Rust中,主要有两种原始指针。

  • *const T: 指向类型T的不可变原始指针,为Copy类型,类似于&T,只是*const T可以是null。
  • *mut T: 指向值T的可变原始指针,为Non-Copy类型。

 

需要注意的是,引用可以转换为原始指针,可见如下代码:

let a = &56;
let a_raw_ptr = a as *const u32;
// or
let b = &mut 5634.3;
let b_mut_ptr = b as *mut T;

然而,不能将&T转换为*mut,因为这样会违反只允许一个可变借用的规则。

对于可变引用,可以将其转换为*mut甚至*const T,这被称为指针弱化,也就是说,是从强一点的指针&mut转换为弱一点的*const T指针。对于不可变引用,只能将其转换为*const T。

不难想见,对原始指针进行解除引用是一个不安全的操作,在后续篇章中,会谈一下原始指针的用途。

 

结语

本篇介绍了两种指针,下一篇,介绍第三种指针,也就是所谓的智能指针(smart pointer)

 

主要参考和建议读者进一步阅读的文献

https://doc.rust-lang.org/book

深入浅出 Rust,2018,范长春

Rust编程之道,2019, 张汉东

The Complete Rust Programming Reference Guide,2019, Rahul Sharma,Vesa Kaihlavirta,Claus Matzinger

Hands-On Data Structures and Algorithms with Rust,2018,Claus Matzinger

Beginning Rust ,2018,Carlo Milanesi

Rust Cookbook,2017,Vigneshwer Dhinakaran

发布于 22 小时前

这篇关于Rust能力养成系列之(39):内存管理:生命周期收尾和指针初步的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/396092

相关文章

golang内存对齐的项目实践

《golang内存对齐的项目实践》本文主要介绍了golang内存对齐的项目实践,内存对齐不仅有助于提高内存访问效率,还确保了与硬件接口的兼容性,是Go语言编程中不可忽视的重要优化手段,下面就来介绍一下... 目录一、结构体中的字段顺序与内存对齐二、内存对齐的原理与规则三、调整结构体字段顺序优化内存对齐四、内

SpringBoot中使用 ThreadLocal 进行多线程上下文管理及注意事项小结

《SpringBoot中使用ThreadLocal进行多线程上下文管理及注意事项小结》本文详细介绍了ThreadLocal的原理、使用场景和示例代码,并在SpringBoot中使用ThreadLo... 目录前言技术积累1.什么是 ThreadLocal2. ThreadLocal 的原理2.1 线程隔离2

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)

Java循环创建对象内存溢出的解决方法

《Java循环创建对象内存溢出的解决方法》在Java中,如果在循环中不当地创建大量对象而不及时释放内存,很容易导致内存溢出(OutOfMemoryError),所以本文给大家介绍了Java循环创建对象... 目录问题1. 解决方案2. 示例代码2.1 原始版本(可能导致内存溢出)2.2 修改后的版本问题在

浅析Rust多线程中如何安全的使用变量

《浅析Rust多线程中如何安全的使用变量》这篇文章主要为大家详细介绍了Rust如何在线程的闭包中安全的使用变量,包括共享变量和修改变量,文中的示例代码讲解详细,有需要的小伙伴可以参考下... 目录1. 向线程传递变量2. 多线程共享变量引用3. 多线程中修改变量4. 总结在Rust语言中,一个既引人入胜又可

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

Redis多种内存淘汰策略及配置技巧分享

《Redis多种内存淘汰策略及配置技巧分享》本文介绍了Redis内存满时的淘汰机制,包括内存淘汰机制的概念,Redis提供的8种淘汰策略(如noeviction、volatile-lru等)及其适用场... 目录前言一、什么是 Redis 的内存淘汰机制?二、Redis 内存淘汰策略1. pythonnoe

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

关于Maven生命周期相关命令演示

《关于Maven生命周期相关命令演示》Maven的生命周期分为Clean、Default和Site三个主要阶段,每个阶段包含多个关键步骤,如清理、编译、测试、打包等,通过执行相应的Maven命令,可以... 目录1. Maven 生命周期概述1.1 Clean Lifecycle1.2 Default Li