Linux环境变量&&进程地址空间详解

2025-02-08 04:50

本文主要是介绍Linux环境变量&&进程地址空间详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《Linux环境变量&&进程地址空间详解》本文介绍了Linux环境变量、命令行参数、进程地址空间以及Linux内核进程调度队列的相关知识,环境变量是系统运行环境的参数,命令行参数用于传递给程序的参数,...

一、初步认识环境变量

1.1常见的环境变量

  • PATH:Linux系统下的指令命令的默认搜索路径

Linux环境变量&&进程地址空间详解

  • HOME:用户登录shell的默认主工作目录

Linux环境变量&&进程地址空间详解

  • SHELL:当前Shell,它的值通常是/bin/bash

Linux环境变量&&进程地址空间详解

为什么我们运行自己的可执行程序需要加./,而一些指令可以直接执行,这是因为存在环境变量PATH,它是Linux下指令的默认搜索路径,当运行一个指令时,操作系统会到PATH中去查找该指令的所在路径 ,当我们把我们可执行程序的路径添加到PATH中,也可像指令一样直接执行,不需要添加./

Linux环境变量&&进程地址空间详解

和环境变量相关的指令

  • 1. echo: 显示某个环境变量值
  • 2. export: 设置一个新的环境变量
  • 3. env: 显示所有环境变量
  • 4. unset: 清除环境变量
  • 5. set: 显示本地定义的shell变量和环境变

1.2环境变量的基本概念

环境变量是系统引入的一套name=value形式的变量,不同的环境变量具有不同的用途,环境变量具有全局属性

环境变量一般是指在操作系统中用来指定操作系统运行环境的一些参数

有了全局属性这个概念,以下要引入命令行参数来解释这个概念

二、命令行参数

2.1通过命令行参数获取环境变量

main函数有三个参数,int  agrc ,char*argv[ ] ,char*evn[ ]

当我们在输入各种指令,运行各种程序时,本质上输入的都是一个一个的字符串,bash会根据空格将这些字符串一一划分,argc就是用来记录划分字符串的个数的,argv是一张叫作命令行参数的表(本质上是一个指针数组),里面存储的是被bash分割形成的一个个字符串的地址

为什么需要命令行参数表呢?因为这样可以为我们的指令、软件、软件等提供命令行选项支持!

命令行参数表是以NULL为结束的

实例:通过argv查看命令行参数

Linux环境变量&&进程地址空间详解

Linux环境变量&&进程地址空间详解

实例:通过命令行参数argc和agrv来进行选项的设置

Linux环境变量&&进程地址空间详解

Linux环境变量&&进程地址空间详解

main函数中还有一个参数evn,它对应是一张环境变量表,可以通过打印该表来查看系统的所以环境变量

Linux环境变量&&进程地址空间详解

Linux环境变量&&进程地址空间详解

通过比较可以发现,子进程的环境变量和env展示出来的环境变量一模一样!这就可以解释为什么环境变量具有全局属性了!我们所运行的进程都是子进程,bash本身在启动时会从操作系统的配置文件中读取环境变量, 形成一张环境变量表,这个表会被子进程的main函数参数接收,也就是说,子进程会继承父进程交给它的环境变量,所有建立在父进程上的子进程都会有相同的一份环境变量2.2本地变量和内建命令

本地变量:只会在本bash内部有效,不会被子进程继承

Linux环境变量&&进程地址空间详解

set可以查看所以变量(环境变量&&本地变量)

Linux环境变量&&进程地址空间详解

Linux环境变量&&进程地址空间详解

export可以把本地变量设置成成环境变量

Linux环境变量&&进程地址空间详解

子进程中也可以查找到一份

Linux环境变量&&进程地址空间详解

通过unsChina编程et可清除设置的环境变量

我们知道任何程序和指令在运行时都是bash的子进程,本地变量只对本bash内部有效,那么这里就有一个问题了:为什么使用echo可以显示出MY_VALUE的内容呢?

这里就要再引入一个新的概念:内建命令

  1. 常规命令:通过创建子进程完成的
  2. 内建命令:bash不创建子进程,由bash自己执行,类似bash通过调用自己内部实现的函数或者系统提供的函数,比如echo、cd都属于内建命令,比如我们在cd时改变的是bash下的工作目录,并不会去改变子进程所在的目录
  3. 模拟实现一个具有cd功能的指令--chdir()系统提供的一个改变当前工作目录的函数

Linux环境变量&&进程地址空间详解

Linux环境变量&&进程地址空间详解

Linux环境变量&&进程地址空间详解

2.3环境变量的获取

  • 第一种就是上面演示的通过命令行的第三个参数获取
  • 第二种是通过第三方变量environ获取

Linux环境变量&&进程地址空间详解

Linux环境变量&&进程地址空间详解

第三种是通过调用系统函数获取或者设置环境变量--getenv()和putenv()

Linux环境变量&&进程地址空间详解

Linux环境变量&&进程地址空间详解

三、进程地址空间

3.1进程(虚拟)地址空间的引入

观察下面代码的运行结果:可以看到子进程对全局变量g_val1进行修改,父进程和子进程输出变量的值不一样,但是地址是一样的,说明该变量所在的地址一定不是物理地址!父子进程输出的变量在物理地址上看来也不是同一个变量!我们在用C/C++语言看到的也是虚拟地址,真正的物理地址用户是看不见到,由操作系统统一管理

Linux环境变量&&进程地址空间详解

Linux环境变量&&进程地址空间详解

操作系统必须负责物理地址和虚拟地址之间的映射,那操作系统具体是如何做到的呢?

3.2进程地址空间的布局和理解

结合fork() 初步理解地址进程空间

前面已经谈到,fork()创建子进程成功,会有两个返回值,给父进程返回子进程的pid,给子进程返回0。fork()之后创建的子进程,在内存中除了有一个以父进程为模板(拷贝)的pcb数据结构,还有一个从父进程拷贝下来的mm数据结构(进程地址空间)和一个页表,页表中存着变量虚拟地址和物理地址的映射关系、权限字段、判断数据在内存还是磁盘的字段,通过映射关系,可以找到虚拟地址对应的物理地址

子进程刚创建的时候,在mm中数据的虚拟地址和父进程是一样的,我们打印看到的都是这个虚拟地址,子进程刚拷贝父进程的数据结构内容的时候,代码和数据都是共用的,并且数据在页表中的权限会被设置为只读

由于代码是共享的,那么在fork()return前子进程被创建好了,return就会被父子进程各执行一次,又由于return的实质就是在对变量进行写入,这时候就相当于要对数据进行修改

当子进程和父进程有一方要对数据进行修改,就会触发对数据的非法操作,从而发生缺页中断,此时操作系统就会重新在内存中开辟一块空间,将要修改的数据拷贝一份作修改,再重新建立映射关系,这个过程也叫写时拷贝,这样父子进程就做到了各自私有一份数据

我们上面代码所展示的结果,地址一样变量值不一样,这是因为打印出来的地址是虚拟地址,子进程拷贝了父进程的数据结构内容,所以他们的虚拟地址就是一样的;变量值不一样是因为,写时拷贝后虚拟地址在页表中映射的物理地址不一样,找到的数据当然也就并不一样了。这两个原因结合就说明了我们所看到的现象

Linux环境变量&&进程地址空间详解

3.3什么是地址空间?

地址总线排列组合形成的地址范围[0,2^32) 32根地址总线

3.4地址空间如何进行区域划分?

进程地址空间本质上是描绘进程可视范围大小,在内核上他是一个数据结构对象(mm_struct),也要被 操作系统管理,地址空间通过各个区域的star和end对区域进行线性(区域)划分,在一个区域的范围内,连续空间中,每一个最小单元都有地址,都可以被使用

区域空间的调整,本质上就是通过调整每个区域的star和end

3.5进一步理解进程和进程地址空间

目前为止,我们所说的进程,就是:进程=内核数据结构对象(pcb,mm,页表)+程序的代码和数据(可执行文件) 

为什么需要进程地址空间?

让进程以统一的视角来看待内存:如果进程直接和物理地址进行交互,那么进程的pcb数据结构中就势必要存在各个数据的物理地址。一个进程的www.chinasem.cn各个数据部分,在物理内存中实际是乱序的,但是有了地址空间(mm_struct)之后:代码就在代码段,数据就在数据段该在堆区的在堆区,该在栈区的在栈区同时,这些连续的虚拟地址再经过的页表映射到物理内存,这样,让进程数据地址从无序变有序,让进程以统一的视角看待物理内存以及各个运行区域,每个进程都会以为自己占有了整个系统的内存资源

拦截对内存的非法操作和异常访问:进程地址空间让我们在访问内存的时候有一个转化的过程,在这个过程中,如果我们对内存进行了非法操作和访问,那么就会被拦截,物理内存不会收到影响,进而保护了物理内存

有了进程地址空间和页表,就可以做到将进程管理模块和内存管理模块进行解耦合:进程在运行的时候不会关心操作系统是如何申请内存的,对进程的管理和对内存的申请都是由操作系统来完成,他们互不干扰!操作系统不做任何浪费时间和空间的事情,当一个进程申请了内存,但是它又不立即使这块内存的时候,就相当于占用了内存资源,这时候操作系统会采用惰性加载的方式:给该进程一个虚拟地址,但在页表中并没有实际映射的物理地址,也就是说进程看到的是已经开辟好的虚拟地址,但在物理内存上并没有真的申请到空间;当进程需要内存的时候,找不到映射的物理地址触发缺页中断,此时操作系统就会给它开辟空间,建立映射关系。从而说明了,pcb数据结构对象的创建先于可执行程序的加载

3.6页表的理解

页表不仅仅有虚拟地址和物理地址的映射,还有对应的编程China编程权限,当一个进程要对一个数据修改时,本质是通过虚拟地址找到对应物理内存的数据再修改,当要修改某一个数据,但是该数据在页表的所记录的权限只有rx,仅仅允许只读,那么就会修改动作就会被拦截,直接报错,程序崩溃,修改这个动作就不会被允许

这也就是为什么,一个程序崩溃时,并不会影响其他进程,因为崩溃的程序在虚拟内存页表层就已经被拦截,操作系统会直接杀掉进程,进而也就不会影响其他进程的运行

总结:页表存在CPU的cr3寄存器(物理地址),进程在被CPU调度和离开CPU的时候,都要带走寄存器里的数据 ,CPU在运行程序时,为了获取数据,就会通过cr3寄存器里的页表地址找到该进程的页表,页表中的虚拟地址通过映射得到物理地址,进而可以访问到物理内存,同时会根据虚拟地址和物理地址的映射权限(rwx)来决定是否能对该物理内存进行操作,如果非法操作,该请求会被拦截,操作系统会将此进程杀掉

三个实例体现页表的作用

进程的挂起是如何实现的?前面说到,页表中还存在一个用来判断数据是在内存还是在磁盘中的字段,进程的挂起就是将该进程所对应的数据和代码换出到外设分区中,那么这时候操作系统只需要通过修该字段就可以知道进程是否处于挂起状态

进程的独立性:进程的独立性表现在,每个进程都有自己私有的一份数据,以及每个进程都有自己的一份mm_struct进程地址空间,这就保证了每个进程只能访问自己的进程地址空间,相互之间不得访问!也就是说,如果进程直接和物理内存打交道,那么就可能访问到其他进程的数据,但是由于进程地址空间的存在,非法qsTtjPyXP访问在页表层面就会被拦截,确保了更个进程之间不会非法访问和篡改对方的数据

代码和字符常量区的数据为什么是只读的?如果这写数据本身是只读的,那么它就不可能从磁盘加载到内存中!这边的只读是在页表层面上的只读!它在页表中的权限被设置成只读,当一个进程试图修改该部分的数据,一样会被拦截

四、Linux内核进程调度队列

4.1优先级

  • 普通优先级:100~139(我们都是普通的优先级,想想nice值的取值范围,可与之对应!)
  • 实时优先级:0~99(不关心)

4.2活动队列

  • 所有时间片还没结束的进程都被放在活动队列
  • 本质上是一个指针数组,数组的下标就表示优先级,从100开始
  • 调度过程
  1. 从[0,140)开始遍历,找到第一个优先级最高且非空的队列
  2. 从该队列的第一个进程开始调度运行
  3. 但由于逐一遍历数组的效率太低下了,为了提高查找非空队列的效率,可以采用位图的思想,用5*32个比特位来队列是否为空

4.3过期队列

  • 过期队列的结构和活动队列一样
  • 过期队列上放的都是时间片过期的队列
  • 当活动队列的进程都调度结束了,那么swap交换两个队列的指针,就可以对过期队列的进程进行时间片的重新计算,等待调度运行

4.4active指针和expired指针

  • active指针指向活动队列
  • expired指针指向过期队列
  • 当活动队列的进程全都调度完毕,swap交换两个指针,就相当于有了新的活动队列

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持China编程(www.chinasem.cn)。

这篇关于Linux环境变量&&进程地址空间详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1153338

相关文章

Flutter监听当前页面可见与隐藏状态的代码详解

《Flutter监听当前页面可见与隐藏状态的代码详解》文章介绍了如何在Flutter中使用路由观察者来监听应用进入前台或后台状态以及页面的显示和隐藏,并通过代码示例讲解的非常详细,需要的朋友可以参考下... flutter 可以监听 app 进入前台还是后台状态,也可以监听当http://www.cppcn

C++ Primer 标准库vector示例详解

《C++Primer标准库vector示例详解》该文章主要介绍了C++标准库中的vector类型,包括其定义、初始化、成员函数以及常见操作,文章详细解释了如何使用vector来存储和操作对象集合,... 目录3.3标准库Vector定义和初始化vector对象通列表初始化vector对象创建指定数量的元素值

MyBatis与其使用方法示例详解

《MyBatis与其使用方法示例详解》MyBatis是一个支持自定义SQL的持久层框架,通过XML文件实现SQL配置和数据映射,简化了JDBC代码的编写,本文给大家介绍MyBatis与其使用方法讲解,... 目录ORM缺优分析MyBATisMyBatis的工作流程MyBatis的基本使用环境准备MyBati

Nginx中location实现多条件匹配的方法详解

《Nginx中location实现多条件匹配的方法详解》在Nginx中,location指令用于匹配请求的URI,虽然location本身是基于单一匹配规则的,但可以通过多种方式实现多个条件的匹配逻辑... 目录1. 概述2. 实现多条件匹配的方式2.1 使用多个 location 块2.2 使用正则表达式

Nginx配置系统服务&设置环境变量方式

《Nginx配置系统服务&设置环境变量方式》本文介绍了如何将Nginx配置为系统服务并设置环境变量,以便更方便地对Nginx进行操作,通过配置系统服务,可以使用系统命令来启动、停止或重新加载Nginx... 目录1.Nginx操作问题2.配置系统服android务3.设置环境变量总结1.Nginx操作问题

jdk21下载、安装详细教程(Windows、Linux、macOS)

《jdk21下载、安装详细教程(Windows、Linux、macOS)》本文介绍了OpenJDK21的下载地址和安装步骤,包括Windows、Linux和macOS平台,下载后解压并设置环境变量,最... 目录1、官网2、下载openjdk3、安装4、验证1、官网官网地址:OpenJDK下载地址:Ar

spring @EventListener 事件与监听的示例详解

《spring@EventListener事件与监听的示例详解》本文介绍了自定义Spring事件和监听器的方法,包括如何发布事件、监听事件以及如何处理异步事件,通过示例代码和日志,展示了事件的顺序... 目录1、自定义Application Event2、自定义监听3、测试4、源代码5、其他5.1 顺序执行

Java之并行流(Parallel Stream)使用详解

《Java之并行流(ParallelStream)使用详解》Java并行流(ParallelStream)通过多线程并行处理集合数据,利用Fork/Join框架加速计算,适用于大规模数据集和计算密集... 目录Java并行流(Parallel Stream)1. 核心概念与原理2. 创建并行流的方式3. 适

web网络安全之跨站脚本攻击(XSS)详解

《web网络安全之跨站脚本攻击(XSS)详解》:本文主要介绍web网络安全之跨站脚本攻击(XSS)的相关资料,跨站脚本攻击XSS是一种常见的Web安全漏洞,攻击者通过注入恶意脚本诱使用户执行,可能... 目录前言XSS 的类型1. 存储型 XSS(Stored XSS)示例:危害:2. 反射型 XSS(Re

linux本机进程间通信之UDS详解

《linux本机进程间通信之UDS详解》文章介绍了Unix域套接字(UDS)的使用方法,这是一种在同一台主机上不同进程间通信的方式,UDS支持三种套接字类型:SOCK_STREAM、SOCK_DGRA... 目录基础概念本机进程间通信socket实现AF_INET数据收发示意图AF_Unix数据收发流程图A