【GPU驱动开发】-Mesa ST和GLSL编译器衔接源码分析

2024-01-26 06:44

本文主要是介绍【GPU驱动开发】-Mesa ST和GLSL编译器衔接源码分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

不必害怕未知,无需恐惧犯错,做一个Creator!

(基于Mesa 22.2.5版本)

st_glsl_to_nir.c 主要实现了 GLSL 到 NIR 的转换功能,包括 GLSL 程序的链接、NIR 的最终化、优化以及统一变量的处理。以下是该文件主要实现的功能以及功能之间的实现流程:

链接 GLSL 到 NIR:
st_link_shader 函数是 GLSL 程序链接到 NIR 的入口函数。
根据着色器类型(GLSL 或 SPIR-V)调用相应的链接函数,如 gl_nir_link_glsl 或 gl_nir_link_spirv。
在链接过程中,执行了一系列的操作,包括清除着色器程序数据、创建着色器程序数据、判断着色器类型、链接着色器等。

GLSL 到 NIR 转换后的处理:
st_glsl_to_nir_post_opts 函数执行 GLSL 到 NIR 转换的链接后任务。
为使用的内建统一变量添加状态引用。

NIR 最终化和优化:
st_finalize_nir_before_variants 函数在生成变体之前最终化 NIR。
执行一系列 NIR 优化和变换,如分裂变量拷贝、降级纹理采样器、降级原子操作等。
设置受影响的状态标志(affected state flags)。

NIR 统一变量处理:
st_nir_lower_uniforms 函数用于降级 NIR 中的统一变量,根据配置使用压缩或非压缩方式。
如果启用了 lower_uniforms_to_ubo,还会将一些统一变量降级为 UBO。
最终将状态参数优化为 UBO。

统一变量的位置分配:
st_nir_lookup_parameter_index 函数根据变量在程序参数列表中的位置查找参数的索引。
st_nir_assign_uniform_locations 函数为 NIR 着色器中的统一变量分配驱动程序位置。
处理不同情况,包括无绑定和状态槽。

顶点着色器输入位置分配:
st_nir_assign_vs_in_locations 函数专门处理为顶点着色器输入分配输入位置的任务。
紧缩输入位置,删除未使用的输入,并相应调整位置。

变量位置的分配:
st_nir_assign_varying_locations 函数负责为着色器中的输入和输出变量分配位置。
对于顶点着色器,分配输出位置,并通过 st_nir_fixup_varying_slots 修正变量槽位。
对于几何着色器、Tessellation 控制着色器和 Tessellation 评估着色器,分配输入和输出位置,并修正变量槽位。
对于片段着色器,分配输入和输出位置。

NIR 向量化和坐标系变换:
st_nir_vectorize_io 函数向量化输入输出变量,特别对 Tessellation 控制着色器的 Tessellation 等级进行向量化。
st_nir_lower_wpos_ytransform 函数处理片段着色器的窗口坐标系转换。

NIR 缓存加载和存储:
st_load_nir_from_disk_cache 函数从磁盘缓存加载 NIR,以避免重新生成。
st_store_nir_in_disk_cache 函数将 NIR 存储到磁盘缓存中,以便将来重用。

释放 NIR 变体:
st_release_variants 函数释放着色器程序的变体。
在释放之前,将 NIR 存储到磁盘缓存中。

最终化着色器程序:
st_finalize_program 函数最终化着色器程序。
包括对 NIR 进行一系列最终化操作,如变量位置分配、采样器降级、统一变量降级等。
这些功能在 st_glsl_to_nir.c 文件中共同协作,完成了 GLSL 到 NIR 的转换和最终化过程,确保生成的 NIR 表示符合 Mesa 图形驱动的要求。

这篇关于【GPU驱动开发】-Mesa ST和GLSL编译器衔接源码分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/645950

相关文章

MySQL中的LENGTH()函数用法详解与实例分析

《MySQL中的LENGTH()函数用法详解与实例分析》MySQLLENGTH()函数用于计算字符串的字节长度,区别于CHAR_LENGTH()的字符长度,适用于多字节字符集(如UTF-8)的数据验证... 目录1. LENGTH()函数的基本语法2. LENGTH()函数的返回值2.1 示例1:计算字符串

Android kotlin中 Channel 和 Flow 的区别和选择使用场景分析

《Androidkotlin中Channel和Flow的区别和选择使用场景分析》Kotlin协程中,Flow是冷数据流,按需触发,适合响应式数据处理;Channel是热数据流,持续发送,支持... 目录一、基本概念界定FlowChannel二、核心特性对比数据生产触发条件生产与消费的关系背压处理机制生命周期

Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式

《Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式》本文详细介绍如何使用Java通过JDBC连接MySQL数据库,包括下载驱动、配置Eclipse环境、检测数据库连接等关键步骤,... 目录一、下载驱动包二、放jar包三、检测数据库连接JavaJava 如何使用 JDBC 连接 mys

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

MySQL中的表连接原理分析

《MySQL中的表连接原理分析》:本文主要介绍MySQL中的表连接原理分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、环境3、表连接原理【1】驱动表和被驱动表【2】内连接【3】外连接【4编程】嵌套循环连接【5】join buffer4、总结1、背景

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到

python中Hash使用场景分析

《python中Hash使用场景分析》Python的hash()函数用于获取对象哈希值,常用于字典和集合,不可变类型可哈希,可变类型不可,常见算法包括除法、乘法、平方取中和随机数哈希,各有优缺点,需根... 目录python中的 Hash除法哈希算法乘法哈希算法平方取中法随机数哈希算法小结在Python中,

SpringBoot开发中十大常见陷阱深度解析与避坑指南

《SpringBoot开发中十大常见陷阱深度解析与避坑指南》在SpringBoot的开发过程中,即使是经验丰富的开发者也难免会遇到各种棘手的问题,本文将针对SpringBoot开发中十大常见的“坑... 目录引言一、配置总出错?是不是同时用了.properties和.yml?二、换个位置配置就失效?搞清楚加

Java Stream的distinct去重原理分析

《JavaStream的distinct去重原理分析》Javastream中的distinct方法用于去除流中的重复元素,它返回一个包含过滤后唯一元素的新流,该方法会根据元素的hashcode和eq... 目录一、distinct 的基础用法与核心特性二、distinct 的底层实现原理1. 顺序流中的去重

Python中对FFmpeg封装开发库FFmpy详解

《Python中对FFmpeg封装开发库FFmpy详解》:本文主要介绍Python中对FFmpeg封装开发库FFmpy,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录一、FFmpy简介与安装1.1 FFmpy概述1.2 安装方法二、FFmpy核心类与方法2.1 FF