【GPU驱动开发】-Mesa ST和GLSL编译器衔接源码分析

2024-01-26 06:44

本文主要是介绍【GPU驱动开发】-Mesa ST和GLSL编译器衔接源码分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

不必害怕未知,无需恐惧犯错,做一个Creator!

(基于Mesa 22.2.5版本)

st_glsl_to_nir.c 主要实现了 GLSL 到 NIR 的转换功能,包括 GLSL 程序的链接、NIR 的最终化、优化以及统一变量的处理。以下是该文件主要实现的功能以及功能之间的实现流程:

链接 GLSL 到 NIR:
st_link_shader 函数是 GLSL 程序链接到 NIR 的入口函数。
根据着色器类型(GLSL 或 SPIR-V)调用相应的链接函数,如 gl_nir_link_glsl 或 gl_nir_link_spirv。
在链接过程中,执行了一系列的操作,包括清除着色器程序数据、创建着色器程序数据、判断着色器类型、链接着色器等。

GLSL 到 NIR 转换后的处理:
st_glsl_to_nir_post_opts 函数执行 GLSL 到 NIR 转换的链接后任务。
为使用的内建统一变量添加状态引用。

NIR 最终化和优化:
st_finalize_nir_before_variants 函数在生成变体之前最终化 NIR。
执行一系列 NIR 优化和变换,如分裂变量拷贝、降级纹理采样器、降级原子操作等。
设置受影响的状态标志(affected state flags)。

NIR 统一变量处理:
st_nir_lower_uniforms 函数用于降级 NIR 中的统一变量,根据配置使用压缩或非压缩方式。
如果启用了 lower_uniforms_to_ubo,还会将一些统一变量降级为 UBO。
最终将状态参数优化为 UBO。

统一变量的位置分配:
st_nir_lookup_parameter_index 函数根据变量在程序参数列表中的位置查找参数的索引。
st_nir_assign_uniform_locations 函数为 NIR 着色器中的统一变量分配驱动程序位置。
处理不同情况,包括无绑定和状态槽。

顶点着色器输入位置分配:
st_nir_assign_vs_in_locations 函数专门处理为顶点着色器输入分配输入位置的任务。
紧缩输入位置,删除未使用的输入,并相应调整位置。

变量位置的分配:
st_nir_assign_varying_locations 函数负责为着色器中的输入和输出变量分配位置。
对于顶点着色器,分配输出位置,并通过 st_nir_fixup_varying_slots 修正变量槽位。
对于几何着色器、Tessellation 控制着色器和 Tessellation 评估着色器,分配输入和输出位置,并修正变量槽位。
对于片段着色器,分配输入和输出位置。

NIR 向量化和坐标系变换:
st_nir_vectorize_io 函数向量化输入输出变量,特别对 Tessellation 控制着色器的 Tessellation 等级进行向量化。
st_nir_lower_wpos_ytransform 函数处理片段着色器的窗口坐标系转换。

NIR 缓存加载和存储:
st_load_nir_from_disk_cache 函数从磁盘缓存加载 NIR,以避免重新生成。
st_store_nir_in_disk_cache 函数将 NIR 存储到磁盘缓存中,以便将来重用。

释放 NIR 变体:
st_release_variants 函数释放着色器程序的变体。
在释放之前,将 NIR 存储到磁盘缓存中。

最终化着色器程序:
st_finalize_program 函数最终化着色器程序。
包括对 NIR 进行一系列最终化操作,如变量位置分配、采样器降级、统一变量降级等。
这些功能在 st_glsl_to_nir.c 文件中共同协作,完成了 GLSL 到 NIR 的转换和最终化过程,确保生成的 NIR 表示符合 Mesa 图形驱动的要求。

这篇关于【GPU驱动开发】-Mesa ST和GLSL编译器衔接源码分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/645950

相关文章

Go使用pprof进行CPU,内存和阻塞情况分析

《Go使用pprof进行CPU,内存和阻塞情况分析》Go语言提供了强大的pprof工具,用于分析CPU、内存、Goroutine阻塞等性能问题,帮助开发者优化程序,提高运行效率,下面我们就来深入了解下... 目录1. pprof 介绍2. 快速上手:启用 pprof3. CPU Profiling:分析 C

MySQL表锁、页面锁和行锁的作用及其优缺点对比分析

《MySQL表锁、页面锁和行锁的作用及其优缺点对比分析》MySQL中的表锁、页面锁和行锁各有特点,适用于不同的场景,表锁锁定整个表,适用于批量操作和MyISAM存储引擎,页面锁锁定数据页,适用于旧版本... 目录1. 表锁(Table Lock)2. 页面锁(Page Lock)3. 行锁(Row Lock

Android开发中gradle下载缓慢的问题级解决方法

《Android开发中gradle下载缓慢的问题级解决方法》本文介绍了解决Android开发中Gradle下载缓慢问题的几种方法,本文给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、网络环境优化二、Gradle版本与配置优化三、其他优化措施针对android开发中Gradle下载缓慢的问

使用Go语言开发一个命令行文件管理工具

《使用Go语言开发一个命令行文件管理工具》这篇文章主要为大家详细介绍了如何使用Go语言开发一款命令行文件管理工具,支持批量重命名,删除,创建,移动文件,需要的小伙伴可以了解下... 目录一、工具功能一览二、核心代码解析1. 主程序结构2. 批量重命名3. 批量删除4. 创建文件/目录5. 批量移动三、如何安

Android 悬浮窗开发示例((动态权限请求 | 前台服务和通知 | 悬浮窗创建 )

《Android悬浮窗开发示例((动态权限请求|前台服务和通知|悬浮窗创建)》本文介绍了Android悬浮窗的实现效果,包括动态权限请求、前台服务和通知的使用,悬浮窗权限需要动态申请并引导... 目录一、悬浮窗 动态权限请求1、动态请求权限2、悬浮窗权限说明3、检查动态权限4、申请动态权限5、权限设置完毕后

Springboot中分析SQL性能的两种方式详解

《Springboot中分析SQL性能的两种方式详解》文章介绍了SQL性能分析的两种方式:MyBatis-Plus性能分析插件和p6spy框架,MyBatis-Plus插件配置简单,适用于开发和测试环... 目录SQL性能分析的两种方式:功能介绍实现方式:实现步骤:SQL性能分析的两种方式:功能介绍记录

最长公共子序列问题的深度分析与Java实现方式

《最长公共子序列问题的深度分析与Java实现方式》本文详细介绍了最长公共子序列(LCS)问题,包括其概念、暴力解法、动态规划解法,并提供了Java代码实现,暴力解法虽然简单,但在大数据处理中效率较低,... 目录最长公共子序列问题概述问题理解与示例分析暴力解法思路与示例代码动态规划解法DP 表的构建与意义动

基于Python开发PPTX压缩工具

《基于Python开发PPTX压缩工具》在日常办公中,PPT文件往往因为图片过大而导致文件体积过大,不便于传输和存储,所以本文将使用Python开发一个PPTX压缩工具,需要的可以了解下... 目录引言全部代码环境准备代码结构代码实现运行结果引言在日常办公中,PPT文件往往因为图片过大而导致文件体积过大,

C#使用DeepSeek API实现自然语言处理,文本分类和情感分析

《C#使用DeepSeekAPI实现自然语言处理,文本分类和情感分析》在C#中使用DeepSeekAPI可以实现多种功能,例如自然语言处理、文本分类、情感分析等,本文主要为大家介绍了具体实现步骤,... 目录准备工作文本生成文本分类问答系统代码生成翻译功能文本摘要文本校对图像描述生成总结在C#中使用Deep

Linux编译器--gcc/g++使用方式

《Linux编译器--gcc/g++使用方式》文章主要介绍了C/C++程序的编译过程,包括预编译、编译、汇编和链接四个阶段,并详细解释了每个阶段的作用和具体操作,同时,还介绍了调试和发布版本的概念... 目录一、预编译指令1.1预处理功能1.2指令1.3问题扩展二、编译(生成汇编)三、汇编(生成二进制机器语