有关于TableGen的简单介绍

2023-12-14 10:08
文章标签 简单 介绍 tablegen

本文主要是介绍有关于TableGen的简单介绍,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文主要参考了官方的一篇文档:https://llvm.org/docs/TableGen/,因为工作相关,需要整理学习一下llvm中TableGen的相关知识,本文不是对官方文档的直接翻译,故仅供参考。

有关于LLVM的基础知识,可以参考我之前的文章:LLVM基本概念入门
有任何建议或疑问,欢迎留言或e-mail我:ylm1205@163.com

文章目录

    • 基本介绍
    • 基本操作方法
    • td文件的格式
      • 语法
    • TableGen后端
    • TableGen 的不足之处

基本介绍

TableGen在llvm中是一个比较重要的部分,它连接着很多不同功能的模块,它的主要目的是帮助开发人员更便捷的维护领域特定信息(domain-specific information),比如说和目标机器平台相关的信息,或者和编程语言相关的信息,它可以帮助开发人员在编译器开发过程中减小冗余代码,降低维护修改难度,以及提供更好的开发框架来有利于扩充信息。

TableGen是llvm中的一个组成部分,它的功能就是读取一个文件(td文件),解析这个文件,输出成不同的结果文件(比如说C++语法的.inc后缀文件)。现在来说,其服务的功能模块主要有2个,分别是LLVM后端的平台不相关的代码生成(target independent code generator)阶段,以及Clang前端的代码诊断功能。

LLVM源码中提供了vim和emacs的一些配置文件,可以辅助更好的编辑TableGen的文件。

基本操作方法

LLVM中有一个工具,叫做llvm-tblgen,可以协助我们更容易的开展TableGen的开发工作。这个工具在正常的编译流程中是不参与的,只是额外的开发工具。它可以用来调度起整个TableGen的工作流。

以下是一些示例:

$ llvm-tblgen X86.td -print-enums -class=Register

这个命令指定llvm-tblgen处理x86处理器架构下的td文件,并打印出其中所有寄存器类中enum值的列表信息。

$ llvm-tblgen X86.td -print-enums -class=Instruction

这个命令指定llvm-tblgen处理x86处理器架构下的td文件,并打印出其中所有指令类中enum值的列表信息。

需要注意的是,虽然这里只指定了一个叫X86.td的文件,但实际上包含的可能是多个td文件,因为td文件可以include其他td文件,一般来说,<TargetName>.td文件时所有td文件的入口。

示例中的-print-enums是打印一个enum值的参数,这个参数指定的功能在TableGen中叫做一个TableGen后端(在官方文档中被直接称作backends,所以容易和编译器的后端混淆),除了这个后端之外,还有其他后端,如:-print-records是打印所有记录(也是不指定特殊后端时的默认后端)、-dump-json是打印JSON格式的所有记录、-gen-emitter是生成机器代码的输出,还有其他很多后端,就不一一列举,可以通过输入:

$ llvm-tblgen -help

来查看。

开发TableGen部分的内容时,除了修改td文件以外,还有可能修改后端,可以直接用C++在代码中修改,也可以写脚本处理JSON格式的文本。

如果不指定后端,那默认就是-print-records后端,也就是打印出所有的td文件中的记录,可以有助于我们检查td文件开发工作的完整性和正确性。

td文件的格式

第一次打开td文件时,有点懵,看不太懂,td文件的语法格式和C++的模板类比较像,同时它也做了一些扩展,比如multiclasslet等。

另外,看懂td文件还需要懂dag的描述格式、懂目标平台的指令格式、寄存器约束等、还需要懂一些指令选择的实现原理。

语法

td文件包括两个主要的关键词:classdefclass还扩展出了multiclass,对应的def也就扩展出了defm。这些条目被叫做记录(records)。

TabelGen的每一条记录都有一个唯一独立的名字,值的列表以及父类(superclass)的列表,它是支持重载的。

对于def/defm来说,它是对class/multiclass的实现,所有信息必须是确定的,语法如:

def FeatureFPARMv8 : SubtargetFeature<"fp-armv8", "HasFPARMv8", "true", "Enable ARMv8 FP">;

在这个例子中,FeatureFPARMv8是记录的名称,这条记录是SubtargetFeature类的实现,后边尖括号中的值是实例化class时的参数,参数的意义需要到其对应的class,也就是SubtargetFeature类的定义处查看。

class是td文件中抽象的记录描述,用来实现多个记录通用的部分,也可以实现一些能够析出记录信息的辅助功能,语法如:

class ProcNoItin<string Name, list<SubtargetFeature> Features>: Processor<Name, NoItineraries, Features>;

这个例子中,ProcNoItin接受一些参数,并且继承Processor,并且将部分参数传入Processor。

TableGen的multiclass能够用来简化语法,可以同时实现一组相似的抽象记录。如果一个multiclass继承了另一个multiclass,那么这两个multiclass的属性会合并,就像在一个multiclass中声明所有属性一样。

有两篇详细的参考文档:TableGen Language Introduction:更多关于使用TableGen语言的详细描述、TableGen Language Reference:一些语言规范的深入说明,可供参考。
第一篇文章可以参考我的解读和学习:P2Tree的CSDN - TableGen 语言语法介绍。

TableGen后端

TableGen后端和编译器后端不同,它是用来处理TableGen语法文件的,可以将这些领域相关信息翻译成任何需要的信息格式,我们可以编写自己的后端。使用llvm-tblgen时不指定后端时的默认后端是将所有.td文件的信息打印成文本格式输出。

当前一个主要的配合编译器的TableGen后端是将td文件解析成一些C风格的接口,后缀名是.inc,这些文件不必要修改,因为每次build时都会重新根据td文件生成,这些文件会被其他一些文件所包含(#include),进而作为支撑的领域相关信息被使用。

有一篇详细的参考文档:TableGen BackEnds,这篇文档我建议入门TableGen的使用之后再读,里边涉及到TableGen工具的工作机制,如果单纯为了使用TableGen描述后端信息,这篇文章不用深入研究。

TableGen 的不足之处

最后教程中提到了TableGen的一些不足,我就特别喜欢这种对技术的严谨(不像某些技术,单纯的夸自己多能耐),自身对自己的缺陷有清晰的认识之后,才能有更加明确的发展方向和目标,每个做技术的人都应该由这种态度。

TableGen的一个缺点是,因为领域相关信息都是比较多的,把这些信息都放到td文件中,会让整个文件显得不易维护,也会更复杂。确实,td文件可以互相包含,所以像现在的做法是把不同部分的信息分开,比如平台相关属性放到<target>.td、寄存器相关记录放到<target>RegisterInfo.td、指令相关记录放到<target>InstrInfo.td<target>InstrFormat.td中等等,然鹅,即使这样,每个文件依然很大,就拿我看的ARM平台的td文件,普遍都是大几千行上万行一个文件,而且由于class的灵活性和平台相关信息的复杂多样性,最后导致整个文件的信息理解起来很费劲(ARM的架构很复杂,初学建议去看Mips,td文件也相对简单一些)。

另外,TableGen允许我们编写自己的后端,灵活的输入配合上灵活的后端,使得TableGen变得过于自由,这会影响到TableGen的设计思想,以及让新人很难上手这块工作。

总之,这块的缺陷llvm社区依然在讨论着,也许很快就会解决。

参考网址:TableGen Deficiencies

这篇关于有关于TableGen的简单介绍的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/492108

相关文章

使用Python开发一个简单的本地图片服务器

《使用Python开发一个简单的本地图片服务器》本文介绍了如何结合wxPython构建的图形用户界面GUI和Python内建的Web服务器功能,在本地网络中搭建一个私人的,即开即用的网页相册,文中的示... 目录项目目标核心技术栈代码深度解析完整代码工作流程主要功能与优势潜在改进与思考运行结果总结你是否曾经

Mysql表的简单操作(基本技能)

《Mysql表的简单操作(基本技能)》在数据库中,表的操作主要包括表的创建、查看、修改、删除等,了解如何操作这些表是数据库管理和开发的基本技能,本文给大家介绍Mysql表的简单操作,感兴趣的朋友一起看... 目录3.1 创建表 3.2 查看表结构3.3 修改表3.4 实践案例:修改表在数据库中,表的操作主要

springboot简单集成Security配置的教程

《springboot简单集成Security配置的教程》:本文主要介绍springboot简单集成Security配置的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录集成Security安全框架引入依赖编写配置类WebSecurityConfig(自定义资源权限规则

MySQL中慢SQL优化的不同方式介绍

《MySQL中慢SQL优化的不同方式介绍》慢SQL的优化,主要从两个方面考虑,SQL语句本身的优化,以及数据库设计的优化,下面小编就来给大家介绍一下有哪些方式可以优化慢SQL吧... 目录避免不必要的列分页优化索引优化JOIN 的优化排序优化UNION 优化慢 SQL 的优化,主要从两个方面考虑,SQL 语

如何使用Python实现一个简单的window任务管理器

《如何使用Python实现一个简单的window任务管理器》这篇文章主要为大家详细介绍了如何使用Python实现一个简单的window任务管理器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起... 任务管理器效果图完整代码import tkinter as tkfrom tkinter i

C++中函数模板与类模板的简单使用及区别介绍

《C++中函数模板与类模板的简单使用及区别介绍》这篇文章介绍了C++中的模板机制,包括函数模板和类模板的概念、语法和实际应用,函数模板通过类型参数实现泛型操作,而类模板允许创建可处理多种数据类型的类,... 目录一、函数模板定义语法真实示例二、类模板三、关键区别四、注意事项 ‌在C++中,模板是实现泛型编程

Python实现html转png的完美方案介绍

《Python实现html转png的完美方案介绍》这篇文章主要为大家详细介绍了如何使用Python实现html转png功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 1.增强稳定性与错误处理建议使用三层异常捕获结构:try: with sync_playwright(

Java使用多线程处理未知任务数的方案介绍

《Java使用多线程处理未知任务数的方案介绍》这篇文章主要为大家详细介绍了Java如何使用多线程实现处理未知任务数,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 知道任务个数,你可以定义好线程数规则,生成线程数去跑代码说明:1.虚拟线程池:使用 Executors.newVir

使用EasyExcel实现简单的Excel表格解析操作

《使用EasyExcel实现简单的Excel表格解析操作》:本文主要介绍如何使用EasyExcel完成简单的表格解析操作,同时实现了大量数据情况下数据的分次批量入库,并记录每条数据入库的状态,感兴... 目录前言固定模板及表数据格式的解析实现Excel模板内容对应的实体类实现AnalysisEventLis

JAVA SE包装类和泛型详细介绍及说明方法

《JAVASE包装类和泛型详细介绍及说明方法》:本文主要介绍JAVASE包装类和泛型的相关资料,包括基本数据类型与包装类的对应关系,以及装箱和拆箱的概念,并重点讲解了自动装箱和自动拆箱的机制,文... 目录1. 包装类1.1 基本数据类型和对应的包装类1.2 装箱和拆箱1.3 自动装箱和自动拆箱2. 泛型2