Linux Thermal 框架解析

2023-10-10 15:59
文章标签 linux 框架 解析 thermal

本文主要是介绍Linux Thermal 框架解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Linux Thermal 是 Linux 系统下温度控制相关的模块,主要用来控制系统运行过程中芯片产生的热量,
使芯片温度和设备外壳温度维持在一个安全、舒适的范围。那下面我们就来一起看看对于温度控制这样一个需求,Linux 内核是怎么实现的。

Thermal 的主要框架

要实现一个温度控制的需求,试想一下我们是不是最少要有获取温度的设备和控制温度的
设备这两个最基本的东西?当然附带的也会产生一些使用温度控制设备的策略。
那上面这些东西在 Linux Thermal 框架中怎么体现呢?通过阅读源码我们发现代码中对
上面的东西进行了一些抽象。
获取温度的设备:在 Thermal 框架中被抽象为 Thermal Zone Device;
控制温度的设备:在 Thermal 框架中被抽象为 Thermal Cooling Device;
控制温度策略:在 Thermal 框架中被抽象为 Thermal Governor

 Thermal Zone Device

上面说到 Thermal Zone Device 是获取温度设备的抽象,怎么抽象的?终究我们还是要 RTFSC。
RTFSC(Read The Fucking Source Code)即阅读源代码!!
struct thermal_zone_device {int id;char type[THERMAL_NAME_LENGTH];struct device device;struct thermal_attr *trip_temp_attrs;struct thermal_attr *trip_type_attrs;struct thermal_attr *trip_hyst_attrs;void *devdata;int trips;/* 轮询时间 */int passive_delay;int polling_delay;int temperature;int last_temperature;int emul_temperature;int passive;unsigned int forced_passive;/* 设备的操作函数 */struct thermal_zone_device_ops *ops;const struct thermal_zone_params *tzp;struct thermal_governor *governor;struct list_head thermal_instances;struct idr idr;struct mutex lock;struct list_head node;/* 用来循环处理的 delayed_work */struct delayed_work poll_queue;
};struct thermal_zone_device_ops {/* 绑定函数 */int (*bind) (struct thermal_zone_device *,struct thermal_cooling_device *);int (*unbind) (struct thermal_zone_device *,struct thermal_cooling_device *);/* 获取温度函数 */int (*get_temp) (struct thermal_zone_device *, unsigned long *);int (*get_mode) (struct thermal_zone_device *,enum thermal_device_mode *);int (*set_mode) (struct thermal_zone_device *,enum thermal_device_mode);int (*get_trip_type) (struct thermal_zone_device *, int,enum thermal_trip_type *);/* 获取触发点温度 */int (*get_trip_temp) (struct thermal_zone_device *, int,unsigned long *);int (*set_trip_temp) (struct thermal_zone_device *, int,unsigned long);int (*get_trip_hyst) (struct thermal_zone_device *, int,unsigned long *);int (*set_trip_hyst) (struct thermal_zone_device *, int,unsigned long);int (*get_crit_temp) (struct thermal_zone_device *, unsigned long *);int (*set_emul_temp) (struct thermal_zone_device *, unsigned long);int (*get_trend) (struct thermal_zone_device *, int,enum thermal_trend *);int (*notify) (struct thermal_zone_device *, int,enum thermal_trip_type);
};
通过代码我们可以看到,一个能提供温度的设备操作函数主要有 : 绑定函数、获取温度函数、获取触发点温度函数。绑定函数 : Thermal core 用来绑定用的 , 这个后面会讲 ;获取温度函数 : 获取设备温度用的,这个也好理解 , 一般 SOC 内部会有温度传感器提供温度,
有些热敏电阻通过 ADC 也算出温度,这个函数就是取这些温度值 ;获取触发点温度函数 : 这个是什么用来做什么呢 ? 这个其实是 thermal 框架里面一个关键点,因为要控制温度,
那么什么时候控制就需要有东西来描述,描述什么时候控制的东西就是触发点,每个 thermal zone device 会定义很多触发点,
那么每个触发点的温度就是通过该函数获得;

Thermal Cooling Devices

Thermal Cooling Device 是可以降温设备的抽象,能降温的设备比如风扇,
这些好理解,但是想 CPU,GPU 这些 Cooling devices 怎么理解呢?其实降温可以从两方面来理解,一个是加快散热,另外一个就是降低产热量。
风扇,散热片这些是用来加快散热,CPU,GPU 这些 Cooling devices 是通过降低产热来降温。那代码是怎么将这两个方式统一起来呢?

 

struct thermal_cooling_device {int id;char type[THERMAL_NAME_LENGTH];struct device device;struct device_node *np;void *devdata;/* cooling device 操作函数 */const struct thermal_cooling_device_ops *ops;bool updated; /* true if the cooling device does not need update */struct mutex lock; /* protect thermal_instances list */struct list_head thermal_instances;struct list_head node;
};struct thermal_cooling_device_ops {int (*get_max_state) (struct thermal_cooling_device *, unsigned long *);int (*get_cur_state) (struct thermal_cooling_device *, unsigned long *);/* 设定等级 */int (*set_cur_state) (struct thermal_cooling_device *, unsigned long);
};
Thermal Cooling device 抽象的方式是,认为所有的能降温的设备有很多可以单独控制的状态。
例如,风扇有不同的风速状态,CPU/GPU Cooling device 有不同最大运行频率状态,这样当温度高了之后通过调整这些状态来
降低温度;

Thermal Governor

Thermal Governor 是降温策略的一个抽象 , 主要是根据温度来选择 thermal cooling devices 
等级的方法,举个简单的例子,当前的温度升高速很快,选择风扇3档风,温度升高不快,选择1档风。
这就是一个 Governor。
/*** struct thermal_governor - structure that holds thermal governor information* @name:       name of the governor* @throttle:   callback called for every trip point even if temperature is*              below the trip point temperature* @governor_list:      node in thermal_governor_list (in thermal_core.c)*/
struct thermal_governor {char name[THERMAL_NAME_LENGTH];/* 策略函数 */int (*throttle)(struct thermal_zone_device *tz, int trip);struct list_head        governor_list;
};
很简单,所有的策略都通过 throttle 这个函数实现,内核已经实现了一些策略,
step_wise, user_space, power_allocator, bang_bang 等具体实现算法细节就不展开;

Thermal Core

有了获取温度的设备,有了温控控制的设备,有了控制方法,Thermal Core 就负责把这些整合在一起。
下面看一下整合的简单流程。1.注册函数 ,thermal Core 通过对外提供注册的接口,让 thermal zone device、
thermal cooling device、thermal governor 注册进来。
struct thermal_zone_device *thermal_zone_device_register(const char *, int, int,void *, struct thermal_zone_device_ops *,const struct thermal_zone_params *, int, int);struct thermal_cooling_device *thermal_cooling_device_register(char *, void *,const struct thermal_cooling_device_ops *);int thermal_register_governor(struct thermal_governor *);
2.Thermal zone/cooling device 注册的过程中 thermal core 会调用绑定函数,
绑定的过程最主要是一个 cooling device 绑定到一个 thremal_zone 的触发点上
int thermal_zone_bind_cooling_device(struct thermal_zone_device *tz)
{struct thermal_instance *dev;struct thermal_instance *pos;struct thermal_zone_device *pos1;struct thermal_cooling_device *pos2;unsigned long max_state;int result;.../* thermal_instace 就是绑定之后的实例 */dev =kzalloc(sizeof(struct thermal_instance), GFP_KERNEL);if (!dev)return -ENOMEM;dev->tz = tz;dev->cdev = cdev;dev->trip = trip;dev->upper = upper;...sysfs_create_link(&tz->device.kobj, &cdev->device.kobj, dev->name);if (result)goto release_idr;sprintf(dev->attr_name, "cdev%d_trip_point", dev->id);sysfs_attr_init(&dev->attr.attr);...list_for_each_entry(pos, &tz->thermal_instances, tz_node)if (pos->tz == tz && pos->trip == trip && pos->cdev == cdev) {result = -EEXIST;break;}if (!result) {/* 绑定完了就添加到链表中 */list_add_tail(&dev->tz_node, &tz->thermal_instances);list_add_tail(&dev->cdev_node, &cdev->thermal_instances);}...return result;
}
3.Thermal core 使能 delayed_work 循环处理 , 使整个 thermal 控制流程运转起来。
static void thermal_zone_device_check(struct work_struct *wrok)
{struct thermal_zone_device *tz = container_of(work, structthermal_zone_device,poll_queue.work);/* 处理函数 */thermal_zone_device_update(tz);
}void thermal_zone_device_update(struct thermal_zone_device *tz)
{int count;if (!tz->ops->get_temp)return;/* 更新温度 */update_temperature(tz);-for (count = 0; count < tz->trips; count++)/* 处理触发点,这里面就会调到具体的 governor */handle_thermal_trip(tz, count);
}static void thermal_zone_device_set_polling(struct thermal_zone_device *tz, int delay)
{if (delay > 1000)/* 更改 delayed_work 下次唤醒时间完成轮询 */mod_delayed_work(system_freezable_wq, &tz->poll_queue,round_jiffies(msecs_to_jiffies(delay)));else if (delay)mod_delayed_work(system_freezable_wq, &tz->poll_queue,msecs_to_jiffies(delay));elsecancel_delayed_work(&tz->poll_queue);
}

当温度升高超过温度触发点的话,就会使能对应的 cooling device 进行降温处理,
至此 Linux Thermal 相关的一些基本框架就介绍完了。

 

这篇关于Linux Thermal 框架解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/181515

相关文章

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

防止Linux rm命令误操作的多场景防护方案与实践

《防止Linuxrm命令误操作的多场景防护方案与实践》在Linux系统中,rm命令是删除文件和目录的高效工具,但一旦误操作,如执行rm-rf/或rm-rf/*,极易导致系统数据灾难,本文针对不同场景... 目录引言理解 rm 命令及误操作风险rm 命令基础常见误操作案例防护方案使用 rm编程 别名及安全删除

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定

使用docker搭建嵌入式Linux开发环境

《使用docker搭建嵌入式Linux开发环境》本文主要介绍了使用docker搭建嵌入式Linux开发环境,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录1、前言2、安装docker3、编写容器管理脚本4、创建容器1、前言在日常开发全志、rk等不同

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

GSON框架下将百度天气JSON数据转JavaBean

《GSON框架下将百度天气JSON数据转JavaBean》这篇文章主要为大家详细介绍了如何在GSON框架下实现将百度天气JSON数据转JavaBean,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录前言一、百度天气jsON1、请求参数2、返回参数3、属性映射二、GSON属性映射实战1、类对象映

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶