无人驾驶控制算法LQR和MPC的仿真实现

2024-02-17 10:52

本文主要是介绍无人驾驶控制算法LQR和MPC的仿真实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. LQR控制器

1.1 问题陈述

考虑一个质量为 m m m 的滑块在光滑的一维地面上运动。初始时,滑块的位置和速度均为 0 0 0。我们的目标是设计一个控制器,基于传感器测得的滑块位置 x x x,为滑块提供外力 u u u,使其能够跟随参考点 x r x_r xr 运动。

在这里插入图片描述

为建立动力学模型,我们采用以下微分方程:

x ¨ = u m \ddot x = \frac{u}{m} x¨=mu

定义状态向量 x = [ x 1 x 2 ] = [ x x ˙ ] x= \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} =\begin{bmatrix} x \\\dot x \end{bmatrix} x=[x1x2]=[xx˙],其中 x 1 x_1 x1 表示位移, x 2 x_2 x2 表示速度。系统的状态方程为:

x ˙ = A x + B u \dot x= Ax+Bu x˙=Ax+Bu

其中:

A = [ 0 1 0 0 ] , B = [ 0 1 m ] A=\begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix}, \quad B=\begin{bmatrix} 0 \\ \frac{1}{m} \end{bmatrix} A=[0010],B=[0m1]

系统的开环矩阵 A A A 决定了系统是否稳定。若没有控制器,物块在光滑地面上将无法自行停止。

1.2 控制器设计

引入控制器,我们考虑以下形式:

u = − k x = − [ k 1 , k 2 , ⋯ ] [ x 1 x 2 ⋮ ] u=-kx=-\begin{bmatrix} k_1,k_2,\cdots \end{bmatrix}\begin{bmatrix} x_1 \\ x_2 \\ \vdots \end{bmatrix} u=kx=[k1,k2,] x1x2

从而得到新的闭环矩阵:

x ˙ = ( A − B k ) x = A c l x \dot x = (A-Bk)x = A_{cl}x x˙=(ABk)x=Aclx

通过选择 k k k,我们可以改变 A c l A_{cl} Acl 的特征值,从而控制系统的行为。因此,关键问题是如何选择最优的 k k k

1.3 LQR控制器

引入线性二次调节器(LQR)的思想,我们定义代价函数:

J = ∫ 0 ∞ ( x T Q x + u T R u ) d t J= \int_0^\infty{(x^TQx+u^TRu)}dt J=0(xTQx+uTRu)dt

其中 Q Q Q R R R 是权重矩阵。通过调整权重,LQR 在保持系统稳定性的同时,寻找使代价函数最小化的控制策略。

在这里插入图片描述

1.4 仿真建模

进行简单的仿真建模,通过设定初始值和目标值,LQR 控制系统能够有效地使小物块按照预设轨迹运动。

在这里插入图片描述
我们将初始值设在5,目标值设在1,最后得到
在这里插入图片描述

2. MPC控制器

2.1 模型的离散化

考虑同样的控制对象 x ˙ = A x + B u \dot x= Ax+Bu x˙=Ax+Bu,使用前向欧拉法将状态方程离散化:

x ( k + 1 ) = A ˉ x ( k ) + B ˉ u ( k ) x(k+1) =\bar Ax(k) + \bar B u(k) x(k+1)=Aˉx(k)+Bˉu(k)

其中

A ˉ = [ 1 T 0 1 ] , B ˉ = [ 0 T m ] \bar A=\begin{bmatrix} 1 & T \\ 0 & 1 \end{bmatrix},\quad \bar B=\begin{bmatrix} 0 \\ \frac{T}{m} \end{bmatrix} Aˉ=[10T1],Bˉ=[0mT]

这里的 T T T 是控制周期。

2.2 预测

MPC 的特点之一是需要对未来系统状态进行预测。在 k k k 时刻,我们预测未来 p p p 个控制周期内的系统状态,并定义预测时域内的控制量:

X k = [ x ( k + 1 ∣ k ) T x ( k + 2 ∣ k ) T ⋯ x ( k + p ∣ k ) T ] T X_k= \begin{bmatrix} x(k+1|k)^T & x(k+2|k)^T &\cdots& x(k+p|k)^T \end{bmatrix}^T Xk=[x(k+1∣k)Tx(k+2∣k)Tx(k+pk)T]T

2.3 优化

我们希望找到最佳的控制量 U k U_k Uk,使预测时域内的状态向量与参考值越接近越好。这导致一个开环最优控制问题,其数学描述为:

min ⁡ J ( U k ) = U k T ( Θ T Q Θ + W ) U k + 2 ( E T Q Θ ) U k + E T Q E \min J(U_k) = U_k^T (\Theta^T Q \Theta + W) U_k +2(E^TQ\Theta) U_k +E^TQE minJ(Uk)=UkT(ΘTQΘ+W)Uk+2(ETQΘ)Uk+ETQE

其中, Θ \Theta Θ E E E 分别为预测模型和误差。

在这里插入图片描述

2.4 仿真

对动力学方程进行拉普拉斯变换,得到传递函数 G ( s ) = 1 m s 2 G(s)=\frac{1}{ms^2} G(s)=ms21。通过仿真,可以验证 MPC 控制系统在固定值和正弦波输入情况下能够有效跟踪目标。

s 2 X ( s ) = 1 m F ( s ) s^2X(s)=\frac{1}{m}F(s) s2X(s)=m1F(s)
得到传递函数为:
G ( s ) = X ( s ) F ( s ) = 1 m s 2 G(s)=\frac{X(s)}{F(s)}=\frac{1}{ms^2} G(s)=F(s)X(s)=ms21
建立仿真:

在这里插入图片描述

我们得到在固定值和sinwave的情况下基本都可以跟踪的比较好(参数还可继续优化)

在这里插入图片描述

在这里插入图片描述

其中MPC代码为:

function u = Controller(pos_ref, pos, vel)
%参数设置
m    = 1.05;                %滑块质量,增加了5%作为建模误差
T    = 0.01;                %控制周期10ms
p    = 40;                  %控制时域(预测时域)
Q    = 10*eye(2*p);         %累计误差权重
W    = 0.0001*eye(p);       %控制输出权重
umax = 100;                 %控制量限制,即最大的力
Rk   = zeros(2*p,1);        %参考值序列
Rk(1:2:end) = pos_ref;    
Rk(2:2:end) = vel;          %参考速度跟随实际速度
%构建中间变量
xk    = [pos;vel];          %xk
A_    = [1 T;0 1];          %离散化预测模型参数A
B_    = [0;T/m];            %离散化预测模型参数B
psi   = zeros(2*p,2);       %psi
for i=1:1:ppsi(i*2-1:i*2,1:2)=A_^i;
end
theta = zeros(2*p,p);       %theta
for i=1:1:pfor j=1:1:itheta(i*2-1:i*2,j)=A_^(i-j)*B_;end
end
E = psi*xk-Rk;              %E
H = 2*(theta'*Q*theta+W);   %H
f = (2*E'*Q*theta)';        %f
%优化求解
coder.extrinsic('quadprog');
Uk=quadprog(H,f,[],[],[],[],-umax,umax);
%返回控制量序列第一个值
u = 0.0;                    %显示指定u的类型
u = Uk(1);

以上是一个简单的物理系统的 LQR 和 MPC 控制系统的设计和仿真。

这篇关于无人驾驶控制算法LQR和MPC的仿真实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/717554

相关文章

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

Kubernetes PodSecurityPolicy:PSP能实现的5种主要安全策略

Kubernetes PodSecurityPolicy:PSP能实现的5种主要安全策略 1. 特权模式限制2. 宿主机资源隔离3. 用户和组管理4. 权限提升控制5. SELinux配置 💖The Begin💖点点关注,收藏不迷路💖 Kubernetes的PodSecurityPolicy(PSP)是一个关键的安全特性,它在Pod创建之前实施安全策略,确保P

工厂ERP管理系统实现源码(JAVA)

工厂进销存管理系统是一个集采购管理、仓库管理、生产管理和销售管理于一体的综合解决方案。该系统旨在帮助企业优化流程、提高效率、降低成本,并实时掌握各环节的运营状况。 在采购管理方面,系统能够处理采购订单、供应商管理和采购入库等流程,确保采购过程的透明和高效。仓库管理方面,实现库存的精准管理,包括入库、出库、盘点等操作,确保库存数据的准确性和实时性。 生产管理模块则涵盖了生产计划制定、物料需求计划、

基于UE5和ROS2的激光雷达+深度RGBD相机小车的仿真指南(五):Blender锥桶建模

前言 本系列教程旨在使用UE5配置一个具备激光雷达+深度摄像机的仿真小车,并使用通过跨平台的方式进行ROS2和UE5仿真的通讯,达到小车自主导航的目的。本教程默认有ROS2导航及其gazebo仿真相关方面基础,Nav2相关的学习教程可以参考本人的其他博客Nav2代价地图实现和原理–Nav2源码解读之CostMap2D(上)-CSDN博客往期教程: 第一期:基于UE5和ROS2的激光雷达+深度RG

C++——stack、queue的实现及deque的介绍

目录 1.stack与queue的实现 1.1stack的实现  1.2 queue的实现 2.重温vector、list、stack、queue的介绍 2.1 STL标准库中stack和queue的底层结构  3.deque的简单介绍 3.1为什么选择deque作为stack和queue的底层默认容器  3.2 STL中对stack与queue的模拟实现 ①stack模拟实现