Nginx 精解:正则表达式、location 匹配与 rewrite 重写

2024-06-10 23:36

本文主要是介绍Nginx 精解:正则表达式、location 匹配与 rewrite 重写,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、常见的 Nginx 正则表达式

在 Nginx 配置中,正则表达式用于匹配和重写 URL 请求。以下是一些常见的 Nginx 正则表达式示例:

当涉及正则表达式时,理解各个特殊字符的含义是非常重要的。以下是每个特殊字符的例子:

  1. ^:匹配输入字符串的起始位置

    • 示例:^hello 匹配以 "hello" 开头的字符串,
    • 示例:^/(user|profile): 匹配以 "/user" 或 "/profile" 开头的 URI。
  2. $:匹配输入字符串的结束位置

    • 示例:world$ 匹配以 "world" 结尾的字符串
  3. *:匹配前面的字符零次或多次

    • 示例:colou*r 匹配 "color" 或 "colour"
  4. +:匹配前面的字符一次或多次

    • 示例:go+l 匹配 "gol", "gool", "gooool", 等等
  5. ?:匹配前面的字符零次或一次

    • 示例:apple(s)? 匹配 "apple" 或 "apples"
  6. .:匹配除 "\n" 之外的任何单个字符

    • 示例:b.t 匹配 "bat", "but", "b@t", 等等
  7. \:将后面接着的字符标记为一个特殊字符

    • 示例:\.jpg$: 匹配以 ".jpg" 结尾的 URI。
    • 示例:\d+ 匹配一个或多个数字
  8. {n}:重复 n 次

    • 示例:a{3} 匹配 "aaa"
  9. {n,}:重复 n 次或更多次

    • 示例:b{2,} 匹配 "bb", "bbb", "bbbb", 等等
  10. {n,m}:重复 n 到 m 次

    • 示例:c{2,4} 匹配 "cc", "ccc", "cccc"
  11. []:定义匹配的字符范围

    • 示例:[aeiou] 匹配任何一个元音字母
    • 示例:[0-9] 匹配任何一个数字
  12. [c]:匹配单个字符 c

    • 示例:[abc] 匹配 "a", "b", 或 "c"
  13. [a-z]:匹配 a-z 小写字母的任意一个

    • 示例:[a-z] 匹配任何一个小写字母
  14. [a-zA-Z0-9]:匹配所有大小写字母或数字

    • 示例:[a-zA-Z0-9] 匹配任何一个大小写字母或数字
  15. ():表达式的开始和结束位置

    • 示例:(abc) 匹配 "abc"
  16. |:或运算符

    • 示例:cat|dog 匹配 "cat" 或 "dog"

这些正则表达式可用于识别特定的 URL 模式,并据此进行重定向或其他操作。

二、Nginx Location基本操作

2.1 Location 大致可以分为三类

在 Nginx 配置中,location 主要分为三类:精确匹配、前缀匹配和正则表达式匹配。

  • 精确匹配:指定完整的 URI 进行匹配。location = / {...}
  • 前缀匹配:指定 URI 的前缀进行匹配。location / {...}
  • 正则表达式匹配:使用正则表达式进行匹配。正则匹配:location ~ / {...}

示例:

location = /about {# 精确匹配
}location /blog/ {# 前缀匹配
}location ~* \.(gif|jpg|jpeg)$ {# 正则表达式匹配
}


 

这些不同的匹配规则使得我们能够根据不同的需求来灵活地配置服务器。

2.2 Location 常用的匹配规则

在 location 中,有一些常用的匹配规则,例如:

  • =: 精确匹配。也就是完全匹配
  • ^~: 前缀匹配,如果匹配成功,停止搜索其他 location。
  • ~ 和 ~*: 区分大小写和不区分大小写的正则表达式匹配。
  • !~ :区分大小写的匹配取非。!~* :不区分大小写的匹配取非。

这些匹配规则决定了如何匹配 URI,并且影响着 location 的优先级。

2.3 Location 优先级

在 Nginx 中,location 的优先级遵循“先精确匹配,再前缀匹配,最后正则表达式匹配”的原则。这意味着精确匹配的 location 会优先匹配,其次是前缀匹配,最后是正则表达式匹配。


 

2.4 Location 示例说明

假设我们有以下几个 location 规则:

location = /about { # 精确匹配 }location /blog/ { # 前缀匹配 }location ~* \.(gif|jpg|jpeg)$ { # 正则表达式匹配 }

当请求 URI 为 "/about" 时,将匹配第一个规则,因为它是精确匹配。请求 URI 为 "/blog/some-article" 时,将匹配第二个规则,因为它是前缀匹配。而请求 URI 为 "/image.jpg" 时,将匹配第三个规则,因为它是正则表达式匹配。

location = / {# 这里匹配根目录的请求,不包括任何额外的路径# =为精确匹配 / ,主机名后面不能带任何字符串,比如访问 / 和 /data,则 / 匹配,/data 不匹配再比如 location = /abc,则只匹配/abc ,/abc/或 /abcd不匹配
}location /user/ {# 匹配以 /user/ 开头的所有请求,比如 /user/profile、/user/settings 等# 匹配任何以 /user/ 开头的地址,匹配符合以后,还要继续往下搜索其它 location
只有其它 location后面的正则表达式没有匹配到时,才会采用这一条
}location ~* \.(css|js)$ {# 匹配所有以 .css 或 .js 结尾的请求,不区分大小写
}location ^~ /admin {# 匹配以 /admin 开头的请求,并且停止匹配其它正则规则
}location ~ ^/article/(\d+) {# 匹配类似 /article/123、/article/456 这样的数字结尾的请求
}
2.5 Location 匹配顺序

在 Nginx 中,location 的匹配顺序非常重要。通常情况下,应该按照从精确匹配到前缀匹配再到正则表达式匹配的顺序进行配置,以确保匹配的准确性。

2.6  三个匹配规则定义
2.6.1 直接匹配网站根

第一个必选规则直接匹配网站根,通过域名访问网站首页比较频繁,使用这个会加速处理,比如说官网,可以是一个静态首页,也可以直接转发给后端应用服务器

对于直接匹配网站根的需求,可以使用如下配置:

location = / { # 处理根目录请求 root   html;index  index.html index.htm;
}
2.6.2 处理静态文件请求

第二个必选规则是处理静态文件请求,这是nginx作为http服务器的强项有两种配置模式,目录匹配或后缀匹配,任选其一或搭配使用

静态文件通常位于特定的目录中,可以使用前缀匹配来处理静态文件请求:

目录匹配:
location /static/ { # 处理静态文件请求 root /usr/share/nginx/html/;index  index.html index.htm;try_files $uri $uri/ /dp/index.html = systemUpdate;
}
后缀匹配:
location ~* \.(xlsx|jpg)$ { # 处理特定类型的请求 root /usr/share/nginx/html/file;
}
2.6.3 通用规则

第三个规则就是通用规则,比如用来转发带.php、.jsp后缀的动态请求到后端应用服务器
非静态文件请求就默认是动态请求

location / {proxy_pass http://127.0.0.1:8080;
}

通过以上配置示例,我们可以更好地理解 Nginx 中 location 的匹配规则和优先级。

三、Nginx Rewrite基本操作

rewrite 功能是利用 Nginx 提供的全局变量或自定义变量,结合正则表达式和标志位来实现 URL 的重写和重定向。它通常用于处理域名更换后的跳转、页面地址变更的重定向、网站防盗链等需求。

rewrite 指令可以放置在 server、location 和 if 块中,它默认只对域名后面除了传递的参数之外的字符串进行匹配重写。比如,对于 URL http://www.baidu.com/abc/bbs/index.php?a=1&b=2,rewrite 只会对 /abc/bbs/index.php 部分进行重写。

下面是 rewrite 的语法格式:

rewrite <regex> <replacement> [flag];

其中:

  • regex 表示正则表达式匹配规则。
  • replacement 表示重定向后的内容。
  • flag 表示 rewrite 支持的标志位。
3.1 rewrite 跳转实现

使用 rewrite 可以对 URL 进行重定向或重写,常用于实现网站 URL 的美化、重定向等功能。

Nginx 通过 ngx_http_rewrite_module 模块支持 URL 重写,它也支持 if 条件判断,但不支持 else。在进行跳转时,从一个 location 跳转到另一个 location,但最多只能执行 10 次跳转,否则 Nginx 将返回 500 错误。使用 PCRE 语法规则进行匹配,并通过重写模块的 set 指令创建新的变量并设置其值。

3.2 rewrite 执行顺序

rewrite 指令按照配置文件中的先后顺序执行,匹配成功后会立即执行相应的重定向或重写操作。

  1. 执行 server 块内的 rewrite 指令。
  2. 进行 location 匹配。
  3. 在选定的 location 中执行 rewrite 指令。
3.3 flag 标记说明
  • last:本条规则匹配完成后,继续向下匹配新的 location URL 规则,一般用于 server 和 if 块中。
  • break:本条规则匹配完成后立即终止,不再匹配后续的任何规则,一般用于 location 块中。
  • redirect:返回 302 临时重定向,浏览器地址栏会显示跳转后的 URL 地址。
  • permanent:返回 301 永久重定向,浏览器地址栏会显示跳转后的 URL 地址。

四、rewrite 和 location 区别

rewrite 和 location 在功能上有些相似,都能实现跳转,但主要区别在于:

  • rewrite 用于在同一域名内更改获取资源的路径。
  • location 用于对一类路径进行访问控制或反向代理,也可以用proxy_pass将请求代理到其他机器。

五、Nginx Rewrite 示例

5.1 基于域名的跳转

现在公司旧域名www.tong.com有业务需求变更,需要使用新域名www.ctt.com代替,但是旧域名不能废除,需要跳转到新域名上,而且后面的参数保持不变。

vim /usr/local/nginx/conf/nginx.conf #编辑nginx配置文件
server {listen       80;server_name  www.tong.com;  #域名修改  charset utf-8;access_log  /var/log/nginx/access.log;  #日志修改location / {#添加域名重定向if ($host = 'www.tong.com'){       #$host为rewrite全局变量,代表请求主机头字段或主机名 rewrite ^/(.*)$ http://www.ctt.com/$1 permanent;   #$1为正则匹配的内容,即“域名/”之后的字符串}root   html;index  index.html index.htm;}}
echo "192.168.80.20 www.tong.com www.ctt.com" >> /etc/hosts    #修改本地host映射
#创建test/1.htmlcd /usr/local/nginx/htmlmkdir test #创建目录echo "测试web1" > test/1.html

systemctl restart nginx  #重启nginx服务


 

浏览器输入模拟访问 http://www.tong.com/test/1.html(虽然这个请求内容是不存在的)

会跳转到www.ctt.com/test/1.html,查看元素可以看到返回301,实现了永久重定向跳转,而且域名后的参数也正常跳转。


 

5.2 基于客户端 IP 访问跳转

今天公司业务新版本上线,要求所有 IP 访问任何内容都显示一个固定维护页面,只有公司 IP :192.168.80.20访问正常。

vim /usr/local/nginx/conf/nginx.conf
server {listen       80;server_name  www.tong.com;      #域名修改  charset utf-8;access_log  /var/log/nginx/access.log;      #日志修改#设置是否合法的IP标记set $rewrite true;                    #设置变量$rewrite,变量值为boole值true#判断是否为合法IP#remode_addr表示客户端if ($remote_addr = "192.168.80.20"){  #当客户端IP为192.168.80.20时,将变量值设为false,不进行重写set $rewrite false;}#除了合法IP,其它都是非法IP,进行重写跳转维护页面if ($rewrite = true){                 #当变量值为true时,进行重写rewrite (.+) /web.html;           #将域名后边的路径重写成/web.html,例如www.tong.com/web.html}location = /web.html {root /var/www/html;               #网页返回/var/www/html/web.html的内容}location / {root   html;index  index.html index.htm;}}



 

echo "页面维护中。。。" > /var/www/html/web.html

systemctl restart nginx

只有本机能跳转,其他机子直接跳转到web界面

如果rewrite (.+) /web.html; 改成rewrite (.+) /web.html permanent; 的话,如果是非 192.168.80.20

的主机访问会使浏览器修改请求访问的URL成 http://www.tong.com/web.html 再请求访问,这样就会进入

一直在 rewrite 的死循环,访问请求会一直被重写成 http://www.tong.com/web.html 再请求访问

5.3 基于旧域名跳转到新域名后面加目录

现在访问的是 http://www.tong.com/post/,现在需要将这个域名下面的访问都跳转到http://www.ctt.com/tong/post/

vim /usr/local/nginx/conf/nginx.conf
server {listen       80;server_name  www.tong.com;      #域名修改  charset utf-8;access_log  /var/log/nginx/access.log;#添加location /post {rewrite (.+) http://www.ctt.com/tong$1 permanent;       #这里的$1为位置变量,代表/post}location / {root   html;index  index.html index.htm;}}

mkdir -p /usr/local/nginx/html/tong/postecho "测试web4" >> /usr/local/nginx/html/tong/post/1.htmlecho "192.168.80.20 tong.com" >> /etc/hosts
systemctl restart nginx

使用浏览器访问 http://tong.com/post/1.html 跳转到 http://www.ctt.com/tong/post/1.html


 

5.4 基于参数匹配的跳转

现在访问http://www.tong.com/100-(100|200)-100.html 跳转到http://www.tong.com页面。

vim /usr/local/nginx/conf/nginx.conf
server {listen       80;server_name  www.tong.com;      #域名修改  charset utf-8;access_log  /var/log/nginx/access.log;if ($request_uri ~ ^/100-(100|200)-(\d+).html$) {    #\d代表匹配数字,+代表匹配1个或多个rewrite (.+) http://www.tong.com permanent;}location / {root   html;index  index.html index.htm;}}
systemctl restart nginx

$request_uri:包含请求参数的原始URI,不包含主机名,如:http://www.tong.com/cao/tong/index.html?a=1&b=2 中的 /cao/tong/index.php?a=1&b=2

$uri:这个变量指当前的请求URI,不包括任何参数,如:/cao/tong/index.html

$document_uri:与$uri相同,这个变量指当前的请求URI,不包括任何传递参数,如:/cao/tong/index.html

使用浏览器访问 http://www.tong.com/100-200-100.html 或 http://www.tong.com/100-100-100.html 跳转到http://www.tong.com页面。#100-200只能输入100或200



 

5.5 基于目录下所有 php 结尾的文件跳转

要求访问 http://www.ctt.com/upload/123.php 跳转到首页。

vim /usr/local/nginx/conf/nginx.conf
server {listen       80;server_name  www.ctt.com;       #域名修改  charset utf-8;access_log  /var/log/nginx/access.log;location ~* /upload/.*\.php$ {rewrite (.+) http://www.ctt.com permanent;}location / {root   html;index  index.html index.htm;}}
systemctl restart nginx

浏览器访问 http://www.ctt.com/upload/123.php 跳转到http://www.ctt.com页面。
 

5.6 基于最普通一条 url 请求的跳转

要求访问一个具体的页面如 http://www.tong.com/cao/123.html 跳转到首页

vim /usr/local/nginx/conf/nginx.conf
server {listen       80;server_name  www.tong.com;      #域名修改  charset utf-8;access_log  /var/log/nginx/www.tong.com-access.log;location ~* ^/cao/123.html {rewrite (.+) http://www.tong.com permanent;}location / {root   html;index  index.html index.htm;}}


 

systemctl restart nginx

六、总结

  1. Location 指令

    • location 指令用于定义请求的匹配规则以及相应的处理方式。
    • 可以使用不同的匹配规则来满足不同的需求,例如精确匹配、前缀匹配、正则表达式匹配等。
    • location 块中可以包含多个其他指令,如 proxy_passroot 等,用于指定请求匹配时的处理逻辑。
  2. Rewrite 指令

    • rewrite 指令用于对请求的 URI 进行重写,实现 URL 的重定向或改写。
    • 可以通过简单的重写规则或者正则表达式来实现灵活的 URL 重定向。
    • 使用 permanent 参数可以实现永久重定向,而不使用参数则表示临时重定向。
  3. 常见应用场景

    • 使用 location 指令可以根据请求的 URL 路径将请求分发到不同的处理逻辑,例如静态文件的服务、反向代理等。
    • 通过 rewrite 指令可以实现 URL 的重写,将请求重定向到指定的 URL 地址,或者修改请求的 URI。
  4. 注意事项

    • 在使用 rewrite 指令时,需要小心处理,避免出现重定向循环或者意外的重写结果。
    • 合理设计 location 匹配规则,避免产生歧义或冲突,保证请求能够按预期进行处理。

总的来说,Nginx 中的 locationrewrite 指令为我们提供了强大的 URL 路由控制和重定向能力,能够帮助我们更好地管理 Web 服务器的请求处理流程。合理地使用这两个指令可以提升网站性能、实现灵活的请求处理逻辑。

这篇关于Nginx 精解:正则表达式、location 匹配与 rewrite 重写的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1049586

相关文章

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

hdu 3065 AC自动机 匹配串编号以及出现次数

题意: 仍旧是天朝语题。 Input 第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。 接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。 在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

POJ 3057 最大二分匹配+bfs + 二分

SampleInput35 5XXDXXX...XD...XX...DXXXXX5 12XXXXXXXXXXXXX..........DX.XXXXXXXXXXX..........XXXXXXXXXXXXX5 5XDXXXX.X.DXX.XXD.X.XXXXDXSampleOutput321impossible

GNSS CTS GNSS Start and Location Flow of Android15

目录 1. 本文概述2.CTS 测试3.Gnss Flow3.1 Gnss Start Flow3.2 Gnss Location Output Flow 1. 本文概述 本来是为了做Android 14 Gnss CTS 的相关环境的搭建和测试,然后在测试中遇到了一些问题,去寻找CTS源码(/cts/tests/tests/location/src/android/locat

Windows下Nginx的安装及开机启动

1、将nginx-1.16.1.zip解压拷贝至D:\web\nginx目录下。 2、启动Nginx,两种方法: (1)直接双击nginx.exe,双击后一个黑色的弹窗一闪而过。 (2)打开cmd命令窗口,切换到nginx目录下,输入命令 nginx.exe 或者 start nginx ,回车即可。 3、检查nginx是否启动成功。 直接在浏览器地址栏输入网址 http://lo

nginx介绍及常用功能

什么是nginx nginx跟Apache一样,是一个web服务器(网站服务器),通过HTTP协议提供各种网络服务。 Apache:重量级的,不支持高并发的服务器。在Apache上运行数以万计的并发访问,会导致服务器消耗大量内存。操作系统对其进行进程或线程间的切换也消耗了大量的CPU资源,导致HTTP请求的平均响应速度降低。这些都决定了Apache不可能成为高性能WEB服务器  nginx:

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

二分图的最大匹配——《啊哈!算法》

二分图 如果一个图的所有顶点可以被分为X和Y两个集合,并且所有边的两个顶点恰好一个属于X,另外一个属于Y,即每个集合内的顶点没有边相连,那么此图就是二分图。 二分图在任务调度、工作安排等方面有较多的应用。 判断二分图:首先将任意一个顶点着红色,然后将其相邻的顶点着蓝色,如果按照这样的着色方法可以将全部顶点着色的话,并且相邻的顶点着色不同,那么该图就是二分图。 java

web群集--nginx配置文件location匹配符的优先级顺序详解及验证

文章目录 前言优先级顺序优先级顺序(详解)1. 精确匹配(Exact Match)2. 正则表达式匹配(Regex Match)3. 前缀匹配(Prefix Match) 匹配规则的综合应用验证优先级 前言 location的作用 在 NGINX 中,location 指令用于定义如何处理特定的请求 URI。由于网站往往需要不同的处理方式来适应各种请求,NGINX 提供了多种匹