关于Normalizer.normalize()方法的用途

2024-05-16 13:38
文章标签 方法 normalize normalizer

本文主要是介绍关于Normalizer.normalize()方法的用途,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在工作中,经常在看到Normalizer.normalize()方法的身影,遂了解了下这个方法的作用。

现假设系统对外部输入作校验,如果发现输入中包含"<"或者">"字符,就判定此输入不合法,无法通过校验。但如果输入的是全角形式的字符,判断就会稍微变得麻烦,而且并不方便,一旦有所遗漏,出错之后排查可能会花费较多的时间。

// 包含全角尖括号
String sbcCase = "\uFe64" + ";reboot;" + "\uFe65";
// 包含半角尖括号
String dbcCase = "\u003C" + ";reboot;" + "\u003E";
System.out.println("包含全角尖括号的输入字符串:" + sbcCase + "\n包含半角尖括号的输入字符串:" + dbcCase);
// 虽然可以使用unicode来校验,但是很明显这种方式比较繁琐,并不方便
System.out.println("字符串\"" + sbcCase + "\"中是否包含全角尖括号:" + sbcCase.contains("<"));
System.out.println("字符串\"" + sbcCase + "\"中是否包含全角尖括号:" + sbcCase.contains("\uFe64"));

运行结果如下:

包含全角尖括号的输入字符串:﹤;reboot;﹥
包含半角尖括号的输入字符串:<;reboot;>
字符串"﹤;reboot;﹥"中是否包含全角尖括号:false
字符串"﹤;reboot;﹥"中是否包含全角尖括号:true

此时,可以考虑在校验之前使用normalize方法对外部输入字符串做归一化/标准化,确保具有相同意义的字符串具有统一的二进制描述,推荐使用Normalizer.Form.NFKC参数进行归一化/标准化。

以下是一个以包含尖括号的外部输入字符串为例的简单例子:

import java.text.Normalizer;
import java.util.regex.Matcher;
import java.util.regex.Pattern;/*** 以尖括号未为例,有全角(<>)和半角(<>)之分,但是其语义是一样的* 如果未对输入中的此类字符串作归一化处理,可能会使得绕过系统输入限制,对系统造成破坏*/
public class NormalizationTest {public static void main(String[] args) {// 包含全角尖括号String sbcCase = "\uFe64" + ";reboot;" + "\uFe65";// 包含半角尖括号String dbcCase = "\u003C" + ";reboot;" + "\u003E";System.out.println("包含全角尖括号的输入字符串:" + sbcCase + "\n包含半角尖括号的输入字符串:" + dbcCase);// 普通方法无法判断是否包含全角尖括号System.out.println("字符串\"" + sbcCase + "\"中是否包含全角尖括号:" + sbcCase.contains("<"));// 归一化前,无法正确区分全角和半角尖括号,出错校验遗漏,系统受到破坏,服务被重启System.out.println("-----------------------------");System.out.println("归一化前:" + sbcCase);checkInputString(sbcCase);// 归一化后,就可正确校验,系统免受破坏System.out.println("-----------------------------");String normalized = Normalizer.normalize(sbcCase, Normalizer.Form.NFKC);System.out.println("归一化后:" + normalized);checkInputString(normalized);}private static void checkInputString(String str) {Pattern pattern = Pattern.compile("<\\s*;reboot\\s*;>");Matcher matcher = pattern.matcher(str);if (matcher.find()) {System.out.println("命令注入失败");return;}System.out.println("命令注入成功,服务器即将重启");}
}

运行结果如下:

sdafsdfas

当然,本文只是举个例子,表明对外部输入字符串进行归一化后再校验可以避免一些潜在的坑点,实际操作时完全可以只判断黑名单,只要输入中包含了"reboot"这种注入命令就无法通过校验。不过,就业务而言,外部输入中的错误应该尽早拦截,早发现早治疗,越到后面捅出的篓子可能也越大。就这点而言,使用归一化操作还是有一定必要的。

但normalize方法也存在缺点,输入字符串太长的话转换效率会比较低,所以,最好还是结合实际按需使用。

写到最后,突然想起了谷歌浏览器,在输网址时如果将点号(".")误输入成中文的句号("。"),但是点击回车后这些中文句号就会变成正常的英文点号,相信这里面也有类似归一化的操作吧。

   -->     


这篇关于关于Normalizer.normalize()方法的用途的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/995068

相关文章

Java 方法重载Overload常见误区及注意事项

《Java方法重载Overload常见误区及注意事项》Java方法重载允许同一类中同名方法通过参数类型、数量、顺序差异实现功能扩展,提升代码灵活性,核心条件为参数列表不同,不涉及返回类型、访问修饰符... 目录Java 方法重载(Overload)详解一、方法重载的核心条件二、构成方法重载的具体情况三、不构

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

Python中将嵌套列表扁平化的多种实现方法

《Python中将嵌套列表扁平化的多种实现方法》在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋... 目录python中将嵌套列表扁平化的方法技术背景实现步骤1. 使用嵌套列表推导式2. 使用itert

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

在Linux中改变echo输出颜色的实现方法

《在Linux中改变echo输出颜色的实现方法》在Linux系统的命令行环境下,为了使输出信息更加清晰、突出,便于用户快速识别和区分不同类型的信息,常常需要改变echo命令的输出颜色,所以本文给大家介... 目python录在linux中改变echo输出颜色的方法技术背景实现步骤使用ANSI转义码使用tpu

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v

Spring Boot中WebSocket常用使用方法详解

《SpringBoot中WebSocket常用使用方法详解》本文从WebSocket的基础概念出发,详细介绍了SpringBoot集成WebSocket的步骤,并重点讲解了常用的使用方法,包括简单消... 目录一、WebSocket基础概念1.1 什么是WebSocket1.2 WebSocket与HTTP

SQL Server配置管理器无法打开的四种解决方法

《SQLServer配置管理器无法打开的四种解决方法》本文总结了SQLServer配置管理器无法打开的四种解决方法,文中通过图文示例介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录方法一:桌面图标进入方法二:运行窗口进入检查版本号对照表php方法三:查找文件路径方法四:检查 S

MyBatis-Plus 中 nested() 与 and() 方法详解(最佳实践场景)

《MyBatis-Plus中nested()与and()方法详解(最佳实践场景)》在MyBatis-Plus的条件构造器中,nested()和and()都是用于构建复杂查询条件的关键方法,但... 目录MyBATis-Plus 中nested()与and()方法详解一、核心区别对比二、方法详解1.and()