将 javascript 的字符串和正则的内容替换为下划线

2024-08-22 12:18

本文主要是介绍将 javascript 的字符串和正则的内容替换为下划线,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

程序语言的设计就是一门艺术, 通用程序语言更是如此。
其实程序说白了就是字符串,是对机器逻辑的阐述,对程序语言的处理感觉也是就成了一门艺术。

最近看到一个非常大的 js 文件,大约有10万行,让我懵生了程序处理的念头。

在分析和试探的阶段,我发现js代码的程序结构很大程度上是受大括号( {} )控制,而js代码的注释,字符串,正则表达中有可能存在很大程度上影响了程序结构的分析。

所幸该代码段没有任何注释,我就忽略了注释的处理过程。

但字符串和正则内容的处理依旧是一个难题。我将程序中的字符串和正则表达部分转换为下划线。 这样既可以避免字符串和正则影响结构分析,又可以尽可能保证程序结构。

下面是代码:

import os ,sysjs_path = './test/a.js'is_ins = False # 是否是转移符
is_str = False  # 是否是字符串
str_sym = ''
is_reg = False  # 是否是正则表达式pt_l = ['[', '(', '{']
pt_r = [']', ')', '}']def is_word_c(c):c_d = ord(c)if (c_d >= 48 and c_d <= 57) \or (c_d >= 65 and c_d <= 90) \or (c_d >= 97 and c_d <= 122) \or w == '_':return Trueelse:return Falsedef last_word(l, w_i):for i in range(w_i - 1, -1, -1):# print('i: ',i, l[i])if l[i] not in [' ', '\t']:breakif i == 0:return ''for j in range(i - 1, -1, -1):# print('j: ', j, l[j])if not is_word_c(l[j]):return l[j+1:i+1]return ''with open(js_path) as fr:for l_i, l in enumerate(fr.readlines()):  #[:200]is_ibegin = Truel = l.rstrip()l_t = ''is_str_si = 0is_str_le = 0for w_i, w in enumerate(l):# if l[w_i: w_i + len('return')] == 'return':#     if((w_i != 0 and not is_word_c(l[w_i - 1])) or w_i == 0) and  not is_word_c(l[w_i+'return'+1]):if w not in [' ', '\t', '/']:# w_d = ord(w)# 字符if is_word_c(w) or w in ['.', '-', '+', ')',']'] and not is_reg:is_ibegin = Falseelse:is_ibegin = Trueif l_i == 1170:print (w+'['+str(l_i)+"]["+str(w_i)+']:'+ str(is_ibegin))if l_i == 2449:print('[2249]'+str(is_ins))if not is_ins and w in ['"', '\'', '/']: #  and str_sym == wif not is_str:  # 字符开始判断if l_i == 39853:print (w+'['+str(l_i)+"]["+str(w_i)+'] ee:'+ str(is_ibegin))if w == '/' and (is_ibegin or last_word(l, w_i) == 'return'):is_str = not is_stris_reg = not is_reg# print('%s[%s][%s]reg begin'%(w, l_i, w_i))elif w in ['"', '\'']:is_str = not is_strif is_str:is_str_si = w_i + 1str_sym = w# print('begin str - [%s]' % w)elif str_sym == w:is_str = not is_strif w == '/':# print('%s[%s][%s]reg end'%(w, l_i, w_i))is_reg = not is_reg# print('end str - [%s]'%w)l_t += l[is_str_le:is_str_si] + '_'*(w_i - is_str_si)is_str_le = w_iif not is_ins and is_str and w == '\\':is_ins = Trueelif is_ins == True:is_ins = Falseif is_str_si <= is_str_le:l_t += l[is_str_le:]print('l_i [%03d]:'%l_i, l)print('l_i [%03d]:'%l_i, l_t)

这篇关于将 javascript 的字符串和正则的内容替换为下划线的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1096250

相关文章

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

JAVA系统中Spring Boot应用程序的配置文件application.yml使用详解

《JAVA系统中SpringBoot应用程序的配置文件application.yml使用详解》:本文主要介绍JAVA系统中SpringBoot应用程序的配置文件application.yml的... 目录文件路径文件内容解释1. Server 配置2. Spring 配置3. Logging 配置4. Ma

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

java脚本使用不同版本jdk的说明介绍

《java脚本使用不同版本jdk的说明介绍》本文介绍了在Java中执行JavaScript脚本的几种方式,包括使用ScriptEngine、Nashorn和GraalVM,ScriptEngine适用... 目录Java脚本使用不同版本jdk的说明1.使用ScriptEngine执行javascript2.

Spring MVC如何设置响应

《SpringMVC如何设置响应》本文介绍了如何在Spring框架中设置响应,并通过不同的注解返回静态页面、HTML片段和JSON数据,此外,还讲解了如何设置响应的状态码和Header... 目录1. 返回静态页面1.1 Spring 默认扫描路径1.2 @RestController2. 返回 html2

Spring常见错误之Web嵌套对象校验失效解决办法

《Spring常见错误之Web嵌套对象校验失效解决办法》:本文主要介绍Spring常见错误之Web嵌套对象校验失效解决的相关资料,通过在Phone对象上添加@Valid注解,问题得以解决,需要的朋... 目录问题复现案例解析问题修正总结  问题复现当开发一个学籍管理系统时,我们会提供了一个 API 接口去

Java操作ElasticSearch的实例详解

《Java操作ElasticSearch的实例详解》Elasticsearch是一个分布式的搜索和分析引擎,广泛用于全文搜索、日志分析等场景,本文将介绍如何在Java应用中使用Elastics... 目录简介环境准备1. 安装 Elasticsearch2. 添加依赖连接 Elasticsearch1. 创

Spring核心思想之浅谈IoC容器与依赖倒置(DI)

《Spring核心思想之浅谈IoC容器与依赖倒置(DI)》文章介绍了Spring的IoC和DI机制,以及MyBatis的动态代理,通过注解和反射,Spring能够自动管理对象的创建和依赖注入,而MyB... 目录一、控制反转 IoC二、依赖倒置 DI1. 详细概念2. Spring 中 DI 的实现原理三、

SpringBoot 整合 Grizzly的过程

《SpringBoot整合Grizzly的过程》Grizzly是一个高性能的、异步的、非阻塞的HTTP服务器框架,它可以与SpringBoot一起提供比传统的Tomcat或Jet... 目录为什么选择 Grizzly?Spring Boot + Grizzly 整合的优势添加依赖自定义 Grizzly 作为