将 javascript 的字符串和正则的内容替换为下划线

2024-08-22 12:18

本文主要是介绍将 javascript 的字符串和正则的内容替换为下划线,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

程序语言的设计就是一门艺术, 通用程序语言更是如此。
其实程序说白了就是字符串,是对机器逻辑的阐述,对程序语言的处理感觉也是就成了一门艺术。

最近看到一个非常大的 js 文件,大约有10万行,让我懵生了程序处理的念头。

在分析和试探的阶段,我发现js代码的程序结构很大程度上是受大括号( {} )控制,而js代码的注释,字符串,正则表达中有可能存在很大程度上影响了程序结构的分析。

所幸该代码段没有任何注释,我就忽略了注释的处理过程。

但字符串和正则内容的处理依旧是一个难题。我将程序中的字符串和正则表达部分转换为下划线。 这样既可以避免字符串和正则影响结构分析,又可以尽可能保证程序结构。

下面是代码:

import os ,sysjs_path = './test/a.js'is_ins = False # 是否是转移符
is_str = False  # 是否是字符串
str_sym = ''
is_reg = False  # 是否是正则表达式pt_l = ['[', '(', '{']
pt_r = [']', ')', '}']def is_word_c(c):c_d = ord(c)if (c_d >= 48 and c_d <= 57) \or (c_d >= 65 and c_d <= 90) \or (c_d >= 97 and c_d <= 122) \or w == '_':return Trueelse:return Falsedef last_word(l, w_i):for i in range(w_i - 1, -1, -1):# print('i: ',i, l[i])if l[i] not in [' ', '\t']:breakif i == 0:return ''for j in range(i - 1, -1, -1):# print('j: ', j, l[j])if not is_word_c(l[j]):return l[j+1:i+1]return ''with open(js_path) as fr:for l_i, l in enumerate(fr.readlines()):  #[:200]is_ibegin = Truel = l.rstrip()l_t = ''is_str_si = 0is_str_le = 0for w_i, w in enumerate(l):# if l[w_i: w_i + len('return')] == 'return':#     if((w_i != 0 and not is_word_c(l[w_i - 1])) or w_i == 0) and  not is_word_c(l[w_i+'return'+1]):if w not in [' ', '\t', '/']:# w_d = ord(w)# 字符if is_word_c(w) or w in ['.', '-', '+', ')',']'] and not is_reg:is_ibegin = Falseelse:is_ibegin = Trueif l_i == 1170:print (w+'['+str(l_i)+"]["+str(w_i)+']:'+ str(is_ibegin))if l_i == 2449:print('[2249]'+str(is_ins))if not is_ins and w in ['"', '\'', '/']: #  and str_sym == wif not is_str:  # 字符开始判断if l_i == 39853:print (w+'['+str(l_i)+"]["+str(w_i)+'] ee:'+ str(is_ibegin))if w == '/' and (is_ibegin or last_word(l, w_i) == 'return'):is_str = not is_stris_reg = not is_reg# print('%s[%s][%s]reg begin'%(w, l_i, w_i))elif w in ['"', '\'']:is_str = not is_strif is_str:is_str_si = w_i + 1str_sym = w# print('begin str - [%s]' % w)elif str_sym == w:is_str = not is_strif w == '/':# print('%s[%s][%s]reg end'%(w, l_i, w_i))is_reg = not is_reg# print('end str - [%s]'%w)l_t += l[is_str_le:is_str_si] + '_'*(w_i - is_str_si)is_str_le = w_iif not is_ins and is_str and w == '\\':is_ins = Trueelif is_ins == True:is_ins = Falseif is_str_si <= is_str_le:l_t += l[is_str_le:]print('l_i [%03d]:'%l_i, l)print('l_i [%03d]:'%l_i, l_t)

这篇关于将 javascript 的字符串和正则的内容替换为下划线的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1096250

相关文章

Java实现字符串大小写转换的常用方法

《Java实现字符串大小写转换的常用方法》在Java中,字符串大小写转换是文本处理的核心操作之一,Java提供了多种灵活的方式来实现大小写转换,适用于不同场景和需求,本文将全面解析大小写转换的各种方法... 目录前言核心转换方法1.String类的基础方法2. 考虑区域设置的转换3. 字符级别的转换高级转换

SpringBoot简单整合ElasticSearch实践

《SpringBoot简单整合ElasticSearch实践》Elasticsearch支持结构化和非结构化数据检索,通过索引创建和倒排索引文档,提高搜索效率,它基于Lucene封装,分为索引库、类型... 目录一:ElasticSearch支持对结构化和非结构化的数据进行检索二:ES的核心概念Index:

Java方法重载与重写之同名方法的双面魔法(最新整理)

《Java方法重载与重写之同名方法的双面魔法(最新整理)》文章介绍了Java中的方法重载Overloading和方法重写Overriding的区别联系,方法重载是指在同一个类中,允许存在多个方法名相同... 目录Java方法重载与重写:同名方法的双面魔法方法重载(Overloading):同门师兄弟的不同绝

MySQL字符串转数值的方法全解析

《MySQL字符串转数值的方法全解析》在MySQL开发中,字符串与数值的转换是高频操作,本文从隐式转换原理、显式转换方法、典型场景案例、风险防控四个维度系统梳理,助您精准掌握这一核心技能,需要的朋友可... 目录一、隐式转换:自动但需警惕的&ld编程quo;双刃剑”二、显式转换:三大核心方法详解三、典型场景

Spring配置扩展之JavaConfig的使用小结

《Spring配置扩展之JavaConfig的使用小结》JavaConfig是Spring框架中基于纯Java代码的配置方式,用于替代传统的XML配置,通过注解(如@Bean)定义Spring容器的组... 目录JavaConfig 的概念什么是JavaConfig?为什么使用 JavaConfig?Jav

Java数组动态扩容的实现示例

《Java数组动态扩容的实现示例》本文主要介绍了Java数组动态扩容的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1 问题2 方法3 结语1 问题实现动态的给数组添加元素效果,实现对数组扩容,原始数组使用静态分配

Java中ArrayList与顺序表示例详解

《Java中ArrayList与顺序表示例详解》顺序表是在计算机内存中以数组的形式保存的线性表,是指用一组地址连续的存储单元依次存储数据元素的线性结构,:本文主要介绍Java中ArrayList与... 目录前言一、Java集合框架核心接口与分类ArrayList二、顺序表数据结构中的顺序表三、常用代码手动

JAVA项目swing转javafx语法规则以及示例代码

《JAVA项目swing转javafx语法规则以及示例代码》:本文主要介绍JAVA项目swing转javafx语法规则以及示例代码的相关资料,文中详细讲解了主类继承、窗口创建、布局管理、控件替换、... 目录最常用的“一行换一行”速查表(直接全局替换)实际转换示例(JFramejs → JavaFX)迁移建

Spring Boot Interceptor的原理、配置、顺序控制及与Filter的关键区别对比分析

《SpringBootInterceptor的原理、配置、顺序控制及与Filter的关键区别对比分析》本文主要介绍了SpringBoot中的拦截器(Interceptor)及其与过滤器(Filt... 目录前言一、核心功能二、拦截器的实现2.1 定义自定义拦截器2.2 注册拦截器三、多拦截器的执行顺序四、过

JAVA线程的周期及调度机制详解

《JAVA线程的周期及调度机制详解》Java线程的生命周期包括NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING和TERMINATED,线程调度依赖操作系统,采用抢占... 目录Java线程的生命周期线程状态转换示例代码JAVA线程调度机制优先级设置示例注意事项JAVA线程