删除晋江原创网文章干扰码的思路(特征匹配)

2023-10-11 09:58

本文主要是介绍删除晋江原创网文章干扰码的思路(特征匹配),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文章仅授权非营利性质之用途,不得做它用。
著作人身权受法律保护,转载请保留作者署名,保持文章完整性,谢绝修改!
本文章仅作为技术讨论,切勿使用本文章提及的技术,侵害他人权益。由此引发的一切法律责任以及其他纠纷,本文作者均得免责!
特此声明!

==================================================

晋江原创网是国内很著名的原创文学发布网站。(http://www.jjwxc.net/)有很多作者的专栏,更新很快。
我有时会帮别人到上面找一些连载的文章,不过晋江的文章每个段落的后面都有一个干扰码,一般是乱码加上诸如什么保护版权的字样,看着很不爽啊!

比如:

Quote:

8df707a948fac1b4 保护版权!尊重作者!反对盗版! @ Copyright of 晋江原创网 @
26e359e83860db1d


这些干扰码的技术特点是:
1、内容不固定,含有随机的16进制数;
2、长度不固定,每行干扰码的长度不固定,无论是前面的16进制随机数,还是后面的中文提示。
3、干扰码在HTML中标注的颜色值不固定,随机性很强,虽然说还保持在一个色调范围内。

下面分析一下干扰码的特征:
1、以中文“的”开头;
2、后面有一串16进制数字;
3、干扰码最后必定是一个换行的标记(HTML中为<br>,文本中为chr(10)+chr(13),如果我没记错的话)

根据特征删除干扰码的思路:
1、判断开头;
2、找到结束;
3、删除!

附带的代码请看附件部分!用ASP写的,嘿嘿。
没办法,因为ASP是我机器上最好的开发环境,方便快捷,能用它做的我就懒得用别的了。

需要完善代码的细节部分,因为为了复制文章随手写的,很多特殊情况没有处理。
比如找到“的”之后,默认判定后面还有字符。如果文章以“的”结尾,程序就报错了,呵呵~
<%
dim i, j, text, text_len, tmp
text=request.Form("text")
i=1
k=1
if text<>"" then
 do while instr(i, text, "的")>0
  if instr(i, text, "的")>0 then
   'response.Write "T1"
   j=instr(i, text, "的")
   'response.Write j&"|"
   'response.Write asc(mid(text, j+3, 1))
   if (asc(mid(text, j+2, 1))>47 and asc(mid(text, j+2, 1))<58) or (asc(mid(text, j+2, 1))>96 and asc(mid(text, j+2, 1))<123) then
    tmp=mid(text, j, instr(j, text, chr(10))-j+1)
    text=replace(text, tmp, "")
   end if
   i=j+1
  end if
  k=k+1
  if k>5000 then exit Do
 loop
 text=replace(replace(text, chr(10), ""), chr(13), "<br>")
        text=replace(text, "  ", "")
 response.Write text
else
%>
<form action="" method="post">
<textarea name="text" cols="100" rows="30"></textarea><br>
<input type="submit"><input type="reset">
</form>
<%
end if
%>

这篇关于删除晋江原创网文章干扰码的思路(特征匹配)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/187230

相关文章

shell脚本自动删除30天以前的文件(最新推荐)

《shell脚本自动删除30天以前的文件(最新推荐)》该文章介绍了如何使用Shell脚本自动删除指定目录下30天以前的文件,并通过crontab设置定时任务,此外,还提供了如何使用Shell脚本删除E... 目录shell脚本自动删除30天以前的文件linux按照日期定时删除elasticsearch索引s

C++使用栈实现括号匹配的代码详解

《C++使用栈实现括号匹配的代码详解》在编程中,括号匹配是一个常见问题,尤其是在处理数学表达式、编译器解析等任务时,栈是一种非常适合处理此类问题的数据结构,能够精确地管理括号的匹配问题,本文将通过C+... 目录引言问题描述代码讲解代码解析栈的状态表示测试总结引言在编程中,括号匹配是一个常见问题,尤其是在

docker如何删除悬空镜像

《docker如何删除悬空镜像》文章介绍了如何使用Docker命令删除悬空镜像,以提高服务器空间利用率,通过使用dockerimage命令结合filter和awk工具,可以过滤出没有Tag的镜像,并将... 目录docChina编程ker删除悬空镜像前言悬空镜像docker官方提供的方式自定义方式总结docker

linux进程D状态的解决思路分享

《linux进程D状态的解决思路分享》在Linux系统中,进程在内核模式下等待I/O完成时会进入不间断睡眠状态(D状态),这种状态下,进程无法通过普通方式被杀死,本文通过实验模拟了这种状态,并分析了如... 目录1. 问题描述2. 问题分析3. 实验模拟3.1 使用losetup创建一个卷作为pv的磁盘3.

使用Python在Excel中插入、修改、提取和删除超链接

《使用Python在Excel中插入、修改、提取和删除超链接》超链接是Excel中的常用功能,通过点击超链接可以快速跳转到外部网站、本地文件或工作表中的特定单元格,有效提升数据访问的效率和用户体验,这... 目录引言使用工具python在Excel中插入超链接Python修改Excel中的超链接Python

关于Gateway路由匹配规则解读

《关于Gateway路由匹配规则解读》本文详细介绍了SpringCloudGateway的路由匹配规则,包括基本概念、常用属性、实际应用以及注意事项,路由匹配规则决定了请求如何被转发到目标服务,是Ga... 目录Gateway路由匹配规则一、基本概念二、常用属性三、实际应用四、注意事项总结Gateway路由

Android kotlin语言实现删除文件的解决方案

《Androidkotlin语言实现删除文件的解决方案》:本文主要介绍Androidkotlin语言实现删除文件的解决方案,在项目开发过程中,尤其是需要跨平台协作的项目,那么删除用户指定的文件的... 目录一、前言二、适用环境三、模板内容1.权限申请2.Activity中的模板一、前言在项目开发过程中,尤

C#实现添加/替换/提取或删除Excel中的图片

《C#实现添加/替换/提取或删除Excel中的图片》在Excel中插入与数据相关的图片,能将关键数据或信息以更直观的方式呈现出来,使文档更加美观,下面我们来看看如何在C#中实现添加/替换/提取或删除E... 在Excandroidel中插入与数据相关的图片,能将关键数据或信息以更直观的方式呈现出来,使文档更

Python脚本实现自动删除C盘临时文件夹

《Python脚本实现自动删除C盘临时文件夹》在日常使用电脑的过程中,临时文件夹往往会积累大量的无用数据,占用宝贵的磁盘空间,下面我们就来看看Python如何通过脚本实现自动删除C盘临时文件夹吧... 目录一、准备工作二、python脚本编写三、脚本解析四、运行脚本五、案例演示六、注意事项七、总结在日常使用

Git中恢复已删除分支的几种方法

《Git中恢复已删除分支的几种方法》:本文主要介绍在Git中恢复已删除分支的几种方法,包括查找提交记录、恢复分支、推送恢复的分支等步骤,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录1. 恢复本地删除的分支场景方法2. 恢复远程删除的分支场景方法3. 恢复未推送的本地删除分支场景方法4. 恢复