本文主要是介绍Anti Plagiarism 反学术剽窃工具,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
首先反剽窃不是我提出的,我只是利用网络让更多的人能用到它,所以编写了这个小工具。
此工具原理是自动批量使用搜索引擎并取回结果(我应该已经违反了大部分搜索引擎的用户条款了,呵呵呵)。
当然这个工具还不能给出抄袭程度,那是在原始数据基础上分析出来的,非常复杂,不过它还是能够很轻松找出哪里是抄袭的和抄袭的来源。
这里给出了工具对两篇文章的分析结果做对比:
括号中的数字代表对应句子在搜索引擎中查询结果条数
左侧展示了,一篇剽窃的作品是如何原形毕露的
右侧是一篇未发表的原创文章,基本上在互联网上搜索是没有结果的
使用此工具判断文章的原创性,非常简单
未来要做的是:
使用复杂条件,例如屏蔽某URL结果,这个使用谷歌可以做到,可惜目前国内用谷歌不是很稳定
目前“长度短的句子 不分析”这个策略不是很理想,替换成“词少句子 不分析”,这个需要中文分词技术——一个讨论不完的话题。
这篇关于Anti Plagiarism 反学术剽窃工具的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!