本文主要是介绍BOVW,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
最近在改毕业论文,所以对于专业课的东西也有了更加深刻的理解。所以在这里稍微介绍一下。
bow的意思是bag of words,也就是说词包,看表面意思是,一个包里放着单词,其实差不多就是这么个意思。词包里面是一些关键词,这些关键词可以用来定性一个文档的内容。
就比如我们平时某些文档,命名都是乱码。在打开之前,我们不知道它是什么内容,但是逐个打开看是很耗费时间和精力的。所以可以应用bovw,通过对文档中内容的扫描,将其中的关键词聚合,成为一个集合。然后和数据库中的数据进行比对,根据扫描文档的时候提取的关键词和词包里的数据进行比对。通过比对之后,如果和某类文档的关键词相似,就可以对这些文档进行大致的分类。
所以这种东西还是挺有用的,不过仅仅是对于文档进行定性已经无法满足我们的需求了,还可以扫描图片,然后识别图片里的内容,我现在正在做的就是对图片进行扫描。希望我可以顺利毕业!
这篇关于BOVW的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!