BOVW

2024-02-12 21:38
文章标签 bovw

本文主要是介绍BOVW,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

       最近在改毕业论文,所以对于专业课的东西也有了更加深刻的理解。所以在这里稍微介绍一下。

       bow的意思是bag of words,也就是说词包,看表面意思是,一个包里放着单词,其实差不多就是这么个意思。词包里面是一些关键词,这些关键词可以用来定性一个文档的内容。

       就比如我们平时某些文档,命名都是乱码。在打开之前,我们不知道它是什么内容,但是逐个打开看是很耗费时间和精力的。所以可以应用bovw,通过对文档中内容的扫描,将其中的关键词聚合,成为一个集合。然后和数据库中的数据进行比对,根据扫描文档的时候提取的关键词和词包里的数据进行比对。通过比对之后,如果和某类文档的关键词相似,就可以对这些文档进行大致的分类。

       所以这种东西还是挺有用的,不过仅仅是对于文档进行定性已经无法满足我们的需求了,还可以扫描图片,然后识别图片里的内容,我现在正在做的就是对图片进行扫描。希望我可以顺利毕业!


这篇关于BOVW的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/703664

相关文章

词袋模型(视觉词袋模型BOVW)详解

转自 https://blog.csdn.net/tiandijun/article/details/51143765 引言 最初的Bag of words,也叫做“词袋”,在信息检索中,Bag of words model假定对于一个文本,忽略其词序和语法,句法,将其仅仅看做是一个词集合,或者说是词的一个组合,文本中每个词的出现都是独立的,不依赖于其他词 是否出现,或者说当这