本文主要是介绍自然语言处理NLP培训讲师叶梓:人工智能之最新NLP自然语言处理技术与实战-18,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
接上一页
P39-P40
向量空间模型
VSM将文档表示为一个向量空间中的一个向量,
由所有文档中提取出来的词典和各份文档构成的一个矩阵。
余弦相似度
• 文本处理中最常用的相似性度量方式是余弦距离。
• 根据向量在其向量空间的坐标值,求得它们的夹角, 夹角越小,它们的方向更加吻合,则越相似 。
• 夹角大小通过计算得出的余弦值来表示,夹角越小,余弦值越接近于 1 。因此,余弦值就可以用来表示这两个向量的相似性。
未完,下一篇继续……
这篇关于自然语言处理NLP培训讲师叶梓:人工智能之最新NLP自然语言处理技术与实战-18的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!