本文主要是介绍6.2.4 随机游走(Random Walk),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
随机游走这一名称由Karl Pearson在1905年提出[Pearson, K. (1905). The problem of the Random Walk. Nature. 72, 294.],本来是基于物理中"布朗运动"相关的微观粒子的运动形成的一个模型,后来这一模型作为数理金融中的重要的假设,指的是证券价格的时间序列将呈现随机状态,不会表现出某种可观测或统计的确定趋势,即证券价格的变动是不可预测的。在计算机领域,随机游走则主要用来进行一种关系的传递分析,如图6-5所示。
图6-5 随机游走 |
以q表示查询,而d表示查询结果中的文档。则查询q1所对应的文档为d1和d2,并不包含d3。但不能简单断定q1和d3无关。因为查询q2所对应的文档包含了与查询q1相关的所有文档d1、d2,此外还包含了d3。文档d1、d2和d3通过共同的查询q2建立了关联,而查询q1和q2则通过共同的文档d1、d2建立了关联,关联性的传递意味着d3也许是和q1具有还未被表达的关联性。为表达这种关系的传递,可以视该图为一个随机场,依据结点间的连通性和转移概率进行随机游走,以传递结节的关联关系。
可以用一个简单例子来说明这种方法的实际意义,如某用户用q1查询超市所售的糖,返回水果糖和奶糖两个结果;另一位用户则用q2查询超市中所售甜食,不仅返回了水果糖、奶糖,还返回了巧克力。而巧克力实际上和第一位用户的查询意图相关性还是相当高的。
转自http://book.51cto.com/art/201107/276845.htm
这篇关于6.2.4 随机游走(Random Walk)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!