dirichlet专题

POJ 3006 Dirichlet's Theorem on Arithmetic Progressions

分析: 这道题要先用筛法求出10^6以内的素数。。。。我竟然觉得数据太多没用这种方式,然后写出来的代码就运行超时了,呜呜……最后还是用的筛法 Description If a and d are relatively prime positive integers, the arithmetic sequence beginning with a and increasing b

LDA(Latent Dirichlet Allocation)相关论文阅读小结

关于主题挖掘,LDA(Latent Dirichlet Allocation)已经得到了充分的应用。本文是我对自己读过的相关文章的总结。 1. 《LDA数学八卦》http://pan.baidu.com/s/18KUBG 把标准LDA的由来讲解得通俗易懂,细致入微。真的是了解LDA的最佳入门读物。 Gamma函数: 通过分部积分可以推导其具有递归性质 ,因此Gamma函数可以当成是阶乘在实

狄里克雷平滑(Dirichlet)、线性插值平滑(Linear Interpolated)、拉普拉斯平滑(Laplacian)

一元语言模型(Unigram Language Model)就是关于全部单词上的一个概率分布,它认为每篇文章都对应一个一元语言模型,文章中的单词都是从这个概率分布中采样得到。所以计算文章和查询语句之间的相关性,相当于计算文章对应的一元语言模型产生出查询语句的概率。 通常我们统计文档中的单词频率分布来估计文章对应的一元语言模型,但是未出现在文档中的单词的概率就被设置为0了,这显然是不合理的。所以需

Collapsed Gibbs Sampling for Latent Dirichlet Allocation on Spark

摘要 本文针对Spark上广泛使用的潜在Dirichlet分配(LDA)模型,实现了一种折叠Gibbs抽样方法。 Spark是一款面向大规模数据处理的快速内存集群计算框架,成为大数据小镇的领域话题已经有一段时间了。 适用于迭代和交互算法。 该方法将数据集分割成P∗P个分区,使用规则将这些分区洗牌并重组成P个子数据集,避免采样冲突,其中每个P个子数据集只包含P个分区,然后逐个并行处理每个子数

Dirichlet分布与Multinomial分布

Dirichlet分布其实也是采样出一个值(向量),从这个意义上来说,它其实和其它分布并无太大不同?那为什么大家都说Dirichlet分布式分布的分布呢?因为Dirichlet分布出现的场景,总是用于生成别的分布(更确切地说,总是用于生成Multinomial分布) Dirichlet分布得到的向量各个分量的和是1,这个向量可以作为Multinomial分布的参数,所以我们说Dirichlet能

Dirichlet Process 4

每一个样本都有自己对应的,有多少个样本就有多少个 如果有a个相等,那么我们能够相信这a个对应的样本x属于同一类的 要保证能够相等,所以要从一个离散的分布,即G中产生 所以有如下关系 图模型如下: ,这里面,直接将G带入有些困难,这里面使用了狄利克雷分布和多项式分布共轭的性质 可以看到新的DP的base measure ,和之前的H相比,新加了一个离散的项。

3D Dirichlet Free-Form Deformation(三维Dirichlet自由变形)

自由变形(Free-Form Deformation, 简称FFD)方法是常用的一种与物体表示无关的变形方法,被广泛地应用于计算机动画和几何建模领域中。FFD方法不对物体直接变形,而是对物体所嵌入的空间进行变形。而Dirichlet自由变形(DFFD)算法是FFD的一种应用较广泛的FFD的改进算法。DFFD算法具有更大的灵活性,能够任意设置控制点,也不需明确定义一个控制盒。DFFD算法主要基

沃罗诺伊图(Voronoi Diagram,也称作Dirichlet tessellation,狄利克雷镶嵌)

沃罗诺伊图(Voronoi Diagram,也称作Dirichlet tessellation,狄利克雷镶嵌)是由俄国数学家格奥尔吉·沃罗诺伊建立的空间分割算法。灵感来源于笛卡尔用凸域分割空间的思想。在几何,晶体学建筑学,地理学,气象学,信息系统等许多领域有广泛的应用。 泰森多边形法,荷兰气候学家A·H·Thiessen提出了一种根据离散分布的气象站的降雨量,来计算平均降雨量的方法,即将所有相邻