cs224n Lecture 3: GloVe skipgram cbow lsa 等方法对比 / 词向量评估 /超参数调节总结

本文主要是介绍cs224n Lecture 3: GloVe skipgram cbow lsa 等方法对比 / 词向量评估 /超参数调节总结，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

生成词向量的方法

以前大致有两种方法：

①是Matrix Factorization Method，主要代表是SVD Based的LSA等方法，核心是对共现矩阵（co-occurence）进行SVD（奇异值）分解，得到词向量。

②是Iteration Based Method（Shallow window-based），主要代表是上节课讲到的Skip-Gram和CBOW。核心是概率，通过设置滑窗、中心词、找到语境词，对语料进行循环、迭代，使概率最大。

而最新的是：

③GloVe模型（Global Vectors，全局向量），把上述两种方法结合了一下，克服了两者的弱点。

SVD Based

SVD Based的种类

①是基于词库（Word document）的。这个词库，也就是不同的类别，比如有动物类别（dog/cat/pig等），细分一点，还可以分为哺乳动物、啮齿动物、鸟类等等。然后，把单词表的每一个单词，进行分类：比如"bank银行"、"bonds债务"、"stocks股份"、"money钱"，它们很明显都会分到"finance金融"这个类，以此类推。最终形成了一个庞大矩阵（类别数量M*单词表数量V）。很明显，类别分得越细（M越大）、词量越大（V越大），效果越好，但带来的坏处是，矩阵将会十分十分庞大，而对其进行SVD分解，更耗费时间和计算机资源！显然需要改进。

②除了用上述“分类”的方法来构建共现矩阵外，还可以使用类似Skip-Gram的“滑窗”来构建，这也就是基于滑窗的方法，看一个例子：

假设我们有一个很简单的语料，三个句子：