读Glove论文笔记

2024-03-21 08:10
文章标签 笔记 论文 glove

本文主要是介绍读Glove论文笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.Glove 背景介绍

《Glove: Global Vectors for Word Representation》

# 1.论文导读

1.论文的背景知识

词的表示方法

  • 矩阵分解方法

    (Matrix Factorization Methods)

    词共现矩阵

    1. I enjoy flying 。
    2. I like NLP。
    3. I like deep learning。

    image

    缺点: 在词对推理任务上表示特别差。

  • 基于上下文的向量学习方法

    (Shallow Window-Based Methods)

    Word2Vec

    image

    缺点:无法使用全局的统计信息。

2. 论文的研究成果

  • 在词对推理数据集上取得最好的结果
  • 公布了一系列基于Glove 的预训练词向量

image

3.Glove历史意义

  • 推动了基于深度学习的自然语言处理的发展

image

image

2.论文精度

1.论文结构

  • 论文总览

image

  • 论文摘要

    1. 当前词向量学习模型能够通过向量的算术计算捕捉词之间细微的语法和语义规律,但是这种规律背后的原理依旧不清楚
    2. 经过仔细的分析,我们发现了一些有助于这种词向量规律的特性,并基于词提出了一种新的对数双线性回归模型,这种模型能够利用全局矩阵分解和局部上下文的优点来学习词向量。
    3. 我们的模型通过只在共线矩阵中的非0位置训练达到高效训练的目的。
    4. 我们的模型在词对推理任务上得到75%的准确率,并且在多个任务上得到最优结果。
  • 论文的小标题

  1. Introduction

  2. Related Work

    2.1 Matrix Factorization Methods

    2.2 Shallow Window Based Methods

  3. The GloVe Model

    3.1 Relationship to Other Models

    3.2 Complexity of the model

  4. Experiments

    4.1 Evaluation methods

    4.2 Corpora and training details

    4.3 Results

    4.4 Model Analysis: Vector Length and Context Size

    4.5 Model Analysis: Corpus Size

    4.6 Model Analysis: Run-time

    4.7 Model Analysis : Comparison with word2vec

  1. Conclusion

2. GloVe 模型

image

观察分析

原理:我们可以使用一些词来描述一个词,比如我们使用冰块和蒸汽来描述固体、气体、水和时尚四个词。

  • 与冰块接近,并且和蒸汽不接近:固体并且概率比值很大
  • 与蒸汽接近,并且和冰块不接近:气体并且概率比值很小
  • 与冰块和蒸汽都不接近: 水和时尚并且概率比值不大不小

结论:共线矩阵的概率比值可以用来区分词。

image

3. 公式推导

image

image

  • 求得的损失函数

image

  • 原理:词对出现次数越多,那么这两个词在loss函数中的影响越大。

f(Xij)需要满足:

  1. Xij=0时, f(Xij) = 0 : 表示没有共线过的权重为0, 不参加训练
  2. 非减函数,因为共线次数越多,权重越大
  3. f(Xij)不能无限制的大,防止is, are, the的影响

image

image

3. 实验结果分析

  • 在词对推理数据集上取得最好得结果

image

  • 多个词相似度任务上取得最好得结果

    image

  • 命名实体识别实验结果

image

  • 向量长度对结果的影响
  • 窗口大小对结果的影响

image

  • 训练语料对结果的影响

image

  • 和Word2vec对比实验

image

4.论文总结

1.解词向量学习方法

  • 基于上下文的词向量学习方法
  • 预训练词向量

2.创新点

  • 提出了一种新的词向量训练模型-- Glove
  • 在多个任务上取得最好的结果
  • 公布了一系列预训练的词向量

3. 启发点

  • 相对于原始的概率,概率的比值更能够区分相关的词和不相关的词,并且能够区分两种相关的词。
  • 提出了一种新的对数双线性回归模型,这种模型结合全局矩阵分解和局部上下文的优点。

这篇关于读Glove论文笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/832171

相关文章

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓

忽略某些文件 —— Git 学习笔记 05

忽略某些文件 忽略某些文件 通过.gitignore文件其他规则源如何选择规则源参考资料 对于某些文件,我们不希望把它们纳入 Git 的管理,也不希望它们总出现在未跟踪文件列表。通常它们都是些自动生成的文件,比如日志文件、编译过程中创建的临时文件等。 通过.gitignore文件 假设我们要忽略 lib.a 文件,那我们可以在 lib.a 所在目录下创建一个名为 .gi