Github:NLP相关代码、书目、论文、博文、算法、项目资源(附链接)

2024-04-13 23:32

本文主要是介绍Github:NLP相关代码、书目、论文、博文、算法、项目资源(附链接),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=png

来源:AINLP

本文多资源,建议阅读6分钟

本文为你推荐Github上一个NLP相关的项目:msgi/nlp-journey。


推荐Github上一个NLP相关的项目:

msgi/nlp-journey

项目地址,阅读原文可以直达,欢迎参与和Star:https://github.com/msgi/nlp-journey


这个项目的作者是AINLP交流群里的慢时光同学,该项目收集了NLP相关的一些代码, 包括词向量(Word Embedding)、命名实体识别(NER)、文本分类(Text Classificatin)、文本生成、文本相似性(Text Similarity)计算等,基于keras和tensorflow,也收集了相关的书目、论文、博文、算法、项目资源链接,并且很细致的做了分类。


以下来自该项目介绍页,点击阅读原文可以直达相关资源链接。


基础算法


  • 基础知识

  • 常见问题

  • 实践笔记


经典书目


  • Deep Learning 深度学习必读

  • 斯坦福大学《语音与语言处理》第三版:NLP必读

  • Neural Networks and Deep Learning 入门必读

  • 复旦大学《神经网络与深度学习》邱锡鹏教授

  • CS224d: Deep Learning for Natural Language Processing


必读论文


  • EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks

  • A Neural Probabilistic Language Model

  • Transformer

  • Transformer-XL

  • Convolutional Neural Networks for Sentence Classification

  • Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification

  • A Question-Focused Multi-Factor Attention Network for Question Answering

  • AutoCross: Automatic Feature Crossing for Tabular Data in Real-World Applications

  • GloVe: Global Vectors for Word Representation

  • A Deep Ensemble Model with Slot Alignment for Sequence-to-Sequence Natural Language Generation

  • The Design and Implementation of XiaoIce, an Empathetic Social Chatbot

  • A Knowledge-Grounded Neural Conversation Model

  • Neural Generative Question Answering

  • A Sensitivity Analysis of (and Practitioners’ Guide to) Convolutional Neural Networks for Sentence Classification

  • ImageNet Classification with Deep Convolutional Neural Networks

  • Network In Network

  • Long Short-term Memory

  • Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

  • Get To The Point: Summarization with Pointer-Generator Networks

  • Generative Adversarial Text to Image Synthesis

  • Image-to-Image Translation with Conditional Adversarial Networks

  • Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network

  • Unsupervised Learning of Visual Structure using Predictive Generative Networks

  • Learning to Rank Short Text Pairs with Convolutional Deep Neural Networks

  • Event Extraction via Dynamic Multi-Pooling Convolutional Neural

  • Low-Memory Neural Network Training:A Technical Report

  • Language Models are Unsupervised Multitask Learners

  • Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

  • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

  • SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient


必读博文


  • The Illustrated Transformer

  • Attention-based-model

  • KL divergence

  • Building Autoencoders in Keras

  • Modern Deep Learning Techniques Applied to Natural Language Processing

  • Node2vec embeddings for graph data

  • Bert解读

  • 难以置信!LSTM和GRU的解析从未如此清晰(动图+视频)


已实现算法


  •  构建词向量

  •  fasttext(skipgram+cbow)

  •  gensim(word2vec)

  •  数据增强

  •  eda

  •  分类算法

  •  svm

  •  fasttext

  •  textcnn

  •  bilstm+attention

  •  rcnn

  •  han

  •  NER

  •  bilstm+crf

  •  文本相似度

  •  siamese


相关github项目


  • keras-gpt-2

  • textClassifier

  • attention-is-all-you-need-keras

  • BERT_with_keras

  • SeqGAN


相关博客


  • 莫坠青云志

  • 彗双智能-Keras源码分析

  • 机器之心

  • colah

  • ZHPMATRIX

  • wildml

  • 徐阿衡

  • 零基础入门深度学习


相关会议


  • Association of Computational Linguistics(ACL). 计算语言学协会

  • Empirical Methods in Natural Language Processing(EMNLP)

  • International Conference on Computational Linguistics(COLING)

  • Neural Information Processing Systems(NIPS). 神经信息处理系统会议

  • AAAI Conference on Artificial Intelligence(AAAI)

  • International Joint Conferences on AI(IJCAI)

  • International Conference on Machine Learning(ICML). 国际机器学习大会


编辑:文婧

校对:龚力

640?wx_fmt=jpeg

这篇关于Github:NLP相关代码、书目、论文、博文、算法、项目资源(附链接)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901517

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来

安卓链接正常显示,ios#符被转义%23导致链接访问404

原因分析: url中含有特殊字符 中文未编码 都有可能导致URL转换失败,所以需要对url编码处理  如下: guard let allowUrl = webUrl.addingPercentEncoding(withAllowedCharacters: .urlQueryAllowed) else {return} 后面发现当url中有#号时,会被误伤转义为%23,导致链接无法访问