首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
thunlp专题
[ THUNLP-MT(9/10) ] Neural Machine Translation of Rare Words with Subword Units | Byte Pair Encoding
Sennrich在ACL’2016发表的论文,主要研究神经机器翻译模型中的未登录词问题,提出了Byte Pair Encoding方法,同时该方法也解决了词表过大的问题。本文在介绍Sennrich的研究工作的基础上,也介绍了中文对于未登录词的相关方法。 论文传送门 引用次数:944 文章目录 论文内容》问题》目标:不需要 back-off model 来解决未登录词问题》相关工作介绍及论点
阅读更多...