论文笔记 | MathDQN: Solving Arithmetric Word Problems via Deep Reinforcement Learning

本文主要是介绍论文笔记 | MathDQN: Solving Arithmetric Word Problems via Deep Reinforcement Learning，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

简介

Lei Wang 和 Dongxiang Zhang团队在AAAI18上发表的文章，使用了DQN来解决MWP(Math Word Problem)问题。

在将问题表达成一个表达式树的时候，有一种方法是枚举所有的操作数，组成树的叶子节点。这种方法所需的搜索空间很大，虽然有一些剪枝的算法可以运用，但仍不能满足需求。

在实践中，可以发现Deep Q-netwrok能够处理搜索空间很大的问题。比如：游戏场景。

所以本文想要用deep Q-network来解决math word problem。

在这里插入图片描述

文中使用的数据集规模较小，三个数据集中都包含少于1000个题目。17年发表的文章DNS中提供的较大规模数据集Math23K已经被广泛使用，但这里没有用到。【是否能适用于大规模数据，需要根据代码进一步确定。】

这篇关于论文笔记 | MathDQN: Solving Arithmetric Word Problems via Deep Reinforcement Learning的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！