本文主要是介绍机器学习(10)-NLP自然语言处理大量餐馆评论,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1.NLP是什么
自然语言处理
用于对文本的分类
用于对中英文的互相翻译
用于打字时候的自动纠错
垃圾邮件过滤
…
1.1本次的目标
这次学习是1000个英文的对一餐馆的评价,以及手动分类的结果,看一下是正面还是负面的评价。
用NLP算法自动辨别评价的好坏,当在拿到一个评价时,就可以自动进行好坏的分类了。
这次要做的就是对评论就行分类,完成以后可以拓展到文本文章英文报道等进行应用。
1.2观察数据
打开评论的tsv文件(文本很特殊,特殊的表单符号被处理)1正面评论、2负面评论,都是手动添加
2.NLP源码分析
2.1.导入数据,利用panda
导入tsv文件,分隔符是‘Tab’,就是‘\t’
quoting = 3:去除引号
dataset = pd.read_csv('R_Reviews.tsv', delimiter = '\t', quoting = 3)
从Spyder中的Variable explorer
这篇关于机器学习(10)-NLP自然语言处理大量餐馆评论的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!