本文主要是介绍NLP之TEA:自然语言处理之文本情感分析/文本情感分类的简介、算法、应用、实现流程方法、案例应用之详细攻略,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
NLP之TEA:自然语言处理之文本情感分析/文本情感分类的简介、算法、应用、实现流程方法、案例应用之详细攻略
目录
TEA的简介
1、TEA的概述
2、实现方法
T1、基于统计的方法
TEA的案例应用
TEA的简介
1、TEA的概述
简介 | 文本情感分析:又称意见挖掘、倾向性分析等。简单而言,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。 |
应用场景 | 自然语言处理的一个关键问题:判断一句评价/点评/影评的正/负倾向性 留言评论:互联网(如博客和论坛以及社会服务网络如大众点评)上产生了大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。基于此,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。 |
实现思路 | T1、类别输出:输出一段文本之后的正、负类别 T2、得分输出:输出一段文本之后的分数值(0~1分值) |
情感分析架构流程 | |
有很多开源软件使用机器学习、统计、自然语言处理的技术来计算大型文本集的情感分析, 这些大型文本集合包括网页、网络新闻、网上讨论群、网络评论、博客和社交媒介。 | |
具体案例 |
|
2、实现方法
T1、基于统计的方法
简介 | |
思路 | 第一步、读取评论数据,利用jieba库对评论进行分句。 第二步、查找对分句的情感词,记录积极还是消极,以及位置。 第三步、往情感词前查找程度词,找到就停止搜寻。为程度词设权值,乘以情感值。 第四步、往情感词前查找否定词,找完全部否定词,若数量为奇数,乘以-1,若为偶数,乘以1。 第五步、判断分句结尾是否有感叹号,有叹号则往前寻找情感词,有则相应的情感值+2。 第六步、计算完一条评论所有分句的情感值,用数组(list)记录起来。 第七步、通过分句计算每条评论的积极情感均值,消极情感均值,积极情感方差,消极情感方差。 |
TEA的案例应用
NLP之TEA:基于SnowNLP实现自然语言处理之对输入文本进行情感分析(分词→词性标注→情感分析→测试)
这篇关于NLP之TEA:自然语言处理之文本情感分析/文本情感分类的简介、算法、应用、实现流程方法、案例应用之详细攻略的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!