本文主要是介绍情感词生成 [opinion mining],希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
我们知道,在情感挖掘中,主要有情感分类(Sentiment Classification)和情感抽取(Opinion Extraction)。对于文档情感分类,一般是构造特征向量来进行分类或是聚类。也有通过计算文档中词的情感分数来获取文档的情感极性,然而这种方法用的不多,效果也不佳。但是对于句子级别的情感挖掘,由于特征少,情感分类效果没有那么理想,而句子的情感往往是由句子中的几个情感词决定。因而获取情感 词在情感挖掘中很有用。而构造情感词典(sentiment lexicon)往往也是许多无监督学习方法中的首要一步。
通常从情感角度来说,一个词可以分为三类:褒义词、中性词、贬义词。然而,由于语境的不同,领域的不同,同样一个词,其情感极性可能就不同。例如:(http://zhidao.baidu.com/question/159946153)
“灯红酒绿”有两个意思,它既可形容寻欢作乐的腐化生活,是贬义词;也可形容都市或娱乐场所的繁华景象,是褒义词
有时甚至在同一领域由于语境同一词的情感极性也不同。例如照相机的评论:
电池寿命很长。(正)
需要很长时间聚焦。(负)
以下介绍几种判断词情感的早期的比较经典的方法,主要有基于词典的方法和基于语料的方法。后发现刘兵编的《web数据挖掘》中文版320页的倒数第二段有总结的更典型的参考文献。
利用词典:
1.极词性扩展(近义词、反义词
这篇关于情感词生成 [opinion mining]的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!