本文主要是介绍nlp-形式语言与自动机-ch09-词义消歧,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1、词义消歧方法分为:监督的和无监督的。
2、有监督的语义消歧方法:基于互信息的消歧方法:
基本思路:对每个需要消歧的多义词寻找一个上下文特征,这个特征能够可靠地指示该多义词在特定上下文语境中使用的是哪种语义。
3、有监督的语义消歧方法:基于贝叶斯分类器的消歧方法:
基本思路:在双语语料库中多义词的翻译(语义)取决于该词所处的上下文语境c,
4、基于义类辞典的消歧方法:
基本思想:多义词的不同义项在使用时往往具有不同的上下文语义类,也就是说,通过上下文的语义范畴可以判断多义词的使用义项。
5、无监督的词义消歧方法:
严格地讲,利用完全无监督的消歧方法进行词义标注是不可能的,因为词义标注毕竟需要提供一些关于语义特征的描述信息。但是词义辨识却可以利用完全无监督的机器学习方法实现。
这篇关于nlp-形式语言与自动机-ch09-词义消歧的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!