【信息技术】【2009.11】自动情感识别:声学和韵律参数的研究

本文主要是介绍【信息技术】【2009.11】自动情感识别:声学和韵律参数的研究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

本文为澳大利亚新南威尔士大学(作者:Vidhyasaharan Sethu)的博士论文,共186页。

实现具有人与人之间通信自然性的人机语音通信的一个重要步骤是开发一种能够基于语音识别情感的机器。本文利用声学和韵律信息对这一问题进行了研究。在特征层次上,提出了新的群时延和加权频率特征。群延迟特征被显示为强调与共振峰带宽相关的信息,并且被显示为情绪表示。基于最近引入的经验模态分解,提出将加权频率特征作为谱能量分布的一种紧凑表示,并证明其优于其他能量分布估计。特征级比较表明,详细的频谱测量非常能反映情绪,同时表现出更大的说话人差异性。此外,研究还表明,所有特征都是说话人的表征,在多说话人情况下使用这些特征之前,需要进行某种标准化。提出了一种新的说话人特征可变性归一化方法,该方法显著提高了基于不同说话人数据训练和测试的系统性能。这项技术也被用来研究不同特征中特定于说话人的变异量。语音变异性的初步研究表明,特定音位的特征不受情感模型的影响,说话人的变异性在所研究的情境中是一个更重要的问题。最后,分析了一种考虑语音参数时间变化的情感建模方法。在传统的信源滤波模型的基础上,引入了声门频谱的显式模型,并利用该模型的参数来表征语音信号。一个自动情感识别系统应考虑到这些参数随时间变化的轮廓形状,才能显示出优于一个只建立参数分布模型的系统。这一新方法也被经验证明与人类情感分类的表现不相上下。

An essential step to achievinghuman-machine speech communication with the naturalness of communicationbetween humans is developing a machine that is capable of recognising emotionsbased on speech. This thesis presents research addressing this problem, bymaking use of acoustic and prosodic information. At a feature level, novelgroup delay and weighted frequency features are proposed. The group delayfeatures are shown to emphasise information pertaining to formant bandwidthsand are shown to be indicative of emotions. The weighted frequency feature,based on the recently introduced empirical mode decomposition, is proposed as acompact representation of the spectral energy distribution and is shown tooutperform other estimates of energy distribution. Feature level comparisonssuggest that detailed spectral measures are very indicative of emotions whileexhibiting greater speaker specificity. Moreover, it is shown that all featuresare characteristic of the speaker and require some of sort of normalisationprior to use in a multi-speaker situation. A novel technique for normalisingspeaker-specific variability in features is proposed, which leads tosignificant improvements in the performances of systems trained and tested ondata from different speakers. This technique is also used to investigate theamount of speaker-specific variability in different features. A preliminarystudy of phonetic variability suggests that phoneme specific traits are notmodelled by the emotion models and that speaker variability is a moresignificant problem in the investigated setup. Finally, a novel approach toemotion modelling that takes into account temporal variations of speechparameters is analysed. An explicit model of the glottal spectrum isincorporated into the framework of the traditional source-filter model, and theparameters of this combined model are used to characterise speech signals. Anautomatic emotion recognition system that takes into account the shape of thecontours of these parameters as they vary with time is shown to outperform asystem that models only the parameter distributions. The novel approach is alsoempirically shown to be on par with human emotion classification performance.

  1. 引言
  2. 语音与情感
  3. 语音特征
  4. 说话人可变性
  5. 静态分类方法
  6. 情感识别的语音参数化
  7. 结论与未来工作展望

更多精彩文章请关注公众号:在这里插入图片描述

这篇关于【信息技术】【2009.11】自动情感识别:声学和韵律参数的研究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/294127

相关文章

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

Java通过反射获取方法参数名的方式小结

《Java通过反射获取方法参数名的方式小结》这篇文章主要为大家详细介绍了Java如何通过反射获取方法参数名的方式,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、前言2、解决方式方式2.1: 添加编译参数配置 -parameters方式2.2: 使用Spring的内部工具类 -

Go Mongox轻松实现MongoDB的时间字段自动填充

《GoMongox轻松实现MongoDB的时间字段自动填充》这篇文章主要为大家详细介绍了Go语言如何使用mongox库,在插入和更新数据时自动填充时间字段,从而提升开发效率并减少重复代码,需要的可以... 目录前言时间字段填充规则Mongox 的安装使用 Mongox 进行插入操作使用 Mongox 进行更

C语言中自动与强制转换全解析

《C语言中自动与强制转换全解析》在编写C程序时,类型转换是确保数据正确性和一致性的关键环节,无论是隐式转换还是显式转换,都各有特点和应用场景,本文将详细探讨C语言中的类型转换机制,帮助您更好地理解并在... 目录类型转换的重要性自动类型转换(隐式转换)强制类型转换(显式转换)常见错误与注意事项总结与建议类型

C#使用DeepSeek API实现自然语言处理,文本分类和情感分析

《C#使用DeepSeekAPI实现自然语言处理,文本分类和情感分析》在C#中使用DeepSeekAPI可以实现多种功能,例如自然语言处理、文本分类、情感分析等,本文主要为大家介绍了具体实现步骤,... 目录准备工作文本生成文本分类问答系统代码生成翻译功能文本摘要文本校对图像描述生成总结在C#中使用Deep

IDEA如何让控制台自动换行

《IDEA如何让控制台自动换行》本文介绍了如何在IDEA中设置控制台自动换行,具体步骤为:File-Settings-Editor-General-Console,然后勾选Usesoftwrapsin... 目录IDEA如何让控制台自http://www.chinasem.cn动换行操作流http://www

vscode保存代码时自动eslint格式化图文教程

《vscode保存代码时自动eslint格式化图文教程》:本文主要介绍vscode保存代码时自动eslint格式化的相关资料,包括打开设置文件并复制特定内容,文中通过代码介绍的非常详细,需要的朋友... 目录1、点击设置2、选择远程--->点击右上角打开设置3、会弹出settings.json文件,将以下内

Python调用另一个py文件并传递参数常见的方法及其应用场景

《Python调用另一个py文件并传递参数常见的方法及其应用场景》:本文主要介绍在Python中调用另一个py文件并传递参数的几种常见方法,包括使用import语句、exec函数、subproce... 目录前言1. 使用import语句1.1 基本用法1.2 导入特定函数1.3 处理文件路径2. 使用ex

Python脚本实现自动删除C盘临时文件夹

《Python脚本实现自动删除C盘临时文件夹》在日常使用电脑的过程中,临时文件夹往往会积累大量的无用数据,占用宝贵的磁盘空间,下面我们就来看看Python如何通过脚本实现自动删除C盘临时文件夹吧... 目录一、准备工作二、python脚本编写三、脚本解析四、运行脚本五、案例演示六、注意事项七、总结在日常使用