语音驱动的口型同步算法文献汇总

2024-02-16 03:40

本文主要是介绍语音驱动的口型同步算法文献汇总,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文一:语音驱动的口型同步算法
核心工作:提出一种口型动画同步算法,预先定义基本口型动作集合,通过权重线性混合构成口型动画和过渡动画,最终拼接得到完整口型动画。
音素:输入的语音信号首先被转化为由一串发音单元构成的序列,这些发音单元成为音素。
视素:序列中的音素会被映射到一个口型动作单元上,这些口型动作单元成为视素。
协同发音:
1. 难题:除了当前正在发音的音素外,该音素之前或之后的一些音素也会对当前口型动作产生影响的现象。
2. 解法:程序式,对音素优先级制定规则;物理模型,模拟脸部与嘴唇肌肉的作用;数据驱动,采集大量数据并进行匹配;机器学习,基于GMM-HMM等模型方法学习。
算法描述:
1. 预处理:
(1) 音素分类:基于Timit音素表合并到16个基本音素集合;
(2)定义音素对应的口型动画:通过FaceGen建模六种基本口型;
(3)权重推导,曲线分为稳定阶段与变化阶段,稳定阶段在前,变化阶段T一般为30-50ms。
2. 运行阶段:
(1)分析语音信号获得音素序列:常用Festival、Julius系统
(2)音素序列的映射:讨论映射的动画片段 >和< 变化阶段T的情况
(3)过渡动画拼接:线性插值算法

论文二:基于加权算法的汉语语音同步三维口型动画研究
核心工作:提出一种综合了汉语拼音发音的口型变化规律和标点的时间控制的声韵加权控制算法;口型过渡动画用余弦插值方法合成序列。
在这里插入图片描述
实现步骤:
1. 输入汉语文本
2. 将文本转换为汉语拼音
3. 从文本产生合成语音的样本
4. 询问音频处理器,从语音播放处理器中决定当前音素
5. 从当前音节的轨迹中计算出目前口型
6. 合成语音同步的口型并且同步图形展示,返回4
音画同步:
1. 初始化音频服务器,返回开始时间
2. 播放样本序列,返回样本时间、服务器时间,
3. 计算出的相关动画驱动时间
4. 面部图形更新,渲染并播放
声韵加权控制算法:
1. 定义音素表:合并定义声、韵母以及单独出现的韵母的口型动作单元
2. 基本口型动画合成:按照声、韵母发音时长比例,标点停顿等特点合成;过渡动画根据唇部肌肉模型计算。
在这里插入图片描述

这篇关于语音驱动的口型同步算法文献汇总的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/713397

相关文章

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

详谈redis跟数据库的数据同步问题

《详谈redis跟数据库的数据同步问题》文章讨论了在Redis和数据库数据一致性问题上的解决方案,主要比较了先更新Redis缓存再更新数据库和先更新数据库再更新Redis缓存两种方案,文章指出,删除R... 目录一、Redis 数据库数据一致性的解决方案1.1、更新Redis缓存、删除Redis缓存的区别二

Java 枚举的常用技巧汇总

《Java枚举的常用技巧汇总》在Java中,枚举类型是一种特殊的数据类型,允许定义一组固定的常量,默认情况下,toString方法返回枚举常量的名称,本文提供了一个完整的代码示例,展示了如何在Jav... 目录一、枚举的基本概念1. 什么是枚举?2. 基本枚举示例3. 枚举的优势二、枚举的高级用法1. 枚举

Nacos集群数据同步方式

《Nacos集群数据同步方式》文章主要介绍了Nacos集群中服务注册信息的同步机制,涉及到负责节点和非负责节点之间的数据同步过程,以及DistroProtocol协议在同步中的应用... 目录引言负责节点(发起同步)DistroProtocolDistroSyncChangeTask获取同步数据getDis

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个