首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
音素专题
一周涨粉772万,抖音素人选秀,这次火的是郭有才
抖音素人大舞台,这次火的是郭有才。 根据新榜上周统计的涨粉数据显示,2024年5月13日到2024年5月19日“郭有才(菏泽树哥)”涨粉超772万,位列当周涨粉榜第一。 郭有才有多火? 他在菏泽南站前直播唱歌,吸引来了全国的主播和游客,使早已停运的南站小广场成为抖音直播的焦点,更让菏泽市两度为其定制专享服务。 先是“迎”,菏泽市聘郭有才为菏泽市文化旅游推荐官,重新铺设了
阅读更多...
音素(phone)
参考百度百科的解释: https://baike.baidu.com/item/%E9%9F%B3%E7%B4%A0/5689615
阅读更多...
使用共振峰提取元音音素/从声音生成口型动画
视频效果 我前段时间研究了下从声音提取共振峰的方法。今天测试了下实际效果。 我使用一段33秒的女声视频,提取元音后使用静态视位图序列生成了一个视频,效果如下: b站视频: https://www.bilibili.com/video/BV1JD421H7m9/?vd_source=8abb7f0122649239c41b4c8acf458e47 https://www.bilibili.co
阅读更多...
kaldi中修改phones中音素个数
在工程项目中,有一天项目组说我们做语音评测的不需要这么多音素来表示,我们的产品英语语音评测是参考libirispeech中的脚本来修改的,默认是有360多个音素来表示的,查看phones.txt文件中,发现实际上音素包含有位置信息。 kaldi中修改音素个数,将脚本中prepare_lang.sh中设置position-dependent-phones false 即可。 utils/prepa
阅读更多...