使用baidu_speech让你的机器人开口说话 语音交互

2024-02-20 18:10

本文主要是介绍使用baidu_speech让你的机器人开口说话 语音交互,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


参考张瑞雷老师的博文
在ROS中使用中文语音交互(百度语音baidu_speech)
http://blog.csdn.net/zhangrelay/article/details/78867450

百度语音包
http://wiki.ros.org/baidu_speech
https://github.com/DinnerHowe/baidu_speech


语音节点订阅了speak_string主题。
如图


向主题发布文本字符串 就可以听到文本的语音了。
语音节点应该是将字符串发送给后台接口传回mp3保存并播放。

this package is python package for ROS speech, which use online baidu speech to do TTS and speech recognition.
this code is run well in ubuntu 14.04, thinkpad T44s.
you can visit the baidu speech home page at here: http://yuyin.baidu.com/

并且这个包可以做在线的语音识别。

可以在识别节点把识别出的文本发布到speak_string话题。这样就可以同时测试speech recognition和tts两个功能了。





安装两个必须的Python库pyaudio和python-vlc(安装vlc遇到问题见下文)

$ sudo apt-get install python-pip portaudio19-dev vlc libvlc-dev

$ sudo pip install pyaudio

$ sudo pip install python-vlc

下载包并编译完成


在运行Python程序时提示:

 import requests
 ImportError: No module named requests

解决

Requests is not a built in module, so you will have to download it. You can get it here:https://pypi.python.org/pypi/requests

$ sudo pip install requests



错误
requests.exceptions.InvalidHeader:Value for header{Content-length:37523} must be of type str or bytes, not <type 'int'>
解决
voice_node.py

HTTP_HEADER=          {  'Content-Type':      'audio/%s;rate=%s'%(self.FORMAT,self.SAMPLING_RATE),'Content-length':    len(json.dumps(RegData))}#改为
HTTP_HEADER=          {  'Content-Type':      'audio/%s;rate=%s'%(self.FORMAT,self.SAMPLING_RATE),'Content-length':    str(len(json.dumps(RegData)))}


错误
KeyError 3312
解决

 
def define(self):self.error_reason={3300:      '输入参数不正确',3301:      '识别错误',3302:      '验证失败',3303:      '语音服务器后端问题',3304:      '请求 GPS 过大,超过限额',3305:      '产品线当前日请求数超过限额',3312:      'param format invalid'}






ros版本kinetic
系统是ubuntu 16.04
其中 vlc 出错

下列软件包有未满足的依赖关系:
 vlc : 依赖: libgles1-mesa (>= 7.8.1) 但是它将不会被安装 或
               libgles1
E: 无法修正错误,因为您要求某些软件包保持现状,就是它们破坏了软件包间的依赖关系。
解决

http://ubuntuhandbook.org/index.php/2017/05/install-vlc-2-2-5-in-ubuntu-16-04-14-04/

引用

How to Install VLC 2.2.5 in Ubuntu / Linux Mint:

Besides building VLC 2.2.5 from the source tarball, Ubuntu 14.04, 16.04, and Linux mint 18 users can install it from the unofficial PPA.

1. Open terminal via Ctrl+Alt+T or by searching “Terminal” from start menu. When it opens, run command to add PPA:

sudo add-apt-repository ppa:jonathonf/vlc

Type in your password (no visual feedback due to security reason) when prompts and hit Enter.

VLC 2.2.5 PPA

2. (IMPORTANT) Remove old VLC version to avoid a package conflict:

sudo apt remove vlc vlc-nox

3. Finally run commands in terminal to check updates and install VLC 2.2.5:

sudo apt update && sudo apt install vlc

How to Restore:

To restore VLC media player to the stock version in your main Ubuntu repository, run command to purge the PPA:

sudo apt install ppa-purge && sudo ppa-purge ppa:jonathonf/vlc








这篇关于使用baidu_speech让你的机器人开口说话 语音交互的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/729082

相关文章

详解Vue如何使用xlsx库导出Excel文件

《详解Vue如何使用xlsx库导出Excel文件》第三方库xlsx提供了强大的功能来处理Excel文件,它可以简化导出Excel文件这个过程,本文将为大家详细介绍一下它的具体使用,需要的小伙伴可以了解... 目录1. 安装依赖2. 创建vue组件3. 解释代码在Vue.js项目中导出Excel文件,使用第三

Linux alias的三种使用场景方式

《Linuxalias的三种使用场景方式》文章介绍了Linux中`alias`命令的三种使用场景:临时别名、用户级别别名和系统级别别名,临时别名仅在当前终端有效,用户级别别名在当前用户下所有终端有效... 目录linux alias三种使用场景一次性适用于当前用户全局生效,所有用户都可调用删除总结Linux

java图像识别工具类(ImageRecognitionUtils)使用实例详解

《java图像识别工具类(ImageRecognitionUtils)使用实例详解》:本文主要介绍如何在Java中使用OpenCV进行图像识别,包括图像加载、预处理、分类、人脸检测和特征提取等步骤... 目录前言1. 图像识别的背景与作用2. 设计目标3. 项目依赖4. 设计与实现 ImageRecogni

python管理工具之conda安装部署及使用详解

《python管理工具之conda安装部署及使用详解》这篇文章详细介绍了如何安装和使用conda来管理Python环境,它涵盖了从安装部署、镜像源配置到具体的conda使用方法,包括创建、激活、安装包... 目录pytpshheraerUhon管理工具:conda部署+使用一、安装部署1、 下载2、 安装3

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

关于@MapperScan和@ComponentScan的使用问题

《关于@MapperScan和@ComponentScan的使用问题》文章介绍了在使用`@MapperScan`和`@ComponentScan`时可能会遇到的包扫描冲突问题,并提供了解决方法,同时,... 目录@MapperScan和@ComponentScan的使用问题报错如下原因解决办法课外拓展总结@

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的

使用Python实现在Word中添加或删除超链接

《使用Python实现在Word中添加或删除超链接》在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能,本文将为大家介绍一下Python如何实现在Word中添加或... 在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能。通过添加超

Linux使用fdisk进行磁盘的相关操作

《Linux使用fdisk进行磁盘的相关操作》fdisk命令是Linux中用于管理磁盘分区的强大文本实用程序,这篇文章主要为大家详细介绍了如何使用fdisk进行磁盘的相关操作,需要的可以了解下... 目录简介基本语法示例用法列出所有分区查看指定磁盘的区分管理指定的磁盘进入交互式模式创建一个新的分区删除一个存