机器人语音聊天绕坑

2024-08-27 08:52
文章标签 机器人 聊天 语音 绕坑

本文主要是介绍机器人语音聊天绕坑,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

为了给机器人添加语音,网上淘了一块离线语音芯片,用过之后就有些后悔了。离线语音定制性比较差,有150句限制,而且与大模型接驳需要一块额外的esp8266或者esp32。如果使用了esp32,事实上可以自己制作离线语音,还能轻松处理与大模型之间的衔接。

离线谙音模块了有很多优点,导入速度比较快,插几根杜邦线或者焊几根线就能接入,不用考虑音频采样,积别和分析,对话比较流畅,不会因为网线不好而中断,特别适合在家里控制使用,比如接上温湿计,接上红外,就能在家里开空调,读取室内温度,适合快速成型的项目,不需要写代码,使用可视化模块化开发。

离线语音模块除了电源四个引脚和喇叭两个引脚,还有10个引脚,不接其他mcu就可以实现一些简单的机器人功能,因为本身带咪点,就可以听话,带喇叭就可以说话,接个T FT屏就可以做一些简单的表情动画,彩屏除了电源接口还用去六个引脚,剩下四个引脚接四个舵机,就能跑路,如果希望多一些功能,可以把彩屏换成oled屏,OLED除了电源只需要两个引脚就能驱动,又能节省四个引脚,接入温湿度传感器,就可以获取室内温湿度,接入红外收发,就可以做个红外遥控器。如果希望莉取网络时间和实时的天气信息,就需要留两个引脚接个esp32或者esp8266,这样能接的设备就又变多了。不过感觉又有些多余,不如直接使用esp8266和esp32接入百度或者讯飞。

在别人代码基础上写了一个简单的语音模块。150限制有些少,同一个功能为了增加趣味性需要使用各种问话方式。这是一个简单的通过对话读取温度湿度并在屏幕显示的demo。使用提供的工具拖块开发,感觉效率不如写代码快,直接写代码好像无法保存,也不知道啥原因。顺手研究一下最近流行的可视化编程,就是个工具使用,但太费时间,

按代码连接引脚就可以,效果如下,使用语音启动,对话应该编的可笑一些,比如笑一个。

这篇关于机器人语音聊天绕坑的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1111208

相关文章

利用Python编写一个简单的聊天机器人

《利用Python编写一个简单的聊天机器人》这篇文章主要为大家详细介绍了如何利用Python编写一个简单的聊天机器人,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 使用 python 编写一个简单的聊天机器人可以从最基础的逻辑开始,然后逐步加入更复杂的功能。这里我们将先实现一个简单的

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

基于人工智能的智能家居语音控制系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 随着物联网(IoT)和人工智能技术的发展,智能家居语音控制系统已经成为现代家庭的一部分。通过语音控制设备,用户可以轻松实现对灯光、空调、门锁等家电的控制,提升生活的便捷性和舒适性。本文将介绍如何构建一个基于人工智能的智能家居语音控制系统,包括环境准备

基于树梅派的视频监控机器人Verybot

最近这段时间做了一个基于树梅派 ( raspberry pi ) 的视频监控机器人平台 Verybot ,现在打算把这个机器人的一些图片、视频、设计思路进行公开,并且希望跟大家一起研究相关的各种问题,下面是两张机器人的照片:         图片1:                   图片2                    这个平台的基本组成是:

LLM系列 | 38:解读阿里开源语音多模态模型Qwen2-Audio

引言 模型概述 模型架构 训练方法 性能评估 实战演示 总结 引言 金山挂月窥禅径,沙鸟听经恋法门。 小伙伴们好,我是微信公众号《小窗幽记机器学习》的小编:卖铁观音的小男孩,今天这篇小作文主要是介绍阿里巴巴的语音多模态大模型Qwen2-Audio。近日,阿里巴巴Qwen团队发布了最新的大规模音频-语言模型Qwen2-Audio及其技术报告。该模型在音频理解和多模态交互

如何打造个性化大学生线上聊天交友系统?Java SpringBoot Vue教程,2025最新设计思路

✍✍计算机编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡ Java实战 | SpringBoot/SSM Python实战项目 | Django 微信小程序/安卓实战项目 大数据实战项目 ⚡⚡文末获取源码 文章目录

【阅读文献】一个使用大语言模型的端到端语音概要

摘要 ssum框架(Speech Summarization)为了 从说话人的语音提出对应的文本二题出。 ssum面临的挑战: 控制长语音的输入捕捉 the intricate cross-mdoel mapping 在长语音输入和短文本之间。 ssum端到端模型框架 使用 Q-Former 作为 语音和文本的中介连接 ,并且使用LLMs去从语音特征正确地产生文本。 采取 multi-st