K210(SiPEED MaixBit)MicroPython使用参考(四、孤立词语音识别)

2023-11-02 11:10

本文主要是介绍K210(SiPEED MaixBit)MicroPython使用参考(四、孤立词语音识别),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.首先确定K210使用带语音功能的固件:

1)固件更新工具Kflash_gui 1.6.5_2:kflash_gui_v1.6.5_2_windows.7z_kflash_gui下载-深度学习文档类资源-CSDN文库或

下载站 - Sipeed33

2)带语音功能简化版固件0.6.2_78:

http://cn.dl.sipeed.com/fileList/MAIX/MaixPy/release/master/maixpy_v0.6.2_77_g11806960d/maixpy_v0.6.2_77_g11806960d_minimum_speech_with_ide_support.bin

2.运行以下代码:

import time
from Maix import GPIO, I2S
from fpioa_manager import fm
from speech_recognizer import isolated_word
# user setting
sample_rate   = 16000
record_time   = 4  #sfm.register(20,fm.fpioa.I2S0_IN_D0, force=True)
fm.register(18,fm.fpioa.I2S0_SCLK, force=True)
fm.register(19,fm.fpioa.I2S0_WS, force=True)rx = I2S(I2S.DEVICE_0)
rx.channel_config(rx.CHANNEL_0, rx.RECEIVER, align_mode=I2S.STANDARD_MODE)
rx.set_sample_rate(sample_rate)
print(rx)sr = isolated_word(dmac=2, i2s=I2S.DEVICE_0, size=15, shift=1) # maix bit set shift=1
print(sr.size())
print(sr)# threshold
sr.set_threshold(0, 0, 10000)# record and get & set
while True:time.sleep_ms(100)#不停循环print('voice 0 state:',sr.state()) #等待语音输入时是5,有语音变成6if sr.Done == sr.record(0): #有语音信号data = sr.get(0) #获取语音信号数据print(data) #打印数据break #退出循环if sr.Speak == sr.state(): #持续等待语音输入print('Please speak: 0')

.3.正常情况下一开始显示如下信息:

等几秒钟后,以下信息不停循环显示:

这时候,对着开发板话筒大声说“0”,此时出现以下信息且停止程序运行:

如果无反应或显示不与上述一致,说明固件错误或者配置有误,主要是I2S的引脚以及声道(即shift)的设置。

4.运行以下代码:

import time
from Maix import GPIO, I2S
from fpioa_manager import fm
from speech_recognizer import isolated_word
# user setting
sample_rate   = 16000
record_time   = 4  #sio_led_red = 13
fm.register(io_led_red, fm.fpioa.GPIO0)
led_r=GPIO(GPIO.GPIO0, GPIO.OUT)
fm.register(20,fm.fpioa.I2S0_IN_D0, force=True)
fm.register(18,fm.fpioa.I2S0_SCLK, force=True)
fm.register(19,fm.fpioa.I2S0_WS, force=True)rx = I2S(I2S.DEVICE_0)
rx.channel_config(rx.CHANNEL_0, rx.RECEIVER, align_mode=I2S.STANDARD_MODE)
rx.set_sample_rate(sample_rate)
print(rx)sr = isolated_word(dmac=2, i2s=I2S.DEVICE_0, size=15, shift=1) # maix bit set shift=1
print(sr.size())
print(sr)# threshold
sr.set_threshold(0, 0, 10000)# record and get & set
while True:time.sleep_ms(100)#不停循环print('voice 0 state:',sr.state()) #等待语音输入时是5,有语音变成6if sr.Done == sr.record(0): #有语音信号data = sr.get(0) #获取语音信号数据print(data) #打印数据break #退出循环if sr.Speak == sr.state(): #持续等待语音输入print('Please speak: 0') #要求对着话筒说0
while True:time.sleep_ms(100)print('voice 0 state:',sr.state())if sr.Done == sr.record(1):data = sr.get(1)print(data)breakif sr.Speak == sr.state():print('Please speak: 1') #要求对着话筒说1# recognizer
time.sleep_ms(1000)#等待一段时间
print('recognizer\n')
while True:time.sleep_ms(3000)print('SR recognize state:',sr.state()) #等待语音输入时是5,有语音变成6print('DTW value:',sr.dtw(data)) #DTW值if sr.Done == sr.recognize():res = sr.result()print('res value:',res)if res!=None:  #无法识别输出Noneled_r.value(res[0]) #根据识别的语音开关灯,0点亮,1关闭

根据提示,先录入语音0,然后录入语音1,等待几秒后,当串行终端出现“SR recognize state: 5”时,再次对着开发板话筒说0或者1,系统将进行识别,实现对led的控制,0点亮,1关闭。

5.本开发板板载硅麦型号为MSM261S4030H0R,查手册知其为标准I2S输出,故在此设置为align_mode=I2S.STANDARD_MODE,称之为飞利浦格式,对于部分DAC语音设备,较常采用align_mode=I2S.RIGHT_JUSTIFYING_MODE,也被称为日本格式。

 6.参考资料来自官方网站:

isolated word - Sipeed Wiki

这篇关于K210(SiPEED MaixBit)MicroPython使用参考(四、孤立词语音识别)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/330212

相关文章

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v

Spring Boot中WebSocket常用使用方法详解

《SpringBoot中WebSocket常用使用方法详解》本文从WebSocket的基础概念出发,详细介绍了SpringBoot集成WebSocket的步骤,并重点讲解了常用的使用方法,包括简单消... 目录一、WebSocket基础概念1.1 什么是WebSocket1.2 WebSocket与HTTP

C#中Guid类使用小结

《C#中Guid类使用小结》本文主要介绍了C#中Guid类用于生成和操作128位的唯一标识符,用于数据库主键及分布式系统,支持通过NewGuid、Parse等方法生成,感兴趣的可以了解一下... 目录前言一、什么是 Guid二、生成 Guid1. 使用 Guid.NewGuid() 方法2. 从字符串创建

Python使用python-can实现合并BLF文件

《Python使用python-can实现合并BLF文件》python-can库是Python生态中专注于CAN总线通信与数据处理的强大工具,本文将使用python-can为BLF文件合并提供高效灵活... 目录一、python-can 库:CAN 数据处理的利器二、BLF 文件合并核心代码解析1. 基础合

Python使用OpenCV实现获取视频时长的小工具

《Python使用OpenCV实现获取视频时长的小工具》在处理视频数据时,获取视频的时长是一项常见且基础的需求,本文将详细介绍如何使用Python和OpenCV获取视频时长,并对每一行代码进行深入解析... 目录一、代码实现二、代码解析1. 导入 OpenCV 库2. 定义获取视频时长的函数3. 打开视频文

Spring IoC 容器的使用详解(最新整理)

《SpringIoC容器的使用详解(最新整理)》文章介绍了Spring框架中的应用分层思想与IoC容器原理,通过分层解耦业务逻辑、数据访问等模块,IoC容器利用@Component注解管理Bean... 目录1. 应用分层2. IoC 的介绍3. IoC 容器的使用3.1. bean 的存储3.2. 方法注

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四