K210(SiPEED MaixBit)MicroPython使用参考(四、孤立词语音识别)

2023-11-02 11:10

本文主要是介绍K210(SiPEED MaixBit)MicroPython使用参考(四、孤立词语音识别),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.首先确定K210使用带语音功能的固件:

1)固件更新工具Kflash_gui 1.6.5_2:kflash_gui_v1.6.5_2_windows.7z_kflash_gui下载-深度学习文档类资源-CSDN文库或

下载站 - Sipeed33

2)带语音功能简化版固件0.6.2_78:

http://cn.dl.sipeed.com/fileList/MAIX/MaixPy/release/master/maixpy_v0.6.2_77_g11806960d/maixpy_v0.6.2_77_g11806960d_minimum_speech_with_ide_support.bin

2.运行以下代码:

import time
from Maix import GPIO, I2S
from fpioa_manager import fm
from speech_recognizer import isolated_word
# user setting
sample_rate   = 16000
record_time   = 4  #sfm.register(20,fm.fpioa.I2S0_IN_D0, force=True)
fm.register(18,fm.fpioa.I2S0_SCLK, force=True)
fm.register(19,fm.fpioa.I2S0_WS, force=True)rx = I2S(I2S.DEVICE_0)
rx.channel_config(rx.CHANNEL_0, rx.RECEIVER, align_mode=I2S.STANDARD_MODE)
rx.set_sample_rate(sample_rate)
print(rx)sr = isolated_word(dmac=2, i2s=I2S.DEVICE_0, size=15, shift=1) # maix bit set shift=1
print(sr.size())
print(sr)# threshold
sr.set_threshold(0, 0, 10000)# record and get & set
while True:time.sleep_ms(100)#不停循环print('voice 0 state:',sr.state()) #等待语音输入时是5,有语音变成6if sr.Done == sr.record(0): #有语音信号data = sr.get(0) #获取语音信号数据print(data) #打印数据break #退出循环if sr.Speak == sr.state(): #持续等待语音输入print('Please speak: 0')

.3.正常情况下一开始显示如下信息:

等几秒钟后,以下信息不停循环显示:

这时候,对着开发板话筒大声说“0”,此时出现以下信息且停止程序运行:

如果无反应或显示不与上述一致,说明固件错误或者配置有误,主要是I2S的引脚以及声道(即shift)的设置。

4.运行以下代码:

import time
from Maix import GPIO, I2S
from fpioa_manager import fm
from speech_recognizer import isolated_word
# user setting
sample_rate   = 16000
record_time   = 4  #sio_led_red = 13
fm.register(io_led_red, fm.fpioa.GPIO0)
led_r=GPIO(GPIO.GPIO0, GPIO.OUT)
fm.register(20,fm.fpioa.I2S0_IN_D0, force=True)
fm.register(18,fm.fpioa.I2S0_SCLK, force=True)
fm.register(19,fm.fpioa.I2S0_WS, force=True)rx = I2S(I2S.DEVICE_0)
rx.channel_config(rx.CHANNEL_0, rx.RECEIVER, align_mode=I2S.STANDARD_MODE)
rx.set_sample_rate(sample_rate)
print(rx)sr = isolated_word(dmac=2, i2s=I2S.DEVICE_0, size=15, shift=1) # maix bit set shift=1
print(sr.size())
print(sr)# threshold
sr.set_threshold(0, 0, 10000)# record and get & set
while True:time.sleep_ms(100)#不停循环print('voice 0 state:',sr.state()) #等待语音输入时是5,有语音变成6if sr.Done == sr.record(0): #有语音信号data = sr.get(0) #获取语音信号数据print(data) #打印数据break #退出循环if sr.Speak == sr.state(): #持续等待语音输入print('Please speak: 0') #要求对着话筒说0
while True:time.sleep_ms(100)print('voice 0 state:',sr.state())if sr.Done == sr.record(1):data = sr.get(1)print(data)breakif sr.Speak == sr.state():print('Please speak: 1') #要求对着话筒说1# recognizer
time.sleep_ms(1000)#等待一段时间
print('recognizer\n')
while True:time.sleep_ms(3000)print('SR recognize state:',sr.state()) #等待语音输入时是5,有语音变成6print('DTW value:',sr.dtw(data)) #DTW值if sr.Done == sr.recognize():res = sr.result()print('res value:',res)if res!=None:  #无法识别输出Noneled_r.value(res[0]) #根据识别的语音开关灯,0点亮,1关闭

根据提示,先录入语音0,然后录入语音1,等待几秒后,当串行终端出现“SR recognize state: 5”时,再次对着开发板话筒说0或者1,系统将进行识别,实现对led的控制,0点亮,1关闭。

5.本开发板板载硅麦型号为MSM261S4030H0R,查手册知其为标准I2S输出,故在此设置为align_mode=I2S.STANDARD_MODE,称之为飞利浦格式,对于部分DAC语音设备,较常采用align_mode=I2S.RIGHT_JUSTIFYING_MODE,也被称为日本格式。

 6.参考资料来自官方网站:

isolated word - Sipeed Wiki

这篇关于K210(SiPEED MaixBit)MicroPython使用参考(四、孤立词语音识别)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/330212

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的