(二)医学影像放射设备集成 语音输入模块(硬件模块)(前期研发的调研工作)

本文主要是介绍(二)医学影像放射设备集成 语音输入模块(硬件模块)(前期研发的调研工作),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

第一章、基本要求

1.1、使用场景或环境

1.2、支持声音识别、声纹识别

1.3、支持多国语言的语音识别

1.4、支持SDK二次开发

1.5、支持灵活输入

1.6、模块具有丰富的外部接口

 1.7、支持定制功能、提供样品

1.8、系统性能要求。

第二章、性价比(公司对比) 

第三章、科大讯飞


第一章、基本要求

1.1、使用场景或环境

  • 医学影像放射设备    搭载语音输入模块,在室内/室外条件下,医护人员在边检查边进行语音指令输入。
  • 语音输入模块根据语音指令,转成对应的文字指令。
  • 医疗设备的软件系统,根据文字指令,执行其他功能操作。       

1.2、支持声音识别、声纹识别

  • 要求可以识别人类发出的声音,并识别声音的内容。
  • 要求可以识别声音的属性,比如是谁发出的声音指令。
  • 要求可识别同一语言的不同方言。

1.3、支持多国语言的语音识别

         可以识别中文、英文等主流语言的声音。

1.4、支持SDK二次开发

  • 模块具备一定的内存。
  • 模块支持自定义输入功能。

1.5、支持灵活输入

  • 比如支持长语音、段语音输入。
  • 比如支持语音的断断续续输入。

1.6、模块具有丰富的外部接口

  • 比如网口、串口、USB接口、SD卡接口、CAN接口、SPI接口等等。
  • 电源供电接口等等。

 1.7、支持定制功能、提供样品

  • 模块的规格尺寸可定制。
  • 模块的功能可定制、扩展。
  • 产品的开发阶段,希望提供样品。

1.8、系统性能要求。

  • 安全性:
  • 可靠性:具备高抗电磁干扰、高抗噪声干扰等等能力。
  • 实时性: 语言指令转文字指令,时延<200ms。
  • 其他等等

第二章、性价比(公司对比) 

参考以下链接与客服咨询之后,得到下面的表格

http://www.vic18.com/plus/view.php?aid=2128

http://www.elecfans.com/d/841906.html

http://m.elecfans.com/article/603651.html

 

串口

 

USB

接口

离线

在线

自定义语言

自定义指令

规格

尺寸

存储

容量

应用场景

声纹识别 

实时性(ms)

 

价格

和商务沟通结果

 科大讯飞

(002230)

输出

供电

只支持中文

支持中英

支持简单的自定义指令

 

 

 

医疗设备

/PC端

500

 

 

 

发了商务一封邮件,对方能够及时跟进

汇顶科技

(603160)

 

 

 

 

 

 

 

 

 

 

 

 

 

商务未回复邮件

拓尔思

(300229)

 

 

 

 

 

 

 

 

 

 

 

 

商务未回复邮件

汉王科技

(002362)

 

 

 

 

 

 

 

 

 

 

 

 

商务未回复邮件

紫光国芯

(220049)

 

 

 

 

 

 

 

 

 

 

 

 

商务未回复邮件

士兰微

 

 

 

 

 

 

 

 

 

 

 

 

商务未回复邮件

九芯电子

 

 

 

 

 

 

 

 

 

 

 

 

商务未回复邮件

景嘉微

 

 

 

 

 

 

 

 

 

 

 

 

商务未回复邮件

思必驰

 

            商务未回复邮件

云知声

            商务未回复邮件
北京声致科技

 

输出供电或用3.3V电源供电只支持中文支持中英不支持支持简单的自定义指令 128M 声纹唤醒,但不支持指令转换 200~300

该商务很不专业,打了3次电话,微信上问了4次,沟通过程很含糊,我问的问题都得不到专业的答复。最后才给我一个项目填报文档。填了文档给他发过去后,几天都不理人。从我发邮件,到填文档,前后浪费了我一个月的时间

这家公司的产品现在一般只应用在手机,建议不要采纳这家公司的产品做Window/Linux。

       对比了我以前的十几家样品的采购,这家公司服务态度真的是非常差,感觉不像一家正规的公司。

百度

            未发邮件

第三章、科大讯飞

https://doc.iflyos.cn/aiui/whitepaper/、https://www.xfyun.cn/services/ring6mic

        实际上,科大讯飞那边给了我两个文件,但是这两个文件并没有过多地阐述这个模块的功能。于是,我需要根据初期电话沟通支持的功能、模块说明链接https://doc.iflyos.cn/aiui/whitepaper/进一步调研科大讯飞的产品。

      依据这个网站,获取的有效信息如下:

  • AIUI——AIUI 是科大讯飞2015年推出的一套以语音为核心的人机交互解决方案,意在使应用和设备能够快速具备能听会说,能理解会思考的能力。默认配置进场识别模式。
  • 语音唤醒——4-6个音节的唤醒词、唤醒率超过95%、用户可自定义唤醒词、单设备最高支持8个唤醒词同时使用。唤醒模式又分为一次唤醒和持续交互唤醒。持续交互——持续交互(continue)即全双工交互,在一次唤醒后,可以保持一段时间的唤醒(一般小于60秒),在这段时间内,可以直接与机器交互,免去唤醒词以后,会使得人机交互更加自然。该模式必须用AIUI 麦克风阵列 + AIUI 评估板(量产版)。一次唤醒——即一次唤醒,一次响应。(暂时只支持android平台)
  • 语音识别——普通话近场识别(手持语言设备录用的状态)、远场识别(1m~5m,多麦)准确率达98%、95%。远场识别率1米、3米、5米分别为95%、92%、90%,远场只提供普通话。
  • 方言——普通话方言
  • 全双工交互——全双工交互指在设备扬声器发声时,且不关闭麦克风的情况下,用户可以打断设备的播放,进行语音识别和语义理解。
  • 识别模式——一种模式是按键触发录音并识别。另一种模式是,持续录音,连续识别:可以根据业务需求保持交互状态10秒~120秒,实现一次触发多次响应。

  • 拒识——过滤无关的语音和无效的噪音进行过滤,例如嗯、啊、哦等语气词。

  • 语义理解——将语言转成Json数据格式????

  • 自定义技能、自定义问答。

  • 语音合成——将文字信息转化为声音信息,给产品配上“嘴巴”。

  • AIUI 目前支持提供多种集成模式,包含 SDK,硬件接入,HTTP 协议以及微信公众号接入的方式。SDK 目前提供 Android,iOS,Linux,Windows 平台。

  • 远场解决方案——方案一:麦克风阵列+输出单路音频至上位机+上位机可以集成 AIUI 的 SDK。方案二: AIUI 评估板(量产版)+ 通过串口将结构化语义信息输出到上位机。

  • 热词上传——例如“燕京啤酒”在通用领域可能会被识别成“眼睛啤酒”,但是当您上传了热词后,识别成功率会大概率提升。

  • SDK参数配置——Json。

上位机与AIUI交互模式:

语音唤醒:

 

这篇关于(二)医学影像放射设备集成 语音输入模块(硬件模块)(前期研发的调研工作)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/287747

相关文章

Java中Springboot集成Kafka实现消息发送和接收功能

《Java中Springboot集成Kafka实现消息发送和接收功能》Kafka是一个高吞吐量的分布式发布-订阅消息系统,主要用于处理大规模数据流,它由生产者、消费者、主题、分区和代理等组件构成,Ka... 目录一、Kafka 简介二、Kafka 功能三、POM依赖四、配置文件五、生产者六、消费者一、Kaf

C#实现获取电脑中的端口号和硬件信息

《C#实现获取电脑中的端口号和硬件信息》这篇文章主要为大家详细介绍了C#实现获取电脑中的端口号和硬件信息的相关方法,文中的示例代码讲解详细,有需要的小伙伴可以参考一下... 我们经常在使用一个串口软件的时候,发现软件中的端口号并不是普通的COM1,而是带有硬件信息的。那么如果我们使用C#编写软件时候,如

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

多模块的springboot项目发布指定模块的脚本方式

《多模块的springboot项目发布指定模块的脚本方式》该文章主要介绍了如何在多模块的SpringBoot项目中发布指定模块的脚本,作者原先的脚本会清理并编译所有模块,导致发布时间过长,通过简化脚本... 目录多模块的springboot项目发布指定模块的脚本1、不计成本地全部发布2、指定模块发布总结多模

Python中构建终端应用界面利器Blessed模块的使用

《Python中构建终端应用界面利器Blessed模块的使用》Blessed库作为一个轻量级且功能强大的解决方案,开始在开发者中赢得口碑,今天,我们就一起来探索一下它是如何让终端UI开发变得轻松而高... 目录一、安装与配置:简单、快速、无障碍二、基本功能:从彩色文本到动态交互1. 显示基本内容2. 创建链

SpringCloud集成AlloyDB的示例代码

《SpringCloud集成AlloyDB的示例代码》AlloyDB是GoogleCloud提供的一种高度可扩展、强性能的关系型数据库服务,它兼容PostgreSQL,并提供了更快的查询性能... 目录1.AlloyDBjavascript是什么?AlloyDB 的工作原理2.搭建测试环境3.代码工程1.

Node.js 中 http 模块的深度剖析与实战应用小结

《Node.js中http模块的深度剖析与实战应用小结》本文详细介绍了Node.js中的http模块,从创建HTTP服务器、处理请求与响应,到获取请求参数,每个环节都通过代码示例进行解析,旨在帮... 目录Node.js 中 http 模块的深度剖析与实战应用一、引言二、创建 HTTP 服务器:基石搭建(一

SpringBoot使用注解集成Redis缓存的示例代码

《SpringBoot使用注解集成Redis缓存的示例代码》:本文主要介绍在SpringBoot中使用注解集成Redis缓存的步骤,包括添加依赖、创建相关配置类、需要缓存数据的类(Tes... 目录一、创建 Caching 配置类二、创建需要缓存数据的类三、测试方法Spring Boot 熟悉后,集成一个外

Docker集成CI/CD的项目实践

《Docker集成CI/CD的项目实践》本文主要介绍了Docker集成CI/CD的项目实践,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录一、引言1.1 什么是 CI/CD?1.2 docker 在 CI/CD 中的作用二、Docke

SpringBoot集成SOL链的详细过程

《SpringBoot集成SOL链的详细过程》Solanaj是一个用于与Solana区块链交互的Java库,它为Java开发者提供了一套功能丰富的API,使得在Java环境中可以轻松构建与Solana... 目录一、什么是solanaj?二、Pom依赖三、主要类3.1 RpcClient3.2 Public