【百度语音识别】JavaAPI方式语音识别示例 MP3转PCM文件Java实现

2024-05-19 02:18

本文主要是介绍【百度语音识别】JavaAPI方式语音识别示例 MP3转PCM文件Java实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


【百度语音识别】JavaAPI方式语音识别示例MP3转PCM

  • Java-API合成语音示例:http://ai.baidu.com/forum/topic/show/496727
  • REST-API文档地址:http://ai.baidu.com/docs#/TTS-API/top
  • 注意:需要下载MP3插件jar。才可以进行MP3CONVERTPCM 链接: https://pan.baidu.com/s/1i5pJxpb 密码: 8w4x
  • 遇到的坑:HTTPUtil工具类中。不需要拼接access_token参数。大家注意一下。ContentType也改一下。

----------------------------------开始代码示例----------------------------------

  • MP3转PCM的方法 需要下载注意的jar才可以正确转换哦

第一步就是语音合成的MP3文件转换PCM格式文件

package com.xs.audio.tns;import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;import javax.sound.sampled.AudioFormat;
import javax.sound.sampled.AudioInputStream;
import javax.sound.sampled.AudioSystem;
/*** MP3转PCM Java方式实现* @author 小帅丶* @date 2017年12月6日*/
public class MP3ConvertPCM {/*** MP3转换PCM文件方法* @param mp3filepath 原始文件路径* @param pcmfilepath 转换文件的保存路径* @throws Exception */public static void mp3Convertpcm(String mp3filepath,String pcmfilepath) throws Exception{File mp3 = new File(mp3filepath);File pcm = new File(pcmfilepath);//原MP3文件转AudioInputStreamAudioInputStream mp3audioStream = AudioSystem.getAudioInputStream(mp3);//将AudioInputStream MP3文件 转换为PCM AudioInputStreamAudioInputStream pcmaudioStream = AudioSystem.getAudioInputStream(AudioFormat.Encoding.PCM_SIGNED, mp3audioStream);//准备转换的流输出到OutputStreamOutputStream os = new FileOutputStream(pcm);int bytesRead = 0;byte[] buffer = new byte[8192];while ((bytesRead=pcmaudioStream.read(buffer, 0, 8192))!=-1) {os.write(buffer, 0, bytesRead);}os.close();pcmaudioStream.close();}
}
  • HttpUtil工具类新增加一个postASR的方法

/*** 获取语音识别内容* @param requestUrl* @param params* @return* @throws Exception*/public static String postASR(String requestUrl, String params) throws Exception {System.out.println(params);String generalUrl = requestUrl;//这里不需要对接口地址拼接access_token参数 切记!!!System.out.println("发送的连接为:"+generalUrl);URL url = new URL(generalUrl);// 打开和URL之间的连接HttpURLConnection connection = (HttpURLConnection) url.openConnection();System.out.println("打开链接,开始发送请求"+new Date().getTime()/1000);connection.setRequestMethod("POST");// 设置通用的请求属性connection.setRequestProperty("Content-Type", "application/json");connection.setRequestProperty("Connection", "Keep-Alive");connection.setUseCaches(false);connection.setDoOutput(true);connection.setDoInput(true);// 得到请求的输出流对象DataOutputStream out = new DataOutputStream(connection.getOutputStream());out.writeBytes(params);out.flush();out.close();// 建立实际的连接connection.connect();// 获取所有响应头字段Map<String, List<String>> headers = connection.getHeaderFields();// 遍历所有的响应头字段for (String key : headers.keySet()) {System.out.println(key + "--->" + headers.get(key));}// 定义 BufferedReader输入流来读取URL的响应BufferedReader in = null;if (requestUrl.contains("nlp"))in = new BufferedReader(new InputStreamReader(connection.getInputStream(), "GBK"));elsein = new BufferedReader(new InputStreamReader(connection.getInputStream(), "UTF-8"));String result = "";String getLine;while ((getLine = in.readLine()) != null) {result += getLine;}in.close();System.out.println("请求结束"+new Date().getTime()/1000);System.out.println("result:" + result);return result;}
  • 下面就是语音识别的示例代码哦

package com.xs.audio.tns;import java.io.File;
import java.util.HashMap;import com.xs.util.baidu.Base64Util;
import com.xs.util.baidu.FileUtil;
import com.xs.util.baidu.HttpUtil;
import com.xs.util.baidu.RandomStringGenerator;
/*** 语音识别Java-API JSON上传方式示例代码* @author 小帅丶**/
public class Audio2Text {//接口地址private static final String AUDIO2TEXT_URL = "http://vop.baidu.com/server_api";public static void main(String[] args) throws Exception {//合成的MP3语音文件String path = "C:/Users/Administrator/text2audio/VOICE1512521962.mp3";//MP3转pcm要保存的路径和文件名String path2 = "C:/Users/Administrator/text2audio/VOICE1512521962.pcm";MP3ConvertPCM.mp3Convertpcm(path, path2);// 对语音二进制数据进行识别   byte[] data = FileUtil.readFileByBytes(path2);    //readFileByBytes仅为获取二进制数据示例String speech = Base64Util.encode(data);File file = new File(path2);long len = file.length();String result = Audio2text("pcm", 16000,RandomStringGenerator.getRandomStringByLength(60),"自己获取的AccessToken", speech, len);System.out.println(result);}/*** JSON方式上传* @param format	必填	语音文件的格式,pcm 或者 wav 或者 amr。不区分大小写。推荐pcm文件* @param rate	必填	采样率, 8000 或者 16000, 推荐 16000 采用率* @param channel	必填	声道数,仅支持单声道,请填写固定值 1* @param cuid	必填	用户唯一标识,用来区分用户,计算UV值。建议填写能区分用户的机器 MAC 地址或 IMEI 码,长度为60字符以内。* @param token	必填	开放平台获取到的access_token, 见上面的“鉴权认证机制”段落* @param lan	选填	语种选择,默认中文(zh)。 中文=zh、粤语=ct、英文=en,不区分大小写* @param url	选填	可下载的语音下载地址,与callback连一起使用,确保百度服务器可以访问。* @param callback	选填	用户服务器的识别结果回调地址,确保百度服务器可以访问* @param speech	选填	本地语音文件的的二进制语音数据 ,需要进行base64 编码。与len参数连一起使用。* @param len	选填	本地语音文件的的字节数,单位字节*/public static String Audio2text(String format,Integer rate,String cuid,String token,String speech,long len) throws Exception{HashMap<String, Object> paramMap = new HashMap<String, Object>();paramMap.put("speech",speech);paramMap.put("format", format);paramMap.put("rate", rate);paramMap.put("channel",1);paramMap.put("cuid",cuid);paramMap.put("token", token);paramMap.put("len", len);net.sf.json.JSONObject params = net.sf.json.JSONObject.fromObject(paramMap);String data = HttpUtil.postASR(AUDIO2TEXT_URL,params.toString());System.out.println("语音文件识别的内容:"+data);return data;}
}

看看返回的内容

{"corpus_no": "6496262443167631439", "err_msg": "success.", "err_no": 0, "result": ["开发者小帅你好,"], "sn": "74778487111512528965"
}

以上就是语音识别Java-API调用示例代码哦。难点是MP3转PCM会卡壳开发者们。


这篇关于【百度语音识别】JavaAPI方式语音识别示例 MP3转PCM文件Java实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/995757

相关文章

C++对象布局及多态实现探索之内存布局(整理的很多链接)

本文通过观察对象的内存布局,跟踪函数调用的汇编代码。分析了C++对象内存的布局情况,虚函数的执行方式,以及虚继承,等等 文章链接:http://dev.yesky.com/254/2191254.shtml      论C/C++函数间动态内存的传递 (2005-07-30)   当你涉及到C/C++的核心编程的时候,你会无止境地与内存管理打交道。 文章链接:http://dev.yesky

如何突破底层思维方式的牢笼

我始终认为,牛人和普通人的根本区别在于思维方式的不同,而非知识多少、阅历多少。 在这个世界上总有一帮神一样的人物存在。就像读到的那句话:“人类就像是一条历史长河中的鱼,只有某几条鱼跳出河面,看到世界的法则,但是却无法改变,当那几条鱼中有跳上岸,进化了,改变河道流向,那样才能改变法则。”  最近一段时间一直在不断寻在内心的东西,同时也在不断的去反省和否定自己的一些思维模式,尝试重

Java五子棋之坐标校正

上篇针对了Java项目中的解构思维,在这篇内容中我们不妨从整体项目中拆解拿出一个非常重要的五子棋逻辑实现:坐标校正,我们如何使漫无目的鼠标点击变得有序化和可控化呢? 目录 一、从鼠标监听到获取坐标 1.MouseListener和MouseAdapter 2.mousePressed方法 二、坐标校正的具体实现方法 1.关于fillOval方法 2.坐标获取 3.坐标转换 4.坐

Spring Cloud:构建分布式系统的利器

引言 在当今的云计算和微服务架构时代,构建高效、可靠的分布式系统成为软件开发的重要任务。Spring Cloud 提供了一套完整的解决方案,帮助开发者快速构建分布式系统中的一些常见模式(例如配置管理、服务发现、断路器等)。本文将探讨 Spring Cloud 的定义、核心组件、应用场景以及未来的发展趋势。 什么是 Spring Cloud Spring Cloud 是一个基于 Spring

Javascript高级程序设计(第四版)--学习记录之变量、内存

原始值与引用值 原始值:简单的数据即基础数据类型,按值访问。 引用值:由多个值构成的对象即复杂数据类型,按引用访问。 动态属性 对于引用值而言,可以随时添加、修改和删除其属性和方法。 let person = new Object();person.name = 'Jason';person.age = 42;console.log(person.name,person.age);//'J

java8的新特性之一(Java Lambda表达式)

1:Java8的新特性 Lambda 表达式: 允许以更简洁的方式表示匿名函数(或称为闭包)。可以将Lambda表达式作为参数传递给方法或赋值给函数式接口类型的变量。 Stream API: 提供了一种处理集合数据的流式处理方式,支持函数式编程风格。 允许以声明性方式处理数据集合(如List、Set等)。提供了一系列操作,如map、filter、reduce等,以支持复杂的查询和转

Java面试八股之怎么通过Java程序判断JVM是32位还是64位

怎么通过Java程序判断JVM是32位还是64位 可以通过Java程序内部检查系统属性来判断当前运行的JVM是32位还是64位。以下是一个简单的方法: public class JvmBitCheck {public static void main(String[] args) {String arch = System.getProperty("os.arch");String dataM

详细分析Springmvc中的@ModelAttribute基本知识(附Demo)

目录 前言1. 注解用法1.1 方法参数1.2 方法1.3 类 2. 注解场景2.1 表单参数2.2 AJAX请求2.3 文件上传 3. 实战4. 总结 前言 将请求参数绑定到模型对象上,或者在请求处理之前添加模型属性 可以在方法参数、方法或者类上使用 一般适用这几种场景: 表单处理:通过 @ModelAttribute 将表单数据绑定到模型对象上预处理逻辑:在请求处理之前

eclipse运行springboot项目,找不到主类

解决办法尝试了很多种,下载sts压缩包行不通。最后解决办法如图: help--->Eclipse Marketplace--->Popular--->找到Spring Tools 3---->Installed。

idea lanyu方式激活

访问http://idea.lanyus.com/这个地址。根据提示将0.0.0.0 account.jetbrains.com添加到hosts文件中,hosts文件在C:\Windows\System32\drivers\etc目录下。点击获得注册码即可。