【百度语音识别】JavaAPI方式语音识别示例 MP3转PCM文件Java实现

本文主要是介绍【百度语音识别】JavaAPI方式语音识别示例 MP3转PCM文件Java实现，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

【百度语音识别】JavaAPI方式语音识别示例MP3转PCM

Java-API合成语音示例:http://ai.baidu.com/forum/topic/show/496727
REST-API文档地址：http://ai.baidu.com/docs#/TTS-API/top
注意：需要下载MP3插件jar。才可以进行MP3CONVERTPCM 链接: https://pan.baidu.com/s/1i5pJxpb 密码: 8w4x
遇到的坑：HTTPUtil工具类中。不需要拼接access_token参数。大家注意一下。ContentType也改一下。

----------------------------------开始代码示例----------------------------------

MP3转PCM的方法需要下载注意的jar才可以正确转换哦

第一步就是语音合成的MP3文件转换PCM格式文件

package com.xs.audio.tns;import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;import javax.sound.sampled.AudioFormat;
import javax.sound.sampled.AudioInputStream;
import javax.sound.sampled.AudioSystem;
/*** MP3转PCM Java方式实现* @author 小帅丶* @date 2017年12月6日*/
public class MP3ConvertPCM {/*** MP3转换PCM文件方法* @param mp3filepath 原始文件路径* @param pcmfilepath 转换文件的保存路径* @throws Exception */public static void mp3Convertpcm(String mp3filepath,String pcmfilepath) throws Exception{File mp3 = new File(mp3filepath);File pcm = new File(pcmfilepath);//原MP3文件转AudioInputStreamAudioInputStream mp3audioStream = AudioSystem.getAudioInputStream(mp3);//将AudioInputStream MP3文件 转换为PCM AudioInputStreamAudioInputStream pcmaudioStream = AudioSystem.getAudioInputStream(AudioFormat.Encoding.PCM_SIGNED, mp3audioStream);//准备转换的流输出到OutputStreamOutputStream os = new FileOutputStream(pcm);int bytesRead = 0;byte[] buffer = new byte[8192];while ((bytesRead=pcmaudioStream.read(buffer, 0, 8192))!=-1) {os.write(buffer, 0, bytesRead);}os.close();pcmaudioStream.close();}
}

HttpUtil工具类新增加一个postASR的方法

/*** 获取语音识别内容* @param requestUrl* @param params* @return* @throws Exception*/public static String postASR(String requestUrl, String params) throws Exception {System.out.println(params);String generalUrl = requestUrl;//这里不需要对接口地址拼接access_token参数 切记！！！System.out.println("发送的连接为:"+generalUrl);URL url = new URL(generalUrl);// 打开和URL之间的连接HttpURLConnection connection = (HttpURLConnection) url.openConnection();System.out.println("打开链接，开始发送请求"+new Date().getTime()/1000);connection.setRequestMethod("POST");// 设置通用的请求属性connection.setRequestProperty("Content-Type", "application/json");connection.setRequestProperty("Connection", "Keep-Alive");connection.setUseCaches(false);connection.setDoOutput(true);connection.setDoInput(true);// 得到请求的输出流对象DataOutputStream out = new DataOutputStream(connection.getOutputStream());out.writeBytes(params);out.flush();out.close();// 建立实际的连接connection.connect();// 获取所有响应头字段Map<String, List<String>> headers = connection.getHeaderFields();// 遍历所有的响应头字段for (String key : headers.keySet()) {System.out.println(key + "--->" + headers.get(key));}// 定义 BufferedReader输入流来读取URL的响应BufferedReader in = null;if (requestUrl.contains("nlp"))in = new BufferedReader(new InputStreamReader(connection.getInputStream(), "GBK"));elsein = new BufferedReader(new InputStreamReader(connection.getInputStream(), "UTF-8"));String result = "";String getLine;while ((getLine = in.readLine()) != null) {result += getLine;}in.close();System.out.println("请求结束"+new Date().getTime()/1000);System.out.println("result:" + result);return result;}

下面就是语音识别的示例代码哦

package com.xs.audio.tns;import java.io.File;
import java.util.HashMap;import com.xs.util.baidu.Base64Util;
import com.xs.util.baidu.FileUtil;
import com.xs.util.baidu.HttpUtil;
import com.xs.util.baidu.RandomStringGenerator;
/*** 语音识别Java-API JSON上传方式示例代码* @author 小帅丶**/
public class Audio2Text {//接口地址private static final String AUDIO2TEXT_URL = "http://vop.baidu.com/server_api";public static void main(String[] args) throws Exception {//合成的MP3语音文件String path = "C:/Users/Administrator/text2audio/VOICE1512521962.mp3";//MP3转pcm要保存的路径和文件名String path2 = "C:/Users/Administrator/text2audio/VOICE1512521962.pcm";MP3ConvertPCM.mp3Convertpcm(path, path2);// 对语音二进制数据进行识别   byte[] data = FileUtil.readFileByBytes(path2);    //readFileByBytes仅为获取二进制数据示例String speech = Base64Util.encode(data);File file = new File(path2);long len = file.length();String result = Audio2text("pcm", 16000,RandomStringGenerator.getRandomStringByLength(60),"自己获取的AccessToken", speech, len);System.out.println(result);}/*** JSON方式上传* @param format	必填	语音文件的格式，pcm 或者 wav 或者 amr。不区分大小写。推荐pcm文件* @param rate	必填	采样率， 8000 或者 16000， 推荐 16000 采用率* @param channel	必填	声道数，仅支持单声道，请填写固定值 1* @param cuid	必填	用户唯一标识，用来区分用户，计算UV值。建议填写能区分用户的机器 MAC 地址或 IMEI 码，长度为60字符以内。* @param token	必填	开放平台获取到的access_token, 见上面的“鉴权认证机制”段落* @param lan	选填	语种选择，默认中文（zh）。 中文=zh、粤语=ct、英文=en，不区分大小写* @param url	选填	可下载的语音下载地址，与callback连一起使用，确保百度服务器可以访问。* @param callback	选填	用户服务器的识别结果回调地址，确保百度服务器可以访问* @param speech	选填	本地语音文件的的二进制语音数据 ，需要进行base64 编码。与len参数连一起使用。* @param len	选填	本地语音文件的的字节数，单位字节*/public static String Audio2text(String format,Integer rate,String cuid,String token,String speech,long len) throws Exception{HashMap<String, Object> paramMap = new HashMap<String, Object>();paramMap.put("speech",speech);paramMap.put("format", format);paramMap.put("rate", rate);paramMap.put("channel",1);paramMap.put("cuid",cuid);paramMap.put("token", token);paramMap.put("len", len);net.sf.json.JSONObject params = net.sf.json.JSONObject.fromObject(paramMap);String data = HttpUtil.postASR(AUDIO2TEXT_URL,params.toString());System.out.println("语音文件识别的内容:"+data);return data;}
}

看看返回的内容

{"corpus_no": "6496262443167631439", "err_msg": "success.", "err_no": 0, "result": ["开发者小帅你好，"], "sn": "74778487111512528965"
}

以上就是语音识别Java-API调用示例代码哦。难点是MP3转PCM会卡壳开发者们。

这篇关于【百度语音识别】JavaAPI方式语音识别示例 MP3转PCM文件Java实现的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

【百度语音识别】JavaAPI方式语音识别示例 MP3转PCM文件Java实现

MP3转PCM的方法需要下载注意的jar才可以正确转换哦

HttpUtil工具类新增加一个postASR的方法

下面就是语音识别的示例代码哦

相关文章

MySQL 主从复制部署及验证(示例详解)

SpringBoot中六种批量更新Mysql的方式效率对比分析

python生成随机唯一id的几种实现方法

Java docx4j高效处理Word文档的实战指南

一文详解如何使用Java获取PDF页面信息

Spring Boot中的路径变量示例详解

JAVA中安装多个JDK的方法

Spring StateMachine实现状态机使用示例详解

Spring Boot 结合 WxJava 实现文章上传微信公众号草稿箱与群发

Java中Integer128陷阱

【百度语音识别】JavaAPI方式语音识别示例 MP3转PCM文件Java实现

MP3转PCM的方法 需要下载注意的jar才可以正确转换哦

HttpUtil工具类新增加一个postASR的方法

下面就是语音识别的示例代码哦

相关文章

MP3转PCM的方法需要下载注意的jar才可以正确转换哦