IM项目:进阶版即时通讯项目---语音识别和验证码服务

2024-08-26 09:20

本文主要是介绍IM项目:进阶版即时通讯项目---语音识别和验证码服务,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 语音识别
    • 基本功能
    • 模块划分
    • 流程图
    • 实现逻辑
    • 解析proto文件
  • 验证码服务

本篇主要是对于该项目的语音识别和验证码服务模块的一个梳理,项目会直接使用部分封装好的内容,可以查看前面的文档或在本文档中进行查看和学习

由于这两个模块非常相似,所以我重点讲述的是语音识别服务,验证码服务基本可以照搬逻辑

语音识别

基本功能

客户端调用语音识别服务器,将语音消息转换为文字

模块划分

  1. 基于gflags框架进行配置文件的解析
  2. 基于spdlog进行日志输出
  3. 基于etcd的注册模块进行语音识别子服务的服务注册功能
  4. 基于brpc的RPC远程调用功能
  5. 基于百度云的SDK直接进行语音识别转换文字功能

流程图

在这里插入图片描述

实现逻辑

首先定义对应的proto文件:

syntax = "proto3";
package im;option cc_generic_services = true;message SpeechRecognitionReq {string request_id = 1;              //请求IDbytes speech_content = 2;           //语音数据optional string user_id = 3;        //用户IDoptional string session_id = 4;     //登录会话ID -- 网关进行身份鉴权
}message SpeechRecognitionRsp {string request_id = 1;                      //请求IDbool success = 2;                           //请求处理结果标志optional string errmsg = 3;                 //失败原因optional string recognition_result = 4;     //识别后的文字数据
}// 语音识别Rpc服务及接口的定义
service SpeechService {rpc SpeechRecognition(SpeechRecognitionReq) returns (SpeechRecognitionRsp);
}

这里基本的调用逻辑就是,客户端传递来一个请求ID和语音数据,服务端返回给一个识别的数据或者失败原因,调用逻辑非常简单

下面生成proto文件,然后我们来看这个proto文件

解析proto文件

在生成的proto对应的pb文件中,有这样的字段

在这里插入图片描述
那在服务端,我们只需要对于这个服务来进行一个重写即可,这是pb文件为使用者创建好的模板,因此直接进行重写即可

void SpeechRecognition(google::protobuf::RpcController* controller,const ::im::SpeechRecognitionReq* request,::im::SpeechRecognitionRsp* response,::google::protobuf::Closure* done) 
{brpc::ClosureGuard rpc_guard(done);// 1. 取出请求中的语音数据// 2. 调用语音sdk模块进行语音识别,得到响应std::string err;std::string res = _asr_client->recognize(request->speech_content(), err);if (res.empty()) {LOG_ERROR("{} 语音识别失败!", request->request_id());response->set_request_id(request->request_id());response->set_success(false);response->set_errmsg("语音识别失败:" + err);return;}// 3. 组织响应response->set_request_id(request->request_id());response->set_success(true);response->set_recognition_result(res);
}

将这个服务接口重写之后,作为服务端,下一个要做的事就是要搭建一个对应的RPC的服务器

只需要一句代码即可

_rpc_server->RunUntilAskedToQuit();

之后,由于当前的服务含有两个模块,不仅仅是包含有语音识别,还有服务注册和服务发现的模块,因此这里在外层又进行了一次封装,将服务注册和语音识别整合到了一起

class SpeechServerBuilder 
{
public:// 构造语音识别客户端对象void make_asr_object(const std::string &app_id,const std::string &api_key, const std::string &secret_key) {_asr_client = std::make_shared<ASRClient>(app_id, api_key, secret_key);}// 用于构造服务注册客户端对象void make_reg_object(const std::string &reg_host, const std::string &service_name,const std::string &access_host) {_reg_client = std::make_shared<Registry>(reg_host);_reg_client->registry(service_name, access_host);}// 构造RPC服务器对象void make_rpc_server(uint16_t port, int32_t timeout, uint8_t num_threads) {if (!_asr_client) {LOG_ERROR("还未初始化语音识别模块!");abort();}_rpc_server = std::make_shared<brpc::Server>();SpeechServiceImpl *speech_service = new SpeechServiceImpl(_asr_client);int ret = _rpc_server->AddService(speech_service, brpc::ServiceOwnership::SERVER_OWNS_SERVICE);if (ret == -1) {LOG_ERROR("添加Rpc服务失败!");abort();}brpc::ServerOptions options;options.idle_timeout_sec = timeout;options.num_threads = num_threads;ret = _rpc_server->Start(port, &options);if (ret == -1) {LOG_ERROR("服务启动失败!");abort();}}SpeechServer::ptr build() {if (!_asr_client) {LOG_ERROR("还未初始化语音识别模块!");abort();}if (!_reg_client) {LOG_ERROR("还未初始化服务注册模块!");abort();}if (!_rpc_server) {LOG_ERROR("还未初始化RPC服务器模块!");abort();}SpeechServer::ptr server = std::make_shared<SpeechServer>(_asr_client, _reg_client, _rpc_server);return server;}private:ASRClient::ptr _asr_client;Registry::ptr _reg_client;std::shared_ptr<brpc::Server> _rpc_server;
};

所以在外部,想要进行调用的逻辑也很简单,直接进行这些服务的初始化,然后build建立连接即可

int main(int argc, char *argv[])
{// 初始化gflags宏google::ParseCommandLineFlags(&argc, &argv, true);im::init_logger(FLAGS_run_mode, FLAGS_log_file, FLAGS_log_level);// 构建语音服务器im::SpeechServerBuilder ssb;ssb.make_asr_object(FLAGS_app_id, FLAGS_api_key, FLAGS_secret_key);ssb.make_rpc_server(FLAGS_listen_port, FLAGS_rpc_timeout, FLAGS_rpc_threads);ssb.make_reg_object(FLAGS_registry_host, FLAGS_base_service + FLAGS_instance_name, FLAGS_access_host);// 创建服务器并启动auto server = ssb.build();server->start();return 0;
}

验证码服务

验证码服务这里主要是调用的是阿里云的服务,这个服务整体比较简单,主要是对于接口的熟悉,并对于一些代码进行一个封装就可以了

class DMSClient 
{
public:using ptr = std::shared_ptr<DMSClient>;DMSClient(const std::string &access_key_id,const std::string &access_key_secret) {AlibabaCloud::InitializeSdk();AlibabaCloud::ClientConfiguration configuration( "cn-chengdu" );configuration.setConnectTimeout(1500);configuration.setReadTimeout(4000);AlibabaCloud::Credentials credential(access_key_id, access_key_secret);_client = std::make_unique<AlibabaCloud::CommonClient>(credential, configuration);}~DMSClient() { AlibabaCloud::ShutdownSdk(); }bool send(const std::string &phone, const std::string &code) {AlibabaCloud::CommonRequest request(AlibabaCloud::CommonRequest::RequestPattern::RpcPattern);request.setHttpMethod(AlibabaCloud::HttpRequest::Method::Post);request.setDomain("dysmsapi.aliyuncs.com");request.setVersion("2017-05-25");request.setQueryParameter("Action", "SendSms");request.setQueryParameter("SignName", "FreeIM");request.setQueryParameter("TemplateCode", "SMS_465324787");request.setQueryParameter("PhoneNumbers", phone);std::string param_code = "{\"code\":\"" + code + "\"}";request.setQueryParameter("TemplateParam", param_code);auto response = _client->commonResponse(request);if (!response.isSuccess()) {LOG_ERROR("短信验证码请求失败:{}", response.error().errorMessage());return false;}return true;}
private:std::unique_ptr<AlibabaCloud::CommonClient> _client;
};

这篇关于IM项目:进阶版即时通讯项目---语音识别和验证码服务的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1108168

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

Java进阶13讲__第12讲_1/2

多线程、线程池 1.  线程概念 1.1  什么是线程 1.2  线程的好处 2.   创建线程的三种方式 注意事项 2.1  继承Thread类 2.1.1 认识  2.1.2  编码实现  package cn.hdc.oop10.Thread;import org.slf4j.Logger;import org.slf4j.LoggerFactory

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

在cscode中通过maven创建java项目

在cscode中创建java项目 可以通过博客完成maven的导入 建立maven项目 使用快捷键 Ctrl + Shift + P 建立一个 Maven 项目 1 Ctrl + Shift + P 打开输入框2 输入 "> java create"3 选择 maven4 选择 No Archetype5 输入 域名6 输入项目名称7 建立一个文件目录存放项目,文件名一般为项目名8 确定

[MySQL表的增删改查-进阶]

🌈个人主页:努力学编程’ ⛅个人推荐: c语言从初阶到进阶 JavaEE详解 数据结构 ⚡学好数据结构,刷题刻不容缓:点击一起刷题 🌙心灵鸡汤:总有人要赢,为什么不能是我呢 💻💻💻数据库约束 🔭🔭🔭约束类型 not null: 指示某列不能存储 NULL 值unique: 保证某列的每行必须有唯一的值default: 规定没有给列赋值时的默认值.primary key:

【区块链 + 人才服务】区块链集成开发平台 | FISCO BCOS应用案例

随着区块链技术的快速发展,越来越多的企业开始将其应用于实际业务中。然而,区块链技术的专业性使得其集成开发成为一项挑战。针对此,广东中创智慧科技有限公司基于国产开源联盟链 FISCO BCOS 推出了区块链集成开发平台。该平台基于区块链技术,提供一套全面的区块链开发工具和开发环境,支持开发者快速开发和部署区块链应用。此外,该平台还可以提供一套全面的区块链开发教程和文档,帮助开发者快速上手区块链开发。