语音人工智能的征途,我在车载行业的这些年

2023-11-27 17:20

本文主要是介绍语音人工智能的征途,我在车载行业的这些年,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

语音人工智能的征途,我在车载行业的这些年


一.江湖浪子

今个,咱们来聊聊IoT领域的故事,因为我在车载行业也做了挺久,一直负责语音模块的开发,所以想分享一下,我的一些感想!

大学小毕业之后就一直漂流在魔都,但是也没有什么想法,就是想好好的学习,那个时候那会想到会接触到这个行业啊,那个时候应该属于落后的一代,为什么这样说呢,因为当时我们一直还在做PC端的开发,而我,只是简单的负责了一些收费站的LED液晶展示系统,着实没什么好玩的,所有一直比较浪,所有标题才叫浪子,当时没什么大想法,但是却一直执着于Android,大学学的就是Android,只是工作了就把老本行也落下了,实在是不该,这就是简单的交代了一下我的背景了

二.渊源自在

当Android这股狂风正在呼啦啦的刮的时候,我终于意识到,我该“自我反省”了,曾经少年时的热血,你去哪里了呢?于是非常决绝的来到了这个陌生的城市——深圳

这里写图片描述

来到这里,联系上了一位老友,现在是某表芯供应公司的CEO,说明了我的来意之后,便在他的公司安了家,这算是我真正意义上的接触了互联网领域了,当时的主要任务就是BLE的开发,软件和手表的通信,各种图表的绘制,支付,健康等主打功能,这些在现在看起来都是非常有意义的事情,默默的研究蓝牙,默默的研究串口通信,发现,还真是很好玩的事情,在这里,也认识了一批非常有作为的梦想家,相信他们日后的发展肯定比我好很多,虽说时年google的眼睛,手表都在问世,但是毫无疑问,物联网烧起了一把大火,把很多创始人屁股都烧红了,这里也在做铺垫

三.车载行业

当我决定进入车载行业的时候,互联网的这把旺火已经烧得奄奄一息了,不过,我对这个行业还是怀着无限的遐想,在这里,我也从一个Android应用工程师转变成了Android系统工程师,我从上层走了下来,虽说没有精通,但是也算是摸爬滚打了一阵子,很多人不是很清楚车载行业是个什么样子的,其实就是系统的定制,加上一些自家的服务,一般的产品有

  • 车机
  • 后视镜
  • 行车记录仪

等等等等,而每家做的款式也差不多,最后沦为和手机一样,开始比拼硬件了,什么LTE 4G啊,什么大内存,高清摄像头,一体化娱乐服务等,这就是一个简单的车载行业的概括,当然,我说的也不是很全,主要是我从软件层面去分析,如果真的严格意义上来说,一个车载产品的研发一般周期都需要很长时间,因为从硬件到软件可不是一朝一夕的事情,硬件的不稳定可能直接导致你软件的不稳定以及产品的缺陷,这里也做了一个铺垫,行业的改变而已

四.语音服务

语音服务是我进这个行业以来做的最多且现在还在一直做的事情,起初的语音非常的简单,他只有三个功能

  • TTS
  • 识别
  • 唤醒

TTS相对来说,没什么可说的,主要是给他一个字符串他读出来就好了,这里可能最多提及的就是发音的多选和语音和播报的监听了,识别也是最核心的一个功能,他包含的也是整个语音算法的核心输出结果-识别率,还有就是人性化的一些功能,这部分讯飞做的还是比较好的,这些我们后面会讲,还有就是唤醒,唤醒其实应该算是一个定制的服务,因为你只要说关键字语音就会唤醒,这里肯定是要Service不死,而如果是应用的话,我相信也没有哪家厂商的手机会待见你的apk,我们自家的系统肯定是不怕的,白名单什么的,想怎么做就怎么做,这里简单的为语音服务做了一个铺垫的交代了

五.人工智能语音

相信你听到人工智能语音,一定会觉得很高大上是吧?其实不然,这样看你选择的是什么服务方向了,我大体的分三个类别来描述

  • SDK
  • 深度定制
  • 开发算法库

首先是SDK,SDK的话,可能你用哪家都无所谓,他们提供了标注你的文档个Demo给你,但是这样确实是算不上智能,功能是有限的,而深度定制也是我目前在使用的, 涉及的权限也是更多的,可定制的内容也是十分的丰富的,而开发算法库,就要涉及的知识面多了,我们倒是并没有多少研究,对比了一些差异性,我做过很多家的语音,讯飞,云之声,同行者等算是国内比较出名的,还有一些小公司的语音,基本上都开发过,最大的感受就是逻辑交互方面了

现在我的语音应该是可以算得上是很智能了,长时间的对话,基本逻辑,和对源码的控制,能为用户做的事情是非常的多的,我在想,如果能深入机器人神经学的研究,那会不会也能直接使用这套服务呢?后来想想,自己还是有点天真,机器人如果只是简单的语音操作,那其实没有多大的魅力,更大的魅力来源他的动作和自学能力吧?以后如果有机会的话一定要去研究一下!到这里,伏笔也算是写完了,因为身处在车载行业,所有后续肯定会去研究无人驾驶,特斯拉使用的方案系统核心是Linux,非常厉害!

六.开始/结束

到这里也简单的聊完了我这些年工作的一些想法,其实我还是比较建议学习Android的去学习一下系统开发, 对你的帮助也是非常大的,扯了这么多,也没讲到什么重点,感谢你看了这么久,这篇文章算是结束了,但是我们的征途也才刚刚开始

这里写图片描述

博客地址:http://blog.csdn.net/qq_26787115
微博地址:点击关注我的微博

我的公众号,期待你的关注

weixin

这篇关于语音人工智能的征途,我在车载行业的这些年的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/428176

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

基于人工智能的智能家居语音控制系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 随着物联网(IoT)和人工智能技术的发展,智能家居语音控制系统已经成为现代家庭的一部分。通过语音控制设备,用户可以轻松实现对灯光、空调、门锁等家电的控制,提升生活的便捷性和舒适性。本文将介绍如何构建一个基于人工智能的智能家居语音控制系统,包括环境准备

国产游戏行业的崛起与挑战:技术创新引领未来

国产游戏行业的崛起与挑战:技术创新引领未来 近年来,国产游戏行业蓬勃发展,技术水平不断提升,许多优秀作品在国际市场上崭露头角。从画面渲染到物理引擎,从AI技术到服务器架构,国产游戏已实现质的飞跃。然而,面对全球游戏市场的激烈竞争,国产游戏技术仍然面临诸多挑战。本文将探讨这些挑战,并展望未来的机遇,深入分析IT技术的创新将如何推动行业发展。 国产游戏技术现状 国产游戏在画面渲染、物理引擎、AI

从希腊神话到好莱坞大片,人工智能的七大历史时期值得铭记

本文选自historyextra,机器之心编译出品,参与成员:Angulia、小樱、柒柒、孟婷 你可能听过「技术奇点」,即本世纪某个阶段将出现超级智能,那时,技术将会以人类难以想象的速度飞速发展。同样,黑洞也是一个奇点,在其上任何物理定律都不适用;因此,技术奇点也是超越未来理解范围的一点。 然而,在我们到达那个奇点之前(假设我们能到达),还存在另一个极大的不连续问题,我将它称之

[Day 73] 區塊鏈與人工智能的聯動應用:理論、技術與實踐

AI在健康管理中的應用實例 1. 引言 隨著健康管理需求的提升,人工智能(AI)在該領域的應用越來越普遍。AI可以幫助醫療機構提升效率、精準診斷疾病、個性化治療方案,以及進行健康數據分析,從而改善病患的健康狀況。這篇文章將探討AI如何應用於健康管理,並通過具體代碼示例說明其技術實現。 2. AI在健康管理中的主要應用場景 個性化健康建議:通過分析用戶的健康數據,如飲食、運動、睡眠等,AI可

LLM系列 | 38:解读阿里开源语音多模态模型Qwen2-Audio

引言 模型概述 模型架构 训练方法 性能评估 实战演示 总结 引言 金山挂月窥禅径,沙鸟听经恋法门。 小伙伴们好,我是微信公众号《小窗幽记机器学习》的小编:卖铁观音的小男孩,今天这篇小作文主要是介绍阿里巴巴的语音多模态大模型Qwen2-Audio。近日,阿里巴巴Qwen团队发布了最新的大规模音频-语言模型Qwen2-Audio及其技术报告。该模型在音频理解和多模态交互