首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
conformer专题
IEEE T-ASLP | 利用ASR预训练的Conformer模型通过迁移学习和知识蒸馏进行说话人验证
近期,昆山杜克大学在语音旗舰期刊 IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP)上发表了一篇题为“Leveraging ASR Pretrained Conformers for Speaker Verification Through Transfer Learning and Knowledge Di
阅读更多...
番外篇 | YOLOv5更换主干网络之Conformer:首个CNN + Transformer的backbone模型
前言:Hello大家好,我是小哥谈。Transformer和CNN在处理视觉表征方面都有着各自的优势以及一些不可避免的问题。因此,国科大、鹏城实验室和华为研究人员首次将二者进行了融合并提出全新的Conformer模型,其可以在不显著增加计算量的前提下显著提升了基网表征能力。论文已被ICCV 2021接收。🌈 目录 🚀1.论文
阅读更多...
简要论文笔记:Conformer: Local Features Coupling Global Representations for Visual Recognition
作者团队: Zhiliang Peng,Wei Huang,Shanzhi Gu,Lingxi Xie,Yaowei Wang,Jianbin Jiao,Qixiang Ye国科大,华为,鹏城实验室 在下面我们将简要总结一下介绍一下Conformer,有兴趣的读者可以看下原文:论文原文 VIT后很多工作都是想办法把transforemer和convolution结合起来,希望同时享受各自的优
阅读更多...
Conformer: Local Features Coupling Global Representations for Visual Recognition
摘要 在卷积神经网络(CNN)中,卷积运算擅长提取局部特征,但难以捕获全局表示。在visual transformer中,级联的自注意模块可以捕获长距离的特性依赖关系,但不幸的是会恶化本地特性细节。在本文中,我们提出了一种混合网络结构,称为Conformer,以利用卷积操作和自注意机制来增强表示学习。Conformer起源于特征耦合单元(Feature Coupling Unit, FCU)
阅读更多...
MFA-Conformer
基于多尺度特征聚合Conformer说话人识别模型的创新与应用 论文:https://arxiv.org/abs/2203.15249 代码:GitHub - zyzisyz/mfa_conformer 收录于 INTERSPEECH 2022 1. 简介 本文由清华大学与腾讯科技(北京)有限公司、台湾大学及香港中文大学合作。提出了一种基于Conformer的多尺度特征融合的说话人识
阅读更多...