conformer专题

IEEE T-ASLP | 利用ASR预训练的Conformer模型通过迁移学习和知识蒸馏进行说话人验证

近期，昆山杜克大学在语音旗舰期刊 IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP)上发表了一篇题为“Leveraging ASR Pretrained Conformers for Speaker Verification Through Transfer Learning and Knowledge Di

番外篇 | YOLOv5更换主干网络之Conformer：首个CNN + Transformer的backbone模型

前言：Hello大家好，我是小哥谈。Transformer和CNN在处理视觉表征方面都有着各自的优势以及一些不可避免的问题。因此，国科大、鹏城实验室和华为研究人员首次将二者进行了融合并提出全新的Conformer模型，其可以在不显著增加计算量的前提下显著提升了基网表征能力。论文已被ICCV 2021接收。🌈 目录 🚀1.论文

简要论文笔记:Conformer: Local Features Coupling Global Representations for Visual Recognition

作者团队： Zhiliang Peng，Wei Huang，Shanzhi Gu，Lingxi Xie，Yaowei Wang，Jianbin Jiao，Qixiang Ye国科大，华为，鹏城实验室在下面我们将简要总结一下介绍一下Conformer，有兴趣的读者可以看下原文：论文原文 VIT后很多工作都是想办法把transforemer和convolution结合起来，希望同时享受各自的优

Conformer: Local Features Coupling Global Representations for Visual Recognition

摘要在卷积神经网络(CNN)中，卷积运算擅长提取局部特征，但难以捕获全局表示。在visual transformer中，级联的自注意模块可以捕获长距离的特性依赖关系，但不幸的是会恶化本地特性细节。在本文中，我们提出了一种混合网络结构，称为Conformer，以利用卷积操作和自注意机制来增强表示学习。Conformer起源于特征耦合单元(Feature Coupling Unit, FCU)

MFA-Conformer

基于多尺度特征聚合Conformer说话人识别模型的创新与应用论文：https://arxiv.org/abs/2203.15249 代码：GitHub - zyzisyz/mfa_conformer 收录于 INTERSPEECH 2022 1. 简介本文由清华大学与腾讯科技（北京）有限公司、台湾大学及香港中文大学合作。提出了一种基于Conformer的多尺度特征融合的说话人识