Unprocessing Images for Learned Raw Denoising 今天介绍谷歌发表在 2019 CVPR 上的一篇文章,Unprocessing Images for Learned Raw Denoising,这篇文章主要为了解决数据构造的问题,简单来说,就是将 ISP 的流程逆过来,从 sRGB 图像变到 RAW 图,然后进行模型训练,从而达到降噪的过程。 我们都
Learned Queries for Efficient Local Attention Abstract (Vision transformer, ViT)是一种强大的视觉模型。与前几年主导视觉研究的卷积神经网络不同,ViT具有捕获数据中的长期依赖关系的能力。尽管如此,任何transformer体系结构的一个组成部分,即自注意力机制,都存在高延迟和低效的内存利用问题,这使得它不太适合高分
Clustering-Based Speech Emotion Recognition by Incorporating Learned Features and Deep BiLSTM 复现日志 2021/11/22 阅读文章后初步构思复现内容: 数据集的下载和管理(注意speaker dependent和speaker independent数据集处理方式是不同的,需要设置一