paddlemm专题

基于飞桨搭建的多模态学习工具包PaddleMM

随着计算机视觉、自然语言处理、语音识别等技术的快速发展,现有的人工智能技术在处理单模态数据方面取得了显著的成效。然而,在现实生活中,数据呈现的形式多种多样,例如我们阅读的文字、听到的声音、观看的视频等,这些多源异构信息称为多模态数据,而机器学习领域将挖掘和分析多模态数据的一类算法归为多模态学习方法。为使人工智能更好地理解真实环境,多模态学习近年来引起了研究者的广泛关注,在相关应用领域取得了长