foundational专题

从视觉任务(识别/定位/分割/追踪..)出发,调研各种模态提示的视觉大模型CV-VLM综述论文详细阅读:Foundational Models Defining a New Era in Vision

本篇主要讲解了在视觉领域中视觉语言模型的发展历程,每种VLM基础模型提出的背景,设计方案,应用领域等,调查了关于图像识别,图像定位,图像分割,字幕生成,视频追踪等方向相关的模型。 Foundational Models Defining a New Era in Vision: A Survey and Outlook 定义视觉新时代的基本模型:调查与展望 paper: 2307.13