本文主要是介绍多模态大模型:关于RLHF那些事儿,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Overview
- 多模态大模型关于RLHF的代表性文章
- 一、LLaVA-RLHF
- 二、RLHF-V
- 三、SILKIE
多模态大模型关于RLHF的代表性文章
一、LLaVA-RLHF
题目: ALIGNING LARGE MULTIMODAL MODELS WITH FACTUALLY AUGMENTED RLHF
机构:UC伯克利
论文: https://arxiv.org/pdf/2309.14525.pdf
代码:https://llava-rlhf.github.io/
任务:
特点:
方法:
前置相关工作:
二、RLHF-V
题目:RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from Fine-grained Correctional Human Feedback
机构:清华,新加坡国立
论文ÿ
这篇关于多模态大模型:关于RLHF那些事儿的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!