phi3.5专题

VLM 系列——phi3.5-Vision——论文解读

一、概述 1、是什么     论文全称《Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone》 是一系列大型语言模型(LLM) & 多模态大型语言模型(MLLM)。其中LLM包括phi-3-mini 3.8B、phi-3-small 7B、phi-3-medium 14B,phi-3-mini

小模型血战 phi3.5暂时胜出

背景 大模型推理成本高,训练成本高,百万美金训练一次,全量微调,加载到GPU显存都成本很高,创业公司没法搞,一般的公司想到还没想到用大模型挣钱了,就要这么大投入。基本犹豫就不投入,投入的基本也是弄上AI高大上的概念融资,用投资人的钱去烧。百团大战,打车争霸,那是能看到的挣钱。最终是要从用户身上挣的 大模型呢,openai,Anthropic公司,是TO B 和TO C能挣大钱,那投入国内有一家能