hugging face：大模型时代的github介绍

本文主要是介绍hugging face：大模型时代的github介绍，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1. Hugging Face是什么：

Hugging Face大模型时代的“github”，很多人有个这样的认知，但是我觉得不完全准确，他们相似的地方在于资源丰富，github有各种各样的软件代码和示例，但是它不是系统的，没有经过规划管理，Hugging Face不一样，它是有系统的，有更聚焦的主题，规划和主线。

我尝试这样去理解它，希望会更加贴切：

如果大模型是一盘盘精致的菜肴，那么Hugging Face就是一个设备和食材丰富的中央厨房，走进去挑选趁手的锅碗瓢盆和食材就可以做菜，里面还有预制菜，利用它的资源很容易就能做出所需要的菜肴。

大模型是菜肴，Hugging Face就是设备食材都齐全的中央厨房。

2. Hugging Face有哪些东西？

对于做大模型相关的人来说，Hugging Face就是个宝藏库，里面超多好用的东西，但是想要快速理解，对初学者有实际价值的，主要是三大块：

Hugging Face hub ：镜像云资源池，里面有各种大模型和数据集，可以直接API下载调用，只要知道每个大模型能干什么，就可以即拿即用。
Transformers : 大模型工具集，一系列的API用来加载模型数据，前后处理，数据处理，模型训练，模型量化，模型fine-tune等功能。
Hugging Face Spaces：云计算资源，可免费托管你自己的应用或者大模型，提供远程界面验证和演示。

2.1 Hugging Face Hub

https://huggingface.co/

Hugging Face Hub就是一个池子，里面有丰富的资源，主要的就是模型和数据。有超过1万个预训练模型，以及对应的数据，详细如下：

The Hugging Face Hub is a platform with over 120k models, 20k datasets, and 50k demos in which people can easily collaborate in their ML workflows. The Hub works as a central place where anyone can share, explore, discover, and experiment with open-source Machine Learning.

2.1.1 模型

模型是分类的，有计算机视觉相关的，NLP，多模态，语音，表格处理，强化学习等等，资源非常丰富，详细分类如下：

计算机视觉

深度估计，图片分类，物体检测，图片分割，文生图，图生文，图生图，图生视频等等。

NLP

多模态：

虚拟问答，图生文，文档问答等

Audio

文字生成语音，自动语音识别，语音转语音，语音分类等

表格处理

表格的分类和表格表示

强化学习

强化学习和机器人相关

其他

2.1.2 数据

数据的分类和模型的一模一样，基本上模型有的数据也配套有。

2.2 Transformers 工具集

首先它是一个Python 库。

这个库能直接加载支持的多种模型和数据，它跟hub里面的资源是无缝连接，可以利用它进行模型的训练，fine-tune，量化，前后处理以及运行等，要用大模型做测试验证或者做产品，它提供全面的工具集API接口。

如果要开始coding，基于hugging face平台，Transformers是首先要熟悉和了解的资源库。

2.3 Hugging Face Spaces

https://huggingface.co/spaces

Spaces本质是一个算力平台，从价值体现来看它是一个大模型的展示台，Hugging Face提供的开放平台可以运行跑你自己的应用，可以和github联动，提交后自动构建，提供便利的web ui交互方式，让开发自己的大模型应用变得非常直观和简单。

大模型是菜肴，但是好不好吃合不合口味你不知道，Spaces提供一个免费厨房，根据你的菜谱自动做给你吃，让你尝一尝，同时也能开源，其他人想吃也可以直接在Spaces里直接尝。

一个非常便利的好处就是你开源了一个工程，其他开发者想要快速直观地看一下效果，Spaces能提供给你这个平台，但是天下没有免费的午餐，免费的空间是有限制的，要更强的服务需要收费。

比如如下腾讯托管的一个开源项目，https://github.com/TencentARC/InstantMesh，它是一个提供2D图片，给你生成3D的多维度的效果，在Spaces上有免费的示例可以测试验证：（左边输入一张图片，会生成右边多个维度的图片以及3D的图片），还有很多其他的LLM模型都有托管工程可以测试。