diffusion初探——使用hugging face镜像网站所遇到的问题

2024-04-16 05:36

本文主要是介绍diffusion初探——使用hugging face镜像网站所遇到的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


在这里插入图片描述

序言

近期hugging face官网无法直接从国内访问(可用梯子解决),故无法像之前方法在服务器上直接访问,本文采取的方法是:使用国内替换原hugging face网站,https://hf-mirror.com/
但这样势必会带来一些问题,这里将使用DreamBooth生成“土豆先生”作为示例,逐一描述本人遇到的问题:本人刚接触diffusion,不喜勿喷)

问题

1.登录问题

from huggingface_hub import notebook_login
notebook_login()

以往运行上述代码,便可弹出一个窗口,输入token即可登录,
image.png
而现在报错:
image.png
查找原因发现是

“Ipywidgets (Vbox) not showing up on Jupyter notebook”

但并非Ipywidgets,笔者尝试了重新安装Ipywidgets和安装有关插件,但并没有效果,最后想到是网络原因,更改镜像源:

import os
#更改huggingface网址
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com/'
# 每次使用均要重新设置,不如写入.bashrc,则无需反复写入(linux代码如下:)
!echo 'export HF_ENDPOINT="https://hf-mirror.com"' >> ~/.bashrc

image.png

2.预训练参数载入问题

在使用DiffusionPipeline.from_pretrained时,发现无法找到对应的url,即:url为https://hf-mirror.com//api/models/sd-dreambooth-library/mr-potato-head,但实际是https://hf-mirror.com/sd-dreambooth-library/mr-potato-head,多了“/api/models/”,尝试通过继承的方式解决,未果!
有知道解决的小伙伴在评论区留言,感谢!

from diffusers import DiffusionPipeline
model_id = "sd-dreambooth-library/mr-potato-head"
pipe = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16).to(device
)

image.png
遂采用离线下载的方式进行实现:(注意只使用本地文件 local_files_only = True)

from diffusers import DiffusionPipeline
# Check out https://huggingface.co/sd-dreambooth-library for loads of models from the community
model_id = "/root/lanyun-tmp/data"
# model_id = "sd-dreambooth-library/mr-potato-head"# Load the pipeline 
# 只使用本地文件 local_files_only = True
pipe = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16,local_files_only = True).to(device
)

image.png

3.离线下载问题

主要推荐 使用huggingface-cli下载数据,–resume-download是模型名字,–local-dir是本地地址。

!huggingface-cli download --resume-download sd-dreambooth-library/mr-potato-head --local-dir /root/lanyun-tmp/data  

使用huggingface-cli下载数据

huggingface-cli 隶属于 huggingface_hub
库,不仅可以下载模型、数据,还可以可以登录huggingface、上传模型、数据等。huggingface-cli
属于官方工具,其长期支持肯定是最好的。优先推荐!
–local-dir-use-symlinks False
参数可选,因为huggingface的工具链默认会使用符号链接来存储下载的文件,导致–local-dir指定的目录中都是一些“链接文件”,真实模型则存储在~/.cache/huggingface下,如果不喜欢这个可以用
–local-dir-use-symlinks False取消这个逻辑。
参考链接:https://zhuanlan.zhihu.com/p/663712983

但笔者在–local-dir-use-symlinks
False时,发现其只会存储在~/.cache/huggingface下,且不完整,故取消了。

使用git lfs下载

方法简单但网络连接不好:

sudo apt-get install git-lfs
git clone https://hf-mirror.com/johnowhitaker/ddpm-butterflies-32px

推荐先GIT_LFS_SKIP_SMUDGE=1 git clone(跳过下载 LFS 文件)

其次再对大文件用第三方、成熟的多线程下载工具,Linux 和 Mac OS 推荐hfd脚本+aria2c,Windows 推荐
IDM。用第三方工具的好处是,下载上百GB的模型、数据集,你可以放个一晚上,第二天就下载好了,而不是第二天早晨发现下载了10%断了还得继续。

笔者下载七十多MB的.bin文件还给我断了,只下小的还行,特别是只有几个LFS文件时,简单好用!

代码:

# !export HF_ENDPOINT='https://hf-mirror.com/'
import os
#更改huggingface网址
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com/'
# !echo 'export HF_ENDPOINT="https://hf-mirror.com"' >> ~/.bashrc
from huggingface_hub import notebook_login
notebook_login()%pip install -U diffusers datasets transformers accelerate ftfy pyarrow==9.0.0 matplotlibimport numpy as np
import torch
import torch.nn.functional as F
from matplotlib import pyplot as plt
from PIL import Image
# Mac users may need device = 'mps' (untested)
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")#数据下载
!huggingface-cli download --resume-download sd-dreambooth-library/mr-potato-head --local-dir /root/lanyun-tmp/data  # 观察采样步骤数量和结果关系
prompt = "an abstract oil painting of sks mr potato head by picasso"
# prompt = "an beautiful lady walk in the street on a sunny day"
#num_inference_steps 采样步骤数量,guidance_scale 输出与提示的匹配程度
num_list_length = np.arange(30,130,10)
images = []
for i in num_list_length:image = pipe(prompt, num_inference_steps=i, guidance_scale=0.7).images[0]images.append(image)#可视化
# make_grid(images)
import matplotlib.pyplot as plt
# 创建一个新的 matplotlib 图片和子图,设置每个子图的大小为10x10
fig, axs = plt.subplots(1, len(images), figsize=(10*len(images), 10))
# 遍历每个图片和对应的子图
for img, ax, size in zip(images, axs, num_list_length):# 显示图片ax.imshow(img)# 移除坐标轴ax.axis('off')# 在图片下方添加标题ax.set_title(str(size),fontsize=20)
# 显示所有的子图
plt.show()
# 保存图片到文件
fig.savefig('采样步骤数量和结果关系.png')

215c20b94285bb4a17da13b57cec4b5.png

这篇关于diffusion初探——使用hugging face镜像网站所遇到的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/907912

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

好题——hdu2522(小数问题:求1/n的第一个循环节)

好喜欢这题,第一次做小数问题,一开始真心没思路,然后参考了网上的一些资料。 知识点***********************************无限不循环小数即无理数,不能写作两整数之比*****************************(一开始没想到,小学没学好) 此题1/n肯定是一个有限循环小数,了解这些后就能做此题了。 按照除法的机制,用一个函数表示出来就可以了,代码如下

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

购买磨轮平衡机时应该注意什么问题和技巧

在购买磨轮平衡机时,您应该注意以下几个关键点: 平衡精度 平衡精度是衡量平衡机性能的核心指标,直接影响到不平衡量的检测与校准的准确性,从而决定磨轮的振动和噪声水平。高精度的平衡机能显著减少振动和噪声,提高磨削加工的精度。 转速范围 宽广的转速范围意味着平衡机能够处理更多种类的磨轮,适应不同的工作条件和规格要求。 振动监测能力 振动监测能力是评估平衡机性能的重要因素。通过传感器实时监