云服务器平台AutoDL--基本介绍与使用感受

2024-05-29 01:04

本文主要是介绍云服务器平台AutoDL--基本介绍与使用感受,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

因为课程作业需要复现DreamBooth,找了几个教程之后,发现了AutoDL这个好东西,芜湖~

相关概念

以下回答来自于ChatGPT

云计算平台:云服务器平台是提供按需计算资源和服务的在线平台,通常包括存储、处理能力、数据库、网络等。

实例:在云计算平台中,“实例”通常是指一个虚拟服务器或虚拟机(Virtual Machine, VM),它运行在云提供商的基础设施上。实例是云计算服务的基本单元,用户可以根据需要启动、停止和配置实例。

镜像:镜像(Image)是一个包含操作系统、应用程序、配置和数据的模板,用于创建虚拟机实例。镜像使得用户可以快速和一致地部署多个相同配置的虚拟机。

基本界面

网址

AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDL

优势

1. 实例数量较多

在我使用的几个时间段内(上午、下午、凌晨)似乎没有遇到过没有空卡的情况,而且价格便宜。

2. 操作简单快捷

根据实际使用需求,GPU数量可选,数据盘可扩容。

(本人暂时还没有使用过多块GPU进行训练,下次可以试试看会不会缩短训练的时间)

(在上次的使用过程中,因为每500步保存一次模型,保存次数过多,第一次遇到了数据盘用完的情况,感受到了数据盘可以灵活扩容的好处)

在创建镜像时,可以直接根据需求进行框架+Python+CUDA的组合搭配。

这里搭配完之后直接开机即可,非常简单。

支持正常的ssh登录访问,教程部分参考《云服务器平台Featurize--基本使用步骤与使用感受_featurize教程-CSDN博客》,也可以使用JupyterLab进行操作,JupyterLab可以和实现和命令行一样的效果。

3. 容器实例可以保存并更换硬件运行

这个功能字面意思首先就是我配置好的环境可以直接单独进行保存,这可以带来几个直接的好处:

(1)换卡开机

当原本的主机ID被占用时,可以快捷地将原本使用的环境复制到其他主机上开机运行,经过实测,同一配置的实例可以直接运行同一环境。

通过上面的克隆实例,可以直接更换运行的硬件,当原本的实例在关机后被他人占用时,该功能非常有用。

比如原本我的镜像运行在主机ID为666的一块3090上,但是我上次使用完关机之后,现在这个主机的所有GPU都被其他人租用了,现在我只需要将数据和环境都拷贝到有空GPU的主机(ID为888)上,即可继续我原本的实验,这种问题主要出现在上次使用featurize时。

(2)使用他人配置好的实例镜像

可以直接在CodeWithGPU上找到需要运行的模型所需要的环境,网址如下:

CodeWithGPU | 能复现才是好算法

就像他的slogan写到的:能复现的才是好算法。有的机器学习教程会直接给出自己在该平台的镜像分享,用户可以直接拉取,然后用一模一样的环境进行复现,再也不用担心环境不一样导致的复现效果差异,也无需在环境配置上浪费很多时间!

比如我使用的DreamBooth环境,教程中既给出了代码训练环境,也给出了webui的使用环境。

DreamBooth的教程链接如下:

CrazyBoyM/dreambooth-for-diffusion/dreambooth-for-diffusion: 首个完整封装、一体化训练stable diffusion dreambooth的镜像环境,可训练定制自己的独特大模型风格、人物,开箱即用,内含详细教程。 - CG (codewithgpu.com)

我还在这个CodeWithGPU中搜索了之前我使用过的Mask-RCNN,虽然没有配置好的环境镜像,但是也有相关的模型使用步骤,等下次看下实际的使用效果。

需要注意的是:

  1. 现在CodeWithGPU上能找到的环境镜像还是比较少;
  2. 在CodeWithGPU还是要比直接在创建镜像时检索到的内容要多些。

这篇关于云服务器平台AutoDL--基本介绍与使用感受的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1012200

相关文章

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

基本知识点

1、c++的输入加上ios::sync_with_stdio(false);  等价于 c的输入,读取速度会加快(但是在字符串的题里面和容易出现问题) 2、lower_bound()和upper_bound() iterator lower_bound( const key_type &key ): 返回一个迭代器,指向键值>= key的第一个元素。 iterator upper_bou