机器学习初学者不可错过的ModelScope开源模型社区

本文主要是介绍机器学习初学者不可错过的ModelScope开源模型社区,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • ModelScope开源模型社区
    • 快速入门及环境安装
  • 模型库
  • 下载数据集
  • 达摩卡通化模型
    • 模型介绍
    • 下载模型文件
    • 快速入手
  • 达摩人像抠图
    • 在线抠图
    • 本地抠图
  • 总结:

ModelScope开源模型社区

对于刚刚接触机器学习的开发者来说,ModelScope开源模型社区是你不容错过的选择!
ModelScope开源模型社区
在这里插入图片描述

快速入门及环境安装

在这里你不仅可以在线体验开源模型,下载数据集,还可以根据说明文档配置环境,手把手的教你如何本地开发环境安装。

安装python环境。
支持python3,不支持python2,建议3.7版本及以上。推荐您使用Anaconda进行安装。
安装深度学习框架。
ModelScopeLibrary目前支持Tensorflow,Pytorch两大深度学习框架进行模型训练、推理。您可根据模型所需的框架选择适合的框架进行安装。
安装ModelScope Library。
提供两种安装方式,您可选择适合的方式进行安装。
pip安装。ModelScope提供了根据不同领域的安装包,您可根据对应的模型选择所需的安装包。
使用源码安装。

还有更加详细的安装指南!
在这里插入图片描述

主要有两大功能,模型库和数据集。

模型库

模型分为两类,可在线体验和可训练。
在这里插入图片描述

下载数据集

可以查找你想要的数据集。
例如我要分类豌豆,就要下载一些豌豆图片作为训练集

在这里插入图片描述
这里有数据集的介绍,数据预览和下载数据集文件。

如果有疑问可以到文档中心查找。
在这里插入图片描述

达摩卡通化模型

输入一张人物图像,实现端到端全图卡通化转换,生成二次元虚拟形象,返回卡通化后的结果图像。
类似网上很火的人像动漫

模型介绍

在这里插入图片描述
详细的介绍了该模型的功能以及原理,并且指出使用的方式和范围。
还有模型的训练集,推理过程,数据评估等等。

这里我们体验一下在线!
在这里插入图片描述
速度还是很快的,卡通化的程度也很高!
人像这方面没什么问题,下面我们上传风景照片看一下
在这里插入图片描述
风景照片也是很不错的,所以我觉得不仅仅可以用到人像上面,对于一些风景来说将其卡通化,也别有一种意境!

下载模型文件

在这里插入图片描述

快速入手

在这里插入图片描述

由于配置本地环境有些麻烦,为了更快的体验产品,这里选择了使用ModelScope提供的远程环境,即使用Notebook进行开发,更加方便和快捷。
在这里插入图片描述
选择免费版本即可。

在这里插入图片描述
上传要抠图的图片

在这里插入图片描述
粘贴示例代码

import cv2
from PIL import Image
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasksimg_cartoon = pipeline(Tasks.image_portrait_stylization, 'damo/cv_unet_person-image-cartoon_compound-models')
result = img_cartoon('/mnt/workspace/image_cartoon.png')
cv2.imwrite('result.png', result[OutputKeys.OUTPUT_IMG])
im = Image.open('result.png')
im.show()

在这里插入图片描述

运行
在这里插入图片描述
输出并展示卡通化的图片!

达摩人像抠图

人像抠图对输入含有人像的图像进行处理,无需任何额外输入,实现端到端人像抠图,输出四通道人像抠图结果。
在这里插入图片描述

在线抠图

在这里插入图片描述
这个效果惊艳到我了😲,我也学过一点PS但是抠成这样对我是很难的,连头发丝都能抠出来,拯救了不会抠图的我!
在这里插入图片描述

效果非常好呀!

本地抠图

在这里插入图片描述
报错我调试了一会也没成功。

总结:

虽然有的模型有些不足,但总体来说模型的训练度很高,速度也很快,对于机器学习有很大的帮助,可以在上面找一些项目自己动手做做,很轻松就能实现一个项目。由于我比较喜欢计算机视觉方面,所以我介绍几个计算机视觉方面的,这里还有很多模型如果有你喜欢的大家可以去尝试尝试!

计算机视觉

单标签图像分类 通用图像分割 文字检测 人像美肤 风格迁移 图像翻译

自然语言处理

分词 情感分类 句子相似度 关系抽取 零样本分类 翻译

语音

语音识别 语音合成 语音唤醒 音频分类 语音降噪 回声消除
多模态
图像描述 视觉定位 文本生成图片 多模态表征 视觉问答 图文检索

ModelScope开源模型社区

这篇关于机器学习初学者不可错过的ModelScope开源模型社区的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/440687

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss