VCED:学习Jina的简单操作

2023-10-18 06:10
文章标签 简单 学习 操作 vced jina

本文主要是介绍VCED:学习Jina的简单操作,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • VCED:学习Jina的简单操作
      • 在pycharm里连接docker环境
      • 几个简单的jina demo
        • image
        • text
        • video

VCED:学习Jina的简单操作

在pycharm里连接docker环境

在pycharm里找到docker环境

image-20221116203244305

New一个环境

image-20221116203553385

在docker里进入terminal,找到python 位置

image-20221116203111904

成功得到decker环境

image-20221116203655175

运行jina的代码

image-20221116203802814

几个简单的jina demo

image
  1. 读取图片并转为tensor
from jina import Documentd = Document(uri='lena.jpg')
d.load_uri_to_image_tensor()print(d.tensor.shape)  # (618, 641, 3)
print(d.tensor)

这里用一个图像处理的经典图片lena

image-20221116215829665

得到了结果

image-20221116215903974

  1. 进行简单的图形处理
from jina import Documentd = (Document(uri='lena.jpg').load_uri_to_image_tensor().set_image_tensor_shape(shape=(224, 224))  # 设置shape.set_image_tensor_normalization()  # 标准化.set_image_tensor_channel_axis(-1, 0)  # 更改通道
)print(d.tensor.shape)  # (3, 224, 224)
print(d.tensor)# 你可以使用 save_image_tensor_to_file 将 tensor 转为图像。当然,因为做了预处理,图片返回时损失了很多信息。
d.save_image_tensor_to_file('lena-proc.png', channel_axis=0)  # 因为前面进行了预处理,channel_axis应该设为0

得到了图片

image-20221116220219703

读取图像数据集

Omniglot数据集是由来自50种不同语言的1,623个手写字符构成的,每个字符都有20个不同的笔迹,这就构成了一个样本类别极多(1623种),但每种类别的样本数量极少(20个)的小样本手写字符数据集。使用中通常选择1200种字符作为训练集,剩余的423种字符作为验证集,并通过旋转90°,180°和270°进行数据集扩张,每张图片通过裁剪将尺寸统一为28*28。

这个报错暂时没解决

  1. 切割大型图像
from jina import Documentd = Document(uri='complicated-image.jpeg')
d.load_uri_to_image_tensor()
print(d.tensor.shape)  # (792, 1000, 3)

原图像shape为(792, 1000, 3)

image-20221116223017891

使用 6464 的滑窗切割原图像,切分出 1215=180 个图像张量

d.convert_image_tensor_to_sliding_windows(window_shape=(64, 64))
print(d.tensor.shape)  # (208, 64, 64, 3)

可以通过 as_chunks=True,使得上述 180 张图片张量添加到 Document 块中。

# PS:运行这行代码时,需要重新 load image tensor,否则会报错。
d = Document(uri='complicated-image.jpeg')
d.load_uri_to_image_tensor()
d.convert_image_tensor_to_sliding_windows(window_shape=(64, 64), as_chunks=True)
print(d.chunks)

使用 plot_image_sprites 将各个 chunk 绘制成图片集图片

d.chunks.plot_image_sprites('simpsons-chunks.png')

因为采用了滑动窗口扫描整个图像,使用了默认的 stride,切分后的图像不会有重叠,所以重新绘制出的图和原图差别不大。

image-20221116223050151

也可以通过设置 strides 参数进行过采样。

d.convert_image_tensor_to_sliding_windows(window_shape=(64, 64), strides=(10, 10), as_chunks=True)
d.chunks.plot_image_sprites('simpsons-chunks-stride-10.png')

得到过采样的图片

image-20221116223226093

text
  1. 创建简单的文本数据
d = Document(text='hello, world.')
print(d.text)  # 通过text获取文本数据

打印出结果

image-20221116230258382

对于网页,如果文本数据很大,或者自URI,可以先定义URI,然后将文本加载到文档中

image-20221116230038723

d = Document(uri='https://www.w3.org/History/19921103-hypertext/hypertext/README.html')
d.load_uri_to_text()
print(d.text)

打印结果

image-20221116230325450

支持多语言

d = Document(text='👋   नमस्ते दुनिया! 你好世界!こんにちは世界!  Привет мир!')
print(d.text)
  1. 切割文本
from jina import Document  # 导包d = Document(text='👋  नमस्ते दुनिया! 你好世界!こんにちは世界!  Привет мир!')
d.chunks.extend([Document(text=c) for c in d.text.split('!')])  # 按'!'分割
d.summary()
  1. text、ndarray互转
from jina import DocumentArray, Document  # 导包# DocumentArray 相当于一个 list,用于存放 Document
da = DocumentArray([Document(text='hello world'),Document(text='goodbye world'),Document(text='hello goodbye')])
print(da)

结果

<DocumentArray (length=3) at 140342285532224>

转为字典

vocab = da.get_vocabulary()
print(vocab)

结果

{'hello': 2, 'world': 3, 'goodbye': 4}

text转为tensor向量

for d in da:d.convert_text_to_tensor(vocab, max_length=10)  # max_length为向量最大值,可不设置print(d.tensor)

结果

[0 0 0 0 0 0 0 0 2 3]
[0 0 0 0 0 0 0 0 4 3]
[0 0 0 0 0 0 0 0 2 4]

tensor向量转为text

for d in da:d.convert_tensor_to_text(vocab)print(d.text)

结果

hello world
goodbye world
hello goodbye
  1. 简单的文本匹配
from jina import Document, DocumentArrayd = Document(uri='https://www.gutenberg.org/files/1342/1342-0.txt').load_uri_to_text()  # 链接是傲慢与偏见的电子书,此处将电子书内容加载到 Document 中
da = DocumentArray(Document(text=s.strip()) for s in d.text.split('\n') if s.strip())  # 按照换行进行分割字符串
da.apply(lambda d: d.embed_feature_hashing())q = (Document(text='she entered the room')  # 要匹配的文本.embed_feature_hashing()  # 通过 hash 方法进行特征编码.match(da, limit=5, exclude_self=True, metric='jaccard', use_scipy=True)  # 找到五个与输入的文本最相似的句子
)print(q.matches[:, ('text', 'scores__jaccard')])  # 输出对应的文本与 jaccard 相似性分数

输出结果

[['staircase, than she entered the breakfast-room, and congratulated', 'of the room.','She entered the room with an air more than usually ungracious,','entered the breakfast-room, where Mrs. Bennet was alone, than she', 'those in the room.'],[{'value': 0.6}, {'value': 0.6666666666666666}, {'value': 0.6666666666666666}, {'value': 0.6666666666666666},{'value': 0.7142857142857143}]]
video
  1. 视频的导入和切分
# 视频需要依赖 av 包
# pip install av
from jina import Document
d = Document(uri='cat.mp4')
d.load_uri_to_video_tensor()# 相较于图像,视频是一个 4 维数组,第一维表示视频帧 id 或是视频的时间,剩下的三维则和图像一致。
print(d.tensor.shape)  # (31, 1080, 1920, 3)# 使用 append 方法将 Document 放入 chunk 中
for b in d.tensor:d.chunks.append(Document(tensor=b))d.chunks.plot_image_sprites('mov.png')

先在docker里安装av包

image-20221116231714342

在docker中安装了但是在pycharm里跑一直报错

image-20221117211743545

  • 在docker的容器中安装包,却无法在pycharm中更新

经过大佬指点和自己网上查找,得到答案

针对于第一个问题,我了解到Pycharm对docker环境解释器的加载只和镜像有关,与容器没有关系,只要提供镜像,镜像里的环境就能加载,手动创建的容器其实并不能影响镜像环境。

因此,这会导致一个问题,当我们需要在已有的镜像中安装新的package时,直接在容器中添加,对于Pycharm的解释器是没有用的,并不能影响当前的环境。因此,我们需要手动将添加包,修改后的容器保存为新的镜像,重新添加Python解释器,这样Pycharm才能加载到新的环境。

参考:

Docker在Pycharm平台上的部署

Docker 如何保存对容器的修改

于是在docker里

pip install av
pip install matplotlib

然后

docker ps

找到container的id

image-20221117211953519

命令查看现有的镜像

docker image ls

此时的镜像

image-20221117212023569

安装两个包后commit为新的image

docker commit 0ef9ef12a061 newjina

得到了新的image

image-20221117212158611

从docker里启动新的image

image-20221117212239996

参照前面Docker在Pycharm平台上的部署,得到新的interpreter

image-20221117212408708

然后就能成功跑动代码

得到猫片的切分

image-20221117212635408

  1. 关键帧抽取
from docarray import Documentd = Document(uri='cat.mp4')
# 可以使用 only_keyframes 这个参数来提取关键帧
d.load_uri_to_video_tensor(only_keyframes=True)
print(d.tensor.shape) 

每个人自己的视频得到的shape都不同

(3, 640, 640, 3)
  1. 张量转存为视频
# 使用 save_video_tensor_to_file 进行视频的保存
from docarray import Documentd = (Document(uri='cat.mp4').load_uri_to_video_tensor()  # 读取视频.save_video_tensor_to_file('60fps.mp4', 60)  # 将其保存为60fps的视频
)

这篇关于VCED:学习Jina的简单操作的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/230680

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu2289(简单二分)

虽说是简单二分,但是我还是wa死了  题意:已知圆台的体积,求高度 首先要知道圆台体积怎么求:设上下底的半径分别为r1,r2,高为h,V = PI*(r1*r1+r1*r2+r2*r2)*h/3 然后以h进行二分 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#includ

usaco 1.3 Prime Cryptarithm(简单哈希表暴搜剪枝)

思路: 1. 用一个 hash[ ] 数组存放输入的数字,令 hash[ tmp ]=1 。 2. 一个自定义函数 check( ) ,检查各位是否为输入的数字。 3. 暴搜。第一行数从 100到999,第二行数从 10到99。 4. 剪枝。 代码: /*ID: who jayLANG: C++TASK: crypt1*/#include<stdio.h>bool h

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

uva 10387 Billiard(简单几何)

题意是一个球从矩形的中点出发,告诉你小球与矩形两条边的碰撞次数与小球回到原点的时间,求小球出发时的角度和小球的速度。 简单的几何问题,小球每与竖边碰撞一次,向右扩展一个相同的矩形;每与横边碰撞一次,向上扩展一个相同的矩形。 可以发现,扩展矩形的路径和在当前矩形中的每一段路径相同,当小球回到出发点时,一条直线的路径刚好经过最后一个扩展矩形的中心点。 最后扩展的路径和横边竖边恰好组成一个直