数据库管理-第159期 Oracle Vector DB AI-10(20240311)

2024-03-12 13:28

本文主要是介绍数据库管理-第159期 Oracle Vector DB AI-10(20240311),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据库管理159期 2024-03-11

  • 数据库管理-第159期 Oracle Vector DB & AI-10(20240311)
    • 1 其他distance函数
    • 2 实例演示
      • 使用其他函数寻找最近向量点
      • 函数变体
      • 简写语法
    • 总结

数据库管理-第159期 Oracle Vector DB & AI-10(20240311)

作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Associate: Database(Oracle与MySQL)
国内某科技公司 DBA总监
10年数据库行业经验,现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、认证技术专家、年度墨力之星,ITPUB认证专家,OCM讲师
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号,非著名社恐(社交恐怖分子)
公众号:胖头鱼的鱼缸;CSDN:胖头鱼的鱼缸(尹海文);墨天轮:胖头鱼的鱼缸;ITPUB:yhw1809。
除授权转载并标明出处外,均为“非法”抄袭。

写了些其他的东西,又休息了几天,今天继续。
在前面我演示了vector_distance()的默认算法方式,即Euclidean Squared(欧几里得平方)。本期我将演示其他的distance函数。

1 其他distance函数

在Oracle AI Vector Search中还有其他几种类型的distance函数:

  • Cosine Similarity(余弦相似度)
  • Dot Product(点积)
  • Manhattan Distance(曼哈顿距离)
  • Hamming Distance(汉明距离)

在vector_distance()函数中,默认为EUCLIDEAN,指定其他distance函数则使用一下方法:

  • vector_distance(v1, v2, EUCLIDEAN);
  • vector_distance(v1, v2, COSINE);
  • vector_distance(v1, v2, DOT);
  • vector_distance(v1, v2, MANHATTAN);
  • vector_distance(v1, v2, HAMMING);

2 实例演示

本节内容仍使用上一期的VT2表,使用向量点(16,4)进行演示,不同的函数结果略有不同:

使用其他函数寻找最近向量点

Cosine Similarity
我们不关心实际距离,而是关心距离最小的行的ID

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY vector_distance( vector('[16, 4]'), v, COSINE)
FETCH FIRST 4 ROWS ONLY;

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

Euclidean Similarity
我们不关心实际距离,而是关心距离最小的行的ID

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY vector_distance( vector('[16, 4]'), v, EUCLIDEAN)
FETCH FIRST 4 ROWS ONLY;

image.png

Dot Product
我们不关心实际距离,而是关心距离最小的行的ID

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY vector_distance(vector('[16, 4]'), v, DOT)
FETCH FIRST 4 ROWS ONLY;

image.png

Manhattan
我们不关心实际距离,而是关心距离最小的行的ID

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY vector_distance(vector('[16, 4]'), v, MANHATTAN)
FETCH FIRST 4 ROWS ONLY;

image.png

Hamming
我们不关心实际距离,而是关心距离最小的行的ID。还要注意的是,搜索的结果与我们之前使用其他函数看到的结果不同

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY vector_distance( vector('[16, 4]'), v, HAMMING)
FETCH FIRST 4 ROWS ONLY;

image.png

函数变体

distance函数还有一些其他的变体写法:

  • L1_DISTANCE(v1, v2) = MANHATTAN distance
  • L2_DISTANCE(v1, v2) = EUCLIDEAN distance
  • COSINE_DISTANCE(v1, v2) = COSINE similarity
  • INNER_PRODUCT(v1, v2) = DOT product

L1_DISTANCE
我们不关心实际距离,而是关心距离最小的行的ID

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY L1_DISTANCE(vector('[16, 4]'), v)
FETCH FIRST 4 ROWS ONLY;

image.png

L2_DISTANCE
我们不关心实际距离,而是关心距离最小的行的ID

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY L2_DISTANCE(vector('[16, 4]'), v)
FETCH FIRST 4 ROWS ONLY;

image.png

COSINE_DISTANCE

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY COSINE_DISTANCE( vector('[16, 4]'), v)
FETCH FIRST 4 ROWS ONLY;

image.png

INNER_PRODUCT

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY INNER_PRODUCT(vector('[16, 4]'), v)
FETCH FIRST 4 ROWS ONLY;

image.png

简写语法

distance函数还有一些简写写法:

  • v1 <-> v2 = Euclidean distance
  • v1 <=> v2 = Cosine similarity
  • v1 <#> v2 = Negative dot product

v1 <-> v2

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY vector('[16, 4]') <-> v
FETCH FIRST 4 ROWS ONLY;

image.png

**v1 <=> v2 **

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY vector('[16, 4]') <=> v 
FETCH FIRST 4 ROWS ONLY;

image.png

v1 <#> v2

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY vector('[16, 4]') <#> v 
FETCH FIRST 4 ROWS ONLY;

image.png

总结

本期针对不同写法的不同distance函数。
本系列内容预计还有2-4篇,分别为其他vector函数,一个相对复杂的demo演示以及与PGVector的对比。
老规矩,知道写了些啥。

这篇关于数据库管理-第159期 Oracle Vector DB AI-10(20240311)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/801398

相关文章

SpringBoot使用Jasypt对YML文件配置内容加密的方法(数据库密码加密)

《SpringBoot使用Jasypt对YML文件配置内容加密的方法(数据库密码加密)》本文介绍了如何在SpringBoot项目中使用Jasypt对application.yml文件中的敏感信息(如数... 目录SpringBoot使用Jasypt对YML文件配置内容进行加密(例:数据库密码加密)前言一、J

MySQL进阶之路索引失效的11种情况详析

《MySQL进阶之路索引失效的11种情况详析》:本文主要介绍MySQL查询优化中的11种常见情况,包括索引的使用和优化策略,通过这些策略,开发者可以显著提升查询性能,需要的朋友可以参考下... 目录前言图示1. 使用不等式操作符(!=, <, >)2. 使用 OR 连接多个条件3. 对索引字段进行计算操作4

MySQL表锁、页面锁和行锁的作用及其优缺点对比分析

《MySQL表锁、页面锁和行锁的作用及其优缺点对比分析》MySQL中的表锁、页面锁和行锁各有特点,适用于不同的场景,表锁锁定整个表,适用于批量操作和MyISAM存储引擎,页面锁锁定数据页,适用于旧版本... 目录1. 表锁(Table Lock)2. 页面锁(Page Lock)3. 行锁(Row Lock

mac安装nvm(node.js)多版本管理实践步骤

《mac安装nvm(node.js)多版本管理实践步骤》:本文主要介绍mac安装nvm(node.js)多版本管理的相关资料,NVM是一个用于管理多个Node.js版本的命令行工具,它允许开发者在... 目录NVM功能简介MAC安装实践一、下载nvm二、安装nvm三、安装node.js总结NVM功能简介N

MySQL zip安装包配置教程

《MySQLzip安装包配置教程》这篇文章详细介绍了如何使用zip安装包在Windows11上安装MySQL8.0,包括下载、解压、配置环境变量、初始化数据库、安装服务以及更改密码等步骤,感兴趣的朋... 目录mysql zip安装包配置教程1、下载zip安装包:2、安装2.1 解压zip包到安装目录2.2

MySQL安装时initializing database失败的问题解决

《MySQL安装时initializingdatabase失败的问题解决》本文主要介绍了MySQL安装时initializingdatabase失败的问题解决,文中通过图文介绍的非常详细,对大家的学... 目录问题页面:解决方法:问题页面:解决方法:1.勾选红框中的选项:2.将下图红框中全部改为英

MySQL 中的服务器配置和状态详解(MySQL Server Configuration and Status)

《MySQL中的服务器配置和状态详解(MySQLServerConfigurationandStatus)》MySQL服务器配置和状态设置包括服务器选项、系统变量和状态变量三个方面,可以通过... 目录mysql 之服务器配置和状态1 MySQL 架构和性能优化1.1 服务器配置和状态1.1.1 服务器选项

MySQL8.0设置redo缓存大小的实现

《MySQL8.0设置redo缓存大小的实现》本文主要在MySQL8.0.30及之后版本中使用innodb_redo_log_capacity参数在线更改redo缓存文件大小,下面就来介绍一下,具有一... mysql 8.0.30及之后版本可以使用innodb_redo_log_capacity参数来更改

Python调用Orator ORM进行数据库操作

《Python调用OratorORM进行数据库操作》OratorORM是一个功能丰富且灵活的PythonORM库,旨在简化数据库操作,它支持多种数据库并提供了简洁且直观的API,下面我们就... 目录Orator ORM 主要特点安装使用示例总结Orator ORM 是一个功能丰富且灵活的 python O

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2