Milvus基本概念及其应用场景

本文主要是介绍Milvus基本概念及其应用场景，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Milvus是一款云原生向量数据库，具备高可用、高性能、易拓展的特点，主要用于海量向量数据的实时召回。以下是关于Milvus的基本概念解释：

向量数据库：Milvus是一个向量数据库，用于存储、索引和管理通过深度神经网络和机器学习模型产生的海量向量数据。这里的“向量”又称为embedding vector，是指由embedding技术从离散变量（如文本、图像等各种非结构化数据）转变而来的连续向量。在数学上，向量是一个由浮点数或者二值型数据组成的n维数组。
非结构化数据：Milvus主要处理的是非结构化数据，这些数据的数据结构不规则，没有统一的预定义数据模型。通过现代的向量转化技术，如各种人工智能（AI）或机器学习（ML）模型，可以将非结构化数据抽象为n维特征向量空间的向量。
数据分区分片：在存储和检索大量数据时，Milvus支持数据分区分片，即将数据分成多个部分或片段，分别进行存储和处理。这有助于提高数据的存储效率和检索速度。
数据持久化：Milvus支持数据持久化，即将数据保存在可靠的存储介质中，确保数据不会因为系统崩溃或故障而丢失。
增量数据摄取：Milvus能够实时地摄取新增的数据，无需对整个数据库进行重新索引或处理，从而实现对新数据的快速检索。
标量向量混合查询：除了支持向量查询外，Milvus还支持对标量数据（即结构化数据）进行查询，实现了标量向量混合查询的能力。
time travel：这是一个功能，允许用户查询数据库在某个历史时间点的状态，从而进行数据分析或故障排查。
共享存储架构：Milvus采用共享存储架构，实现存储计算完全分离，计算节点支持横向扩展。这使得Milvus能够处理更大规模的数据，同时保持高性能和可扩展性。
索引：为了加速向量的检索速度，Milvus集成了Faiss、NMSLIB、Annoy等广泛应用的向量索引库，提供了一整套简单直观的API，让用户可以针对不同场景选择不同的索引类型。