Link Search Menu Expand Document Documentation Menu

准备向量

在 OpenSearch 中,您可以自带向量,也可以让 OpenSearch 根据您的数据自动生成向量。让 OpenSearch 自动生成嵌入向量可以减少摄入和搜索时的数据预处理工作。

选项 1:自带原始向量或生成的嵌入向量

您已有来自外部工具或服务的预计算嵌入向量或原始向量。

  • 摄入:将预生成的嵌入向量直接摄入 OpenSearch。

    Pre-generated embeddings ingestion

  • 搜索:执行向量搜索以找到最接近查询向量的向量。

    Pre-generated embeddings search

步骤

处理 OpenSearch 外部生成的嵌入向量涉及以下步骤

1
生成嵌入向量

使用您喜欢的嵌入工具在 OpenSearch 外部生成嵌入向量。

2

创建一个 OpenSearch 索引来存储您的嵌入向量。

3

将您的嵌入向量摄入索引。

4

使用向量搜索来搜索您的嵌入向量。

向量搜索入门

使用 OpenSearch 外部生成的原始向量或嵌入向量

选项 2:在 OpenSearch 内部生成嵌入向量

使用此选项可让 OpenSearch 使用机器学习 (ML) 模型从您的数据中自动生成向量嵌入。

  • 摄入:您摄入纯数据,OpenSearch 使用 ML 模型动态生成嵌入向量。

    Auto-generated embeddings ingestion

  • 搜索:在查询时,OpenSearch 使用相同的 ML 模型将您的输入数据转换为嵌入向量,这些嵌入向量用于向量搜索。

    Auto-generated embeddings search

步骤

处理 OpenSearch 内部自动转换为嵌入向量的文本涉及以下步骤

1

配置一个机器学习模型,该模型将在摄入和查询时自动从您的文本中生成嵌入向量。

2

创建 OpenSearch 索引以存储您的文本。

3

将您的文本摄入索引。

4

使用向量搜索来搜索您的文本。查询文本会自动转换为向量嵌入,并与文档嵌入进行比较。

自动生成嵌入

在 OpenSearch 内部自动将数据转换为嵌入向量

语义和混合搜索入门

了解如何实现语义和混合搜索

剩余 350 字符

有问题?

想贡献?