准备向量
在 OpenSearch 中,您可以自带向量,也可以让 OpenSearch 根据您的数据自动生成向量。让 OpenSearch 自动生成嵌入向量可以减少摄入和搜索时的数据预处理工作。
选项 1:自带原始向量或生成的嵌入向量
您已有来自外部工具或服务的预计算嵌入向量或原始向量。
-
摄入:将预生成的嵌入向量直接摄入 OpenSearch。
-
搜索:执行向量搜索以找到最接近查询向量的向量。
步骤
处理 OpenSearch 外部生成的嵌入向量涉及以下步骤
1
生成嵌入向量
使用您喜欢的嵌入工具在 OpenSearch 外部生成嵌入向量。
2
创建一个 OpenSearch 索引来存储您的嵌入向量。
3
将您的嵌入向量摄入索引。
4
使用向量搜索来搜索您的嵌入向量。
选项 2:在 OpenSearch 内部生成嵌入向量
使用此选项可让 OpenSearch 使用机器学习 (ML) 模型从您的数据中自动生成向量嵌入。
-
摄入:您摄入纯数据,OpenSearch 使用 ML 模型动态生成嵌入向量。
-
搜索:在查询时,OpenSearch 使用相同的 ML 模型将您的输入数据转换为嵌入向量,这些嵌入向量用于向量搜索。
步骤
处理 OpenSearch 内部自动转换为嵌入向量的文本涉及以下步骤
1
配置一个机器学习模型,该模型将在摄入和查询时自动从您的文本中生成嵌入向量。
2
创建 OpenSearch 索引以存储您的文本。
3
将您的文本摄入索引。
4
使用向量搜索来搜索您的文本。查询文本会自动转换为向量嵌入,并与文档嵌入进行比较。