Link Search Menu Expand Document Documentation Menu

使用原始向量的神经稀疏搜索

如果您正在使用自托管的稀疏嵌入模型,则可以摄取原始稀疏向量以用于神经稀疏搜索。

示例

以下示例将稀疏向量摄取到 OpenSearch 索引中,然后使用稀疏向量搜索匹配文档。

步骤 1:创建索引

要摄取包含原始稀疏向量的文档,请创建一个秩特征索引

PUT /my-nlp-index
{
  "mappings": {
    "properties": {
      "id": {
        "type": "text"
      },
      "passage_embedding": {
        "type": "rank_features"
      },
      "passage_text": {
        "type": "text"
      }
    }
  }
}

步骤 2:将文档摄取到索引中

要将文档摄取到上一步创建的索引中,请发送以下请求

PUT /my-nlp-index/_doc/1
{
  "passage_text": "Hello world",
  "id": "s1",
  "passage_embedding": {
    "hi" : 4.338913,
    "planets" : 2.7755864,
    "planet" : 5.0969057,
    "mars" : 1.7405145,
    "earth" : 2.6087382,
    "hello" : 3.3210192
  }
}

步骤 3:使用稀疏向量搜索数据

要使用稀疏向量搜索文档,请在 neural_sparse 查询中提供稀疏嵌入

GET my-nlp-index/_search
{
  "query": {
    "neural_sparse": {
      "passage_embedding": {
        "query_tokens": {
          "hi" : 4.338913,
          "planets" : 2.7755864,
          "planet" : 5.0969057,
          "mars" : 1.7405145,
          "earth" : 2.6087382,
          "hello" : 3.3210192
        }
      }
    }
  }
}

要了解有关提高神经稀疏搜索检索时间的更多信息,请参阅加速神经稀疏搜索

后续步骤

  • 浏览我们的教程,了解如何构建 AI 搜索应用程序。
剩余 350 字符

有问题?

想做贡献?