使用原始向量的神经稀疏搜索
如果您正在使用自托管的稀疏嵌入模型,则可以摄取原始稀疏向量以用于神经稀疏搜索。
示例
以下示例将稀疏向量摄取到 OpenSearch 索引中,然后使用稀疏向量搜索匹配文档。
步骤 1:创建索引
要摄取包含原始稀疏向量的文档,请创建一个秩特征索引
PUT /my-nlp-index
{
"mappings": {
"properties": {
"id": {
"type": "text"
},
"passage_embedding": {
"type": "rank_features"
},
"passage_text": {
"type": "text"
}
}
}
}
步骤 2:将文档摄取到索引中
要将文档摄取到上一步创建的索引中,请发送以下请求
PUT /my-nlp-index/_doc/1
{
"passage_text": "Hello world",
"id": "s1",
"passage_embedding": {
"hi" : 4.338913,
"planets" : 2.7755864,
"planet" : 5.0969057,
"mars" : 1.7405145,
"earth" : 2.6087382,
"hello" : 3.3210192
}
}
步骤 3:使用稀疏向量搜索数据
要使用稀疏向量搜索文档,请在 neural_sparse
查询中提供稀疏嵌入
GET my-nlp-index/_search
{
"query": {
"neural_sparse": {
"passage_embedding": {
"query_tokens": {
"hi" : 4.338913,
"planets" : 2.7755864,
"planet" : 5.0969057,
"mars" : 1.7405145,
"earth" : 2.6087382,
"hello" : 3.3210192
}
}
}
}
}
加速神经稀疏搜索
要了解有关提高神经稀疏搜索检索时间的更多信息,请参阅加速神经稀疏搜索。
后续步骤
- 浏览我们的教程,了解如何构建 AI 搜索应用程序。