插件范围
OpenSearch 的学习排名插件可帮助您为应用程序搜索操作开发和使用基于机器学习 (ML) 的排名模型。以下章节描述了该插件如何融入整个 LTR 流程。
插件功能
该插件提供了开发和使用 LTR 模型的构建块,为您提供以下功能:
- 开发依赖于查询的特征:创建捕获搜索查询与文档之间关系的自定义特征。这些特征可以存储在 OpenSearch 中。
- 记录特征值:记录搜索结果中返回的文档的特征值。一旦您记录了文档的特征集,您可以将这些数据与您开发的判断列表结合起来。这将为您提供一个完整的训练集,可用于测试和训练您的排名模型。然后可以使用 RankLib 或 XGBoost 等工具开发令人满意的模型。
- 部署和使用模型:将训练好的排名模型上传到插件,并使用它们对搜索结果进行重排序。该插件提供了一个自定义的 OpenSearch 查询领域特定语言 (DSL) 原语,允许您在搜索过程中执行模型。
插件不具备的功能
该插件不支持创建判断列表。这是一项您必须自行处理的任务,因为它具有领域特定性。有关为搜索文章开发判断列表的示例方法,请参阅维基媒体基金会博客。某些领域,例如电子商务,可能更侧重于与转化相关的信号,而其他领域可能涉及人工相关性评估员(内部专家或众包工人)。
该插件不处理模型训练或测试。这是一个离线过程,应使用适当的工具(如 XGBoost 和 RankLib)进行处理。该插件与这些外部模型构建工作流集成。训练和测试排名模型可能是一项 CPU 密集型任务,需要数据科学专业知识和离线测试。大多数组织倾向于让数据科学家监督模型开发过程,而不是直接在生产环境中运行它。
后续步骤
了解如何使用特征。