Link Search Menu Expand Document Documentation Menu

分析器

以下部分列出了 OpenSearch 支持的所有分析器。

内置分析器

下表列出了 OpenSearch 提供的内置分析器。表格的最后一列包含将分析器应用于字符串 It’s fun to contribute a brand-new PR or 2 to OpenSearch! 的结果。

分析器 执行的分析 分析器输出
Standard (默认) - 在单词边界处将字符串解析为词元
- 移除大部分标点符号
- 将词元转换为小写
[it’s, fun, to, contribute, a,brand, new, pr, or, 2, to, opensearch]
Simple - 在任何非字母字符处将字符串解析为词元
- 移除非字母字符
- 将词元转换为小写
[it, s, fun, to, contribute, a,brand, new, pr, or, to, opensearch]
空白 - 在空白处将字符串解析为词元 [It’s, fun, to, contribute, a,brand-new, PR, or, 2, to, OpenSearch!]
停止词 - 在任何非字母字符处将字符串解析为词元
- 移除非字母字符
- 移除停用词
- 将词元转换为小写
[s, fun, contribute, brand, new, pr, opensearch]
Keyword (无操作) - 输出整个字符串不变 [It’s fun to contribute a brand-new PR or 2 to OpenSearch!]
模式 - 使用正则表达式将字符串解析为词元
- 支持将字符串转换为小写
- 支持移除停用词
[it, s, fun, to, contribute, a,brand, new, pr, or, 2, to, opensearch]
语言 执行针对特定语言(例如,english)的分析。 [fun, contribut, brand, new, pr, 2, opensearch]
指纹 - 在任何非字母字符处解析字符串
- 通过将字符转换为 ASCII 来规范化字符
- 将词元转换为小写
- 排序、去重并将词元连接成单个词元
- 支持移除停用词
[2 a brand contribute fun it's new opensearch or pr to]
请注意,撇号已转换为其 ASCII 对应字符。
DL 模型 神经稀疏搜索使用 ML 模型分词规则。 基于模型的词元

语言分析器

OpenSearch 支持多种语言分析器。更多信息请参见语言分析器

附加分析器

下表列出了 OpenSearch 支持的其他分析器。

分析器 执行的分析
phone 用于解析电话号码的索引分析器
phone-search 用于解析电话号码的搜索分析器
剩余 350 字符

有问题?

想贡献?