分析器
以下部分列出了 OpenSearch 支持的所有分析器。
内置分析器
下表列出了 OpenSearch 提供的内置分析器。表格的最后一列包含将分析器应用于字符串 It’s fun to contribute a brand-new PR or 2 to OpenSearch! 的结果。
| 分析器 | 执行的分析 | 分析器输出 |
|---|---|---|
| Standard (默认) | - 在单词边界处将字符串解析为词元 - 移除大部分标点符号 - 将词元转换为小写 | [it’s, fun, to, contribute, a,brand, new, pr, or, 2, to, opensearch] |
| Simple | - 在任何非字母字符处将字符串解析为词元 - 移除非字母字符 - 将词元转换为小写 | [it, s, fun, to, contribute, a,brand, new, pr, or, to, opensearch] |
| 空白 | - 在空白处将字符串解析为词元 | [It’s, fun, to, contribute, a,brand-new, PR, or, 2, to, OpenSearch!] |
| 停止词 | - 在任何非字母字符处将字符串解析为词元 - 移除非字母字符 - 移除停用词 - 将词元转换为小写 | [s, fun, contribute, brand, new, pr, opensearch] |
| Keyword (无操作) | - 输出整个字符串不变 | [It’s fun to contribute a brand-new PR or 2 to OpenSearch!] |
| 模式 | - 使用正则表达式将字符串解析为词元 - 支持将字符串转换为小写 - 支持移除停用词 | [it, s, fun, to, contribute, a,brand, new, pr, or, 2, to, opensearch] |
| 语言 | 执行针对特定语言(例如,english)的分析。 | [fun, contribut, brand, new, pr, 2, opensearch] |
| 指纹 | - 在任何非字母字符处解析字符串 - 通过将字符转换为 ASCII 来规范化字符 - 将词元转换为小写 - 排序、去重并将词元连接成单个词元 - 支持移除停用词 | [2 a brand contribute fun it's new opensearch or pr to]请注意,撇号已转换为其 ASCII 对应字符。 |
| DL 模型 | 对神经稀疏搜索使用 ML 模型分词规则。 | 基于模型的词元 |
语言分析器
OpenSearch 支持多种语言分析器。更多信息请参见语言分析器。
附加分析器
下表列出了 OpenSearch 支持的其他分析器。
| 分析器 | 执行的分析 |
|---|---|
phone | 用于解析电话号码的索引分析器。 |
phone-search | 用于解析电话号码的搜索分析器。 |