分析器
以下部分列出了 OpenSearch 支持的所有分析器。
内置分析器
下表列出了 OpenSearch 提供的内置分析器。表格的最后一列包含将分析器应用于字符串 It’s fun to contribute a brand-new PR or 2 to OpenSearch!
的结果。
分析器 | 执行的分析 | 分析器输出 |
---|---|---|
Standard (默认) | - 在单词边界处将字符串解析为词元 - 移除大部分标点符号 - 将词元转换为小写 | [it’s , fun , to , contribute , a ,brand , new , pr , or , 2 , to , opensearch ] |
Simple | - 在任何非字母字符处将字符串解析为词元 - 移除非字母字符 - 将词元转换为小写 | [it , s , fun , to , contribute , a ,brand , new , pr , or , to , opensearch ] |
空白 | - 在空白处将字符串解析为词元 | [It’s , fun , to , contribute , a ,brand-new , PR , or , 2 , to , OpenSearch! ] |
停止词 | - 在任何非字母字符处将字符串解析为词元 - 移除非字母字符 - 移除停用词 - 将词元转换为小写 | [s , fun , contribute , brand , new , pr , opensearch ] |
Keyword (无操作) | - 输出整个字符串不变 | [It’s fun to contribute a brand-new PR or 2 to OpenSearch! ] |
模式 | - 使用正则表达式将字符串解析为词元 - 支持将字符串转换为小写 - 支持移除停用词 | [it , s , fun , to , contribute , a ,brand , new , pr , or , 2 , to , opensearch ] |
语言 | 执行针对特定语言(例如,english )的分析。 | [fun , contribut , brand , new , pr , 2 , opensearch ] |
指纹 | - 在任何非字母字符处解析字符串 - 通过将字符转换为 ASCII 来规范化字符 - 将词元转换为小写 - 排序、去重并将词元连接成单个词元 - 支持移除停用词 | [2 a brand contribute fun it's new opensearch or pr to ]请注意,撇号已转换为其 ASCII 对应字符。 |
DL 模型 | 对神经稀疏搜索使用 ML 模型分词规则。 | 基于模型的词元 |
语言分析器
OpenSearch 支持多种语言分析器。更多信息请参见语言分析器。
附加分析器
下表列出了 OpenSearch 支持的其他分析器。
分析器 | 执行的分析 |
---|---|
phone | 用于解析电话号码的索引分析器。 |
phone-search | 用于解析电话号码的搜索分析器。 |