获取模型
您可以使用 model_id
检索模型信息。
有关此 API 的用户访问信息,请参阅模型访问控制注意事项。
端点
GET /_plugins/_ml/models/<model_id>
路径参数
下表列出了可用的路径参数。
参数 | 数据类型 | 描述 |
---|---|---|
模型 ID | 字符串 | 要检索的模型的模型 ID。 |
请求示例
GET /_plugins/_ml/models/N8AE1osB0jLkkocYjz7D
示例响应
{
"name" : "all-MiniLM-L6-v2_onnx",
"algorithm" : "TEXT_EMBEDDING",
"version" : "1",
"model_format" : "TORCH_SCRIPT",
"model_state" : "DEPLOYED",
"model_content_size_in_bytes" : 83408741,
"model_content_hash_value" : "9376c2ebd7c83f99ec2526323786c348d2382e6d86576f750c89ea544d6bbb14",
"model_config" : {
"model_type" : "bert",
"embedding_dimension" : 384,
"framework_type" : "SENTENCE_TRANSFORMERS",
"all_config" : """{"_name_or_path":"nreimers/MiniLM-L6-H384-uncased","architectures":["BertModel"],"attention_probs_dropout_prob":0.1,"gradient_checkpointing":false,"hidden_act":"gelu","hidden_dropout_prob":0.1,"hidden_size":384,"initializer_range":0.02,"intermediate_size":1536,"layer_norm_eps":1e-12,"max_position_embeddings":512,"model_type":"bert","num_attention_heads":12,"num_hidden_layers":6,"pad_token_id":0,"position_embedding_type":"absolute","transformers_version":"4.8.2","type_vocab_size":2,"use_cache":true,"vocab_size":30522}"""
},
"created_time" : 1665961344044,
"last_uploaded_time" : 1665961373000,
"last_loaded_time" : 1665961815959,
"total_chunks" : 9
}
有效的模型状态
当模型在 OpenSearch 中注册、部署或取消部署时,它会经历不同的模型状态,这些状态反映了其可用性。这些状态帮助您跟踪模型的可用性、加载状态或故障情况。
下表列出了所有有效的模型状态。
模型状态 | 描述 |
---|---|
注册中 | 模型正在注册到集群中。 |
已注册 | 模型元数据已注册到集群但尚未部署。 |
已部署 | 模型已成功部署/加载到所有符合条件的 worker 节点,并已准备好进行推理。 |
部署中 | 模型正在部署到内存中。 |
部分部署 | 模型已部署到部分符合条件的 worker 节点。 |
未部署 | 模型已成功从所有节点内存中卸载/取消部署。 |
部署失败 | 尝试将模型部署到集群节点时发生错误。 |