作业和实例

用 Prometheus 的术语来说，可以进行采集数据指标的端点称为实例，通常对应于单独的进程。具有相同目地的实例的集合(例如，可伸缩性或可靠性而复制的过程)称为作业。

例如，具有四个复制实例的 API 作业：

job: api-server
- instance 1: 1.2.3.4.5670
- instance 2: 1.2.3.4.5671
- instance 3: 1.2.3.4.5672
- instance 4: 1.2.3.4.5673

自动生成标签和时间序列

当 Prometheus 从目标采集数据指标时，它会自动在采集到的时间序列上附加一些标签，以便于识别被采集的目标：

如果这些标签中的任何一个已存在于采集的数据中，则行为取决于honor_labels配置选项。有关更多信息，请参见采集配置文档。

对于每个实例的数据采集，Prometheus 按照以下时间序列存储样本：

up{job="<job-name>", instance="<instance-id>"}: 如果实例运行状态良好，则为1；如果采集失败，则为0。
scrape_duration_seconds{job="<job-name>", instance="<instance-id>"}: 采集的持续时间。
scrape_samples_post_metric_relabeling{job="<job-name>", instance="<instance-id>"}: 数据指标重新标记后剩余样本数。
scrape_samples_scraped{job="<job-name>", instance="<instance-id>"}: 目标暴露的样本数
scrape_series_added{job="<job-name>", instance="<instance-id>"}: 本次采集新增样本数量。在 v2.10 版本中新增

时间序列up对于实例可用性监控很有用。

最后更新于5年前

这有帮助吗？