Skip to main content

moregeek program

prometheus监控之安装配置_清晨的博客-多极客编程

1、下载

https://prometheus.io/download/
https://github.com/prometheus/prometheus/releases

2、安装配置

tar xvf prometheus-2.6.1.linux-amd64.tar.gz 
# 启动 Prometheus.
# 默认地, Prometheus 在 ./data 路径下存储其数据库 (flag --storage.tsdb.path).
# 在安装目录里面启动
./prometheus --config.file=prometheus.yml

3、配置参数

参数名称  含义 备注
--version 显示应用的版本信息
配置文件参数
--config.file="prometheus.yml" Prometheus配置文件路径
WEB服务参数
--web.listen-address="0.0.0.0:9090" UI、API、遥测(telemetry)监听地址
--web.read-timeout=5m 读取请求和关闭空闲连接的最大超时时间 默认值:5m
--web.max-connections=512 最大同时连接数 默认值:512
--web.external-url=<URL> 可从外部访问普罗米修斯的URL 如果Prometheus存在反向代理时使用,用于生成相对或者绝对链接,返回到
Prometheus本身,如果URL存在路径部分,它将用于给Prometheus服务的所有HTTP端点加前缀,如果省略,将自动派生相关的URL组件。
--web.route-prefix=<path> Web端点的内部路由 默认路径:--web.external-url
--web.user-assets=<path> 静态资产目录的路径 在/user路径下生效可用
--web.enable-lifecycle 通过HTTP请求启用关闭(shutdown)和重载(reload)
--web.enable-admin-api 启用管理员行为API端点
--web.console.templates="consoles" 总线模板目录路径 在/consoles路径下生效可用
--web.console.libraries="console_libraries" 总线库文件目录路径
--web.page-title="Prometheus Time Series Collection and Processing Server" Prometheus实例的文档标题
--web.cors.origin=".*" CORS来源的正则Regex,是完全锚定的 例如:'https?://(domain1|domain2).com'
数据存储参数
--storage.tsdb.path="data/" 指标存储的根路径
--storage.tsdb.retention=STORAGE.TSDB.RETENTION [DEPRECATED]样例存储时间 此标签已经丢弃,用"storage.tsdb.retention.time"替代
--storage.tsdb.retention.time=STORAGE.TSDB.RETENTION.TIME 存储时长,如果此参数设置了,会覆盖"storage.tsdb.retention"参
数;如果设置了"storage.tsdb.retention" 或者"storage.tsdb.retention.size"参数,存储时间默认是15d(天),单位:y, w,
d, h, m, s, ms
--storage.tsdb.retention.size=STORAGE.TSDB.RETENTION.SIZE [EXPERIMENTAL]试验性的。存储为块的最大字节数,需要使用一个
单位,支持:B, KB, MB, GB,TB, PB, EB 此标签处于试验中,未来版本会改变
--storage.tsdb.no-lockfile 不在data目录下创建锁文件
--storage.tsdb.allow-overlapping-blocks [EXPERIMENTAL]试验性的。允许重叠块,可以支持垂直压缩和垂直查询合并。
--storage.tsdb.wal-compression 压缩tsdb的WAL WAL(Write-ahead logging, 预写日志),WAL被分割成默认大小为128M的文件段
(segment),之前版本默认大小是256M,文件段以数字命名,长度为8位的整形。WAL的写入单位是页(page),每页的大小为32KB,所
以每个段大小必须是页的大小的整数倍。如果WAL一次性写入的页数超过一个段的空闲页数,就会创建一个新的文件段来保存这些页,从
而确保一次性写入的页不会跨段存储。
--storage.remote.flush-deadline=<duration> 关闭或者配置重载时刷新示例的等待时长
--storage.remote.read-sample-limit=5e7 在单个查询中通过远程读取接口返回的最大样本总数。0表示无限制。对于流式响应类型,将忽
略此限制。
--storage.remote.read-concurrent-limit=10 最大并发远程读取调用数。0表示无限制。
--storage.remote.read-max-bytes-in-frame=1048576 在封送处理之前,用于流式传输远程读取响应类型的单个帧中的最大字节数。
请注意,客户机可能对帧大小也有限制。 默认情况下,protobuf建议使用1MB。
告警规则相关参数
--rules.alert.for-outage-tolerance=1h 允许prometheus中断以恢复“for”警报状态的最长时间。
--rules.alert.for-grace-period=10m 警报和恢复的“for”状态之间的最短持续时间。这仅对配置的“for”时间大于宽限期的警报进行维护。
--rules.alert.resend-delay=1m 向Alertmanager重新发送警报之前等待的最短时间。
告警管理中心相关参数
--alertmanager.notification-queue-capacity=10000 挂起的Alertmanager通知的队列容量。 默认值:10000
--alertmanager.timeout=10s 发送告警到Alertmanager的超时时间 默认值:10s
数据查询参数
--query.lookback-delta=5m 通过表达式解析和联合检索指标的最大反馈时间 默认值:5m
--query.timeout=2m 查询中止前可能需要的最长时间。 默认值:2m
--query.max-concurrency=20 并发(concurrently)执行查询的最大值
--query.max-samples=50000000 单个查询可以加载到内存中的最大样本数。注意,如果查询试图将更多的样本加载到内存中,则会失败,
因此这也限制了查询可以返回的样本数。 数量级:5千万
日志信息参数
--log.level=info 仅记录给定的日志级别及以上的信息 可选参数值:[debug, info, warn, error],其中之一
--log.format=logfmt 日志信息输出格式 可选参数值:[logfmt, json],其中之一

常用的几个参数
--config.file=/usr/local/prometheus/prometheus.yml #Prometheus配置文件路径
--storage.tsdb.path=/usr/local/prometheus/data #指定数据落地的目录,默认为家目录的data目录
--storage.tsdb.retention.time=90d #设置数据保留时间为90天,默认为15天
--web.enable-lifecycle #在修改了prometheus.yml之后 可以不重启,直接热加载更新配置
--web.enable-admin-api #启用api,可以进行数据清理功能
--web.max-connections=512 #设置最大同时连接数
--web.external-url "http://192.168.1.4:9090" #注意:指定ip,此ip用于报警消息中超链接跳转所用
--web.listen-address=0.0.0.0:9090 #prometheus默认监控端口

4、加入systemd管理

1、配置文件
cat /usr/lib/systemd/system/prometheus.service
[Unit]
Description=Prometheus server daemon
After=network.target
[Service]
Type=simple
User=root
Group=root
ExecStart=/usr/local/prometheus/prometheus \
--config.file=/usr/local/prometheus/prometheus.yml \
--storage.tsdb.path="/usr/local/prometheus/data" \
--storage.tsdb.retention=15d \
--web.console.templates="/usr/local/prometheus/consoles" \
--web.console.libraries="/usr/local/prometheus/console_libraries" \
--web.max-connections=512 \
--web.external-url "http://192.168.1.4:9090" \
--web.listen-address=0.0.0.0:9090
Restart=on-failure
[Install]
WantedBy=multi-user.target

2、启动程序介绍
ExecStart=/usr/local/prometheus/prometheus #启动运行prometheus程序所在的路径
--config.file=/usr/local/prometheus/prometheus.yml #指定prometheus.yml配置文件路径
--storage.tsdb.path="/usr/local/prometheus/data" #指定监控指标数据存储的路径.默认在prometheus解压包目录下data目录
--storage.tsdb.retention=15d #历史数据最大保留时间,默认15天
--web.console.templates="/usr/local/prometheus/consoles" #指定控制台模板目录路径
--web.console.libraries="/usr/local/prometheus/console_libraries" #指定控制台库目录路径
--web.max-connections=512 #设置最大同时连接数
--web.external-url "http://192.168.1.4:9090" #用于生产返回prometheus相对的绝对链接地址,可以在后续告警通知内容中直接
点击链接地址访问prometheus Web UI。其格式为:http://{ip或者域名}:9090
--web.listen-address=0.0.0.0:9090 #prometheus默认监控端口

3、systemctl命令介绍:
systemctl daemon-reload #通知systemctl重新加载配置文件
systemctl enable prometheus.service #设置为开机自启动
systemctl disable prometheus.service #如果不想设置为开机启动,可以关闭。关闭开机自启动
systemctl start prometheus.service #开启服务
systemctl status prometheus.service #查看服务状态
systemctl restart prometheus.service #重启服务
systemctl stop prometheus.service #关闭服务

©著作权归作者所有:来自51CTO博客作者哭泣的馒头的原创作品,请联系作者获取转载授权,否则将追究法律责任

kubernetes 1.25.4数据平面自带nginx负载均衡实现高可用_大雨的博客-多极客编程

1、环境准备要点: 1、使用一个FQDN统一作为API Server的接入点; 2、加入集群之前,每个节点都将该FQDN解析至第一个Master; 3、加入集群之后,每个Master节点将该FQDN都解析至自身的IP地址; 4、加入集群之后,在Worker上配置nginx以对API Server进行代理,并将该FQDN解析至自身的IP地址;1-1、主机清单主机名IP地址系统版本k8s-master

nginx高并发优化之缓冲配置_清晨的博客-多极客编程

一、配置http { proxy_buffer_size 256k; proxy_buffers 4 256k; proxy_busy_buffers_size 256k; proxy_temp_file_write_size 256k; proxy_max_temp_file_size 128m; proxy_temp_path /usr/local/nginx/proxy_temp

配置firewalld防火墙_qq6350fdd93e2e0的博客-多极客编程

添加三块网卡分别连接三个区域配置ens32网卡IP地址生成DMZ网卡和外网网卡ip地址配置dmz区域配置external区域查看配置的IP地址修改IP地址删除系统自带的yum源安装apache服务器设置网站主页启动服务设置开机自动启动配置external区域查看IP地址删除系统自带的yum源挂载系统到/mnt安装apache服务器和https模块设置网站主页启动服务修改win10网卡和IP地址配置

prometheus监控之简介_清晨的博客-多极客编程

一、Prometheus架构1、Prometheus是什么Prometheus 起初是 SoundCloud 创建的一个开源系统监控报警工具。现在 Prometheus 是一个独立的开源项目,独立于任何一个公司。Prometheus是一个TSDB(时序数据库),时序数据库可以理解为一个经过优化,然后用来出来时间序列数据的软件, 并且数据中的数组是由时间进行索引的2、特性(优点)这些特性是作为TSD

28-网络文件共享和实时同步_懒喵逼逼叨的博客-多极客编程

NAS 存储NAS存储就是存储设备通过标准的网络拓扑结构(比如以太网)添加到一群计算机上。与DAS以及SAN不同,NAS是文件级的存储方法。采用NAS较多的功能是用来进行文件共享。NAS存储也通常被称为附加存储,顾名思义,就是存储设备通过标准的网络拓扑结构(例如以太网)添加到一群计算机上。NAS是文件级的存储方法,它的重点在于帮助工作组和部门级机构解决迅速增加存储容量的需求。如今更多的亲们采用NA

devops的常见面试题_mb6242cc9db1000的博客-多极客编程

1. 什么是 DevOps?简而言之,DevOps 意味着组织中开发 (Dev) 和运维 (Ops) 团队之间的协作,通过持续集成和持续交付,为用户提供更好的产品。因此,它可以降低软件开发和运维团队之间的风险,有助于提高交付速度,增强企业的市场竞争力。2. 什么是持续集成?持续集成 (CI) 是一个开发过程,每天多次将代码集成到共享存储库中。借助自动化测试,CI 帮助允许团队及早识别错误、轻松定位

如何召回流失用户_枫叶飘飘的博客-多极客编程

对于负责用户运营的人员,用户流失是一个必须要关注的问题。如果没有及时发现用户流失的原因,及时采取相对应的策略进行干预和挽留,最终到了流失的末期,那么整个产品可能会宣告死亡。那什么是用户流失呢?我们先从用户的活跃、沉默、唤醒说起。用户的活跃、沉默、唤醒是客观存在的,但流失是主观定义的。 活跃:一段时间内的用户活跃次数,比如日活、周活、月活。沉默:一段时间内用户活跃次数为0,比如沉默一周、沉默30天。

mongodb游标学习(五)_雍州无名的博客-多极客编程

mongodb语法与js类似1.快速插入10000条数据for(var i=0;i<10000;i++) { db.bar.insert({_id:i+1,title:'hello world',content:'aaa'+i});}2.游标例子1 手工获取游标数据var mycursor = db.bar.find({_id:{$lte:5}});printjson(mycursor.n

kubernetes 1.25.4数据平面自带nginx负载均衡实现高可用_大雨的博客-多极客编程

1、环境准备要点: 1、使用一个FQDN统一作为API Server的接入点; 2、加入集群之前,每个节点都将该FQDN解析至第一个Master; 3、加入集群之后,每个Master节点将该FQDN都解析至自身的IP地址; 4、加入集群之后,在Worker上配置nginx以对API Server进行代理,并将该FQDN解析至自身的IP地址;1-1、主机清单主机名IP地址系统版本k8s-master

prometheus监控之简介_清晨的博客-多极客编程

一、Prometheus架构1、Prometheus是什么Prometheus 起初是 SoundCloud 创建的一个开源系统监控报警工具。现在 Prometheus 是一个独立的开源项目,独立于任何一个公司。Prometheus是一个TSDB(时序数据库),时序数据库可以理解为一个经过优化,然后用来出来时间序列数据的软件, 并且数据中的数组是由时间进行索引的2、特性(优点)这些特性是作为TSD

28-网络文件共享和实时同步_懒喵逼逼叨的博客-多极客编程

NAS 存储NAS存储就是存储设备通过标准的网络拓扑结构(比如以太网)添加到一群计算机上。与DAS以及SAN不同,NAS是文件级的存储方法。采用NAS较多的功能是用来进行文件共享。NAS存储也通常被称为附加存储,顾名思义,就是存储设备通过标准的网络拓扑结构(例如以太网)添加到一群计算机上。NAS是文件级的存储方法,它的重点在于帮助工作组和部门级机构解决迅速增加存储容量的需求。如今更多的亲们采用NA

sql server 数据库分表分库操作_虚拟的现实的博客-多极客编程

1.简介 数据库高可用环境的搭建可以参考以下文章 SQL Server 高可用(always on)配置指南之域(AD)环境搭建       ​​https://blog.51cto.com/waringid/5851856​​ SQL Server 高可用(always on)配置指南之节点配置      ​​https://blog.51cto.com/waringid/5851970​​ S