【30天精通Prometheus:一站式监控实战指南】第15天:ipmi_exporter从入门到实战:安装、配置详解与生产环境搭建指南,超详细

亲爱的读者们👋

  欢迎加入【30天精通Prometheus】专栏!📚 在这里,我们将探索Prometheus的强大功能,并将其应用于实际监控中。这个专栏都将为你提供宝贵的实战经验。🚀

  Prometheus是云原生和DevOps的核心监控工具,我们将从基础概念开始,逐步涵盖配置、查询、告警和可视化。💪

  在接下来的30天里,我们将解锁Prometheus的实战技巧,通过案例和分享,助你深入理解其工作原理。📆

  目标:30天后,你将熟练掌握Prometheus,为未来的项目挑战做好准备!💯

  这是一段精彩旅程,期待你的加入!🎉


一、ipmi_exporter概述📘

定义
  ipmi_exporter是一个用于收集物理机信息的工具,它是Prometheus监控系统中的一个组件。其主要作用是通过IPMI(Intelligent Platform Management Interface,智能平台管理接口)协议,从支持IPMI的设备上收集硬件相关的监控数据,并将这些数据转换为Prometheus可以理解的格式,从而实现对物理服务器的硬件监控。

功能
  数据收集:它能够通过IPMI协议从远程物理机上收集各种硬件指标,如温度、电压、风扇速度等。

  数据转换:收集到的数据会被转换为Prometheus监控系统的标准格式,即metrics格式,这样Prometheus就能轻松地抓取和处理这些数据。

  远程监控支持:支持远程收集数据,这意味着无需在每台物理机上安装ipmi_exporter,只需在中心位置部署,即可监控多个远程服务器。

  灵活性:一个exporter实例可以监控多个IPMI接口,这减少了资源消耗并提高了监控效率。

  安全性:支持TLS加密和基本认证,确保监控数据在传输过程中的安全性。

应用场景
  数据中心监控:在大型数据中心中,有大量的物理服务器需要监控。ipmi_exporter能够帮助管理员实时监控这些服务器的硬件状态,如温度、电压和风扇速度等关键指标,从而确保服务器的稳定运行。

  远程故障排查:当服务器出现故障时,管理员可能无法直接访问服务器。此时,ipmi_exporter可以通过远程收集硬件数据,帮助管理员快速定位并解决问题。

  自动化运维:结合Prometheus的Alertmanager,ipmi_exporter可以自动化处理硬件警告。例如,当某个硬件指标超出预设阈值时,系统可以自动重启有问题的设备或触发通知,从而减少人工干预的需要并提高运维效率。

二、安装ipmi_exporter💾

注意事项和常见问题
  1.环境配置:确保服务器支持IPMI协议,并已启用。检查服务器的IPMI配置,包括IP地址、用户名和密码,确保可以远程访问。

  2.依赖安装:ipmi_exporter依赖于freeipmi库,因此在安装前需要确保系统上已安装freeipmi。安装freeipmi时,可以根据操作系统使用相应的包管理器,如apt-get install freeipmi(Debian/Ubuntu)或yum install freeipmi(CentOS/RHEL)。

  3.下载与安装:从GitHub的官方仓库下载ipmi_exporter的最新版本。根据需要下载对应的发行版,解压后即可使用。

  4.配置文件:如果需要监控远程服务器,需配置ipmi_remote.yml文件,指定目标服务器的IPMI地址、用户名和密码。确保配置文件中的信息准确无误,以避免连接失败。

  5.启动与运行:使用nohup或其他方式在后台启动ipmi_exporter,确保服务持续运行。启动后,可以通过访问指定的HTTP端口(默认为9290)来验证ipmi_exporter是否成功运行。

2.1 访问ipmi_exporter官方网站 🌐

2.2 选择适合的版本🔍

  • 在下载页面,你将看到不同操作系统的ipmi_exporter二进制包。根据你的操作系统选择适合的版本。例如,如果你使用的是Linux 64位系统,就选择ipmi_exporter-1.8.0.linux-amd64.tar.gz(其中x.x.x是版本号)。

2.3 下载ipmi_exporter⬇️

  • 点击所选版本的下载链接,将ipmi_exporter的二进制包下载到你的本地计算机。

2.4 解压安装包📂

  • 将下载的ipmi_exporter压缩包解压到你想要安装的目录。你可以使用命令行工具(如tar)来完成这个步骤。解压后,你将看到一个名为ipmi_exporter-x.x.x.linux-amd64的目录,其中包含ipmi_exporter的二进制文件和其他相关文件。
tar -xzf ipmi_exporter-1.8.0.linux-amd64.tar.gz

2.5 运行ipmi_exporter🚀

  • 进入解压后的目录,并运行ipmi_exporter服务器。在Linux下,你可以使用如下命令。如果一切正常,你应该能在终端看到ipmi_exporter的启动日志。
cd ipmi_exporter-x.x.x.linux-amd64

./ipmi_exporter

三、ipmi_exporter指标和配置详解📖

  • 黑色:作为默认文本颜色。
  • 绿色:表示常规配置项
  • 橙色:表示具有互斥参数的配置项 / 建议开启(根据自己的场景确定需求)
  • 蓝色:不重要的配置项 / 建议不开启
  • 红色:表示关键信息和警告 / 最好开启

注意:

  • 1.相关参数配置建议仅供参考,具体要以自己生产的实际需要自行配置。
  • 2.以下配置参数介绍是基于ipmi_exporter-1.8.0.linux-amd64版本说明的,其它版本会有不同。

3.1 ipmi_remote.yml

modules:
  default:
    user: "default_user"
    pass: "example_pw"
    driver: "LAN_2_0"
    privilege: "user"
    timeout: 10000
    collectors:
    - bmc
    - ipmi
    - chassis
    exclude_sensor_ids:
    - 2
    - 29
    - 32
    - 50
    - 52
    - 55
  dcmi:
    user: "admin_user"
    pass: "another_pw"
    privilege: "admin"
    driver: "LAN_2_0"
    collectors:
    - dcmi
  thatspecialhost:
    user: "some_user"
    pass: "secret_pw"
    privilege: "admin"
    driver: "WORK"
    collectors:
    - ipmi
    - sel
    workaround_flags:
    - discretereading
    custom_args:
      ipmi:
      - "--bridge-sensors"
  advanced:
    user: "some_user"
    pass: "secret_pw"
    privilege: "admin"
    driver: "WORK"
    collectors:
    - ipmi
    - sel
    collector_cmd:
      ipmi: sudo
      sel: sudo
    custom_args:
      ipmi:
      - "ipmimonitoring"
      sel:
      - "ipmi-sel"
  • default
    • user: “default_user”
        用于连接IPMI 设备的用户名
    • pass: “example_pw”
        用于连接IPMI 设备的密码
    • driver: “LAN_2_0”
        IPMI 协议的版本或类型。“LAN_2_0” 表示使用 IPMI v2.0 协议进行通信
    • privilege: “user”
        IPMI 用户的权限级别。“user” 权限通常允许基本的监控和读取操作,一般不允许进行配置更改
    • timeout: 10000
        连接超时时间,单位是毫秒
    • collectors: [ “bmc”,“ipmi”,“chassis” ]
        指定要启用的数据采集器列表。这些采集器决定了 ipmi_exporter 从 IPMI 设备中收集哪些数据。在提供的配置示例中,启用了 bmc(基板管理控制器信息)、ipmi(IPMI 设备信息)、chassis(机箱状态信息)等采集器,大家可以根据需要启用或禁用特定的采集器
    • exclude_sensor_ids:
        一个列表,包含不希望监控的传感器 ID。在提供的配置中,ID 为 2、29、32、50、52 和 55 的传感器将被排除在监控之外。这可以用于过滤掉不重要或不需要监控的传感器数据。
  • dcmi
    • user: “admin_user”
        用于连接到IPMI接口的用户名
    • pass: “another_pw”
        与用户名对应的密码。这里的密码是"another_pw"
    • privilege: “admin”
        定义了IPMI会话的权限级别。在此配置中,它被设置为"admin",这意味着该用户具有更高的权限,可以执行更广泛的操作,包括配置更改等
    • driver: “LAN_2_0”
        指定用于连接的IPMI驱动类型。"LAN_2_0"表示使用IPMI v2.0协议通过局域网进行通信
    • collectors: dcmi
        这是一个列表,指定ipmi_exporter应从IPMI设备收集哪些类型的数据。在此配置中,只启用了dcmi收集器
  • thatspecialhost
    • user: “some_user”
        用于连接到特定IPMI设备的用户名,这里设置为"some_user"。确保该用户名与你的IPMI设备上配置的用户名一致
    • pass: “secret_pw”
        与用户名相对应的密码,此例中为"secret_pw"。你需要确保这个密码正确,以便ipmi_exporter能够成功登录到IPMI设备
    • privilege: “admin”
        用户的权限级别,这里设置为"admin"。管理员权限通常允许用户执行更广泛的监控和管理操作
    • driver: “WORK”
        指定用于连接的IPMI驱动类型
    • collectors: [ “ipmi”,“sel” ]
        指定ipmi_exporter应从IPMI设备收集的数据类型。在这个配置中,启用了ipmi和sel两个采集器
    • workaround_flags: [“discretereading”]
        包含用于解决特定IPMI设备兼容性问题的标志
    • custom_args: ipmi: [“–bridge-sensors”]
        允许你指定额外的命令行参数,这些参数将传递给底层的IPMI监控工具(如ipmimonitoring)。在这个配置中,为ipmi采集器指定了一个参数"–bridge-sensors"。这个参数的具体作用取决于底层工具和IPMI设备的实现,通常用于处理或转换传感器数据。
  • advanced
    • user: “some_user”
        用于连接到IPMI设备的用户名
    • pass: “secret_pw”
        与用户名对应的密码
    • privilege: “admin”
         指定用于与IPMI设备通信的驱动类型
    • driver: “WORK”
         一个列表,定义了ipmi_exporter应该从IPMI设备收集哪些类型的数据
    • collectors: [ “ipmi”,“sel” ]
        一个列表,定义了ipmi_exporter应该从IPMI设备收集哪些类型的数据
    • collector_cmd: {“ipmi”: sudo ,“sel”: sudo}
        允许你为不同的采集器指定运行命令的前缀。在这个例子中,ipmi和sel采集器都使用了sudo命令前缀,这意味着ipmi_exporter会尝试以超级用户权限运行这些采集器。这是因为某些操作需要更高的权限才能执行
    • custom_args: {“ipmi”: [“ipmimonitoring”],“sel”: [“ipmi-sel”]}
        允许为特定的采集器提供自定义的命令行参数

3.2 ipmi_exporter.service

  • - -config.file=CONFIG.FILE
      指定配置文件的路径。这个配置文件包含了如何连接到 IPMI 设备的信息,比如设备的 IP 地址、用户名、密码等。CONFIG.FILE 应该替换为你的实际配置文件路径。
  • - -freeipmi.path=FREEIPMI.PATH
      指定 freeipmi 工具的路径ipmi_exporter 依赖于 freeipmi 工具来收集 IPMI 数据。如果你已经把 freeipmi 安装到了系统的 PATH 环境变量中,那么不需要设置这个参数。FREEIPMI.PATH 应该替换为 freeipmi 工具的实际路径。
  • - -[no-]web.systemd-socket
      一个布尔标志,用于控制是否使用 systemd socket 激活。如果你的 ipmi_exporter 是通过 systemd socket 激活的,那么应该启用这个标志。加上 no- 前缀会禁用这个选项,即不使用 systemd socket 激活。
  • - -web.listen-address=:9290
      指定 ipmi_exporter 的 HTTP 服务监听地址和端口。:9290 表示监听所有 IPv4 和 IPv6 地址的 9290 端口。你可以根据需要更改端口号或绑定到特定的 IP 地址。
  • - -web.config.file=“”
      要使用 TLS 和/或基本身份验证,需要传递配置文件使用参数。

四、实战演练:生产环境搭建指南🔨

4.1 安装freeipmi并添加权限

4.1.1 安装ipmitool 并加载相应模块

yum -y install ipmitool freeipmi

modprobe ipmi_msghandler
modprobe ipmi_devintf
modprobe ipmi_poweroff
modprobe ipmi_si
modprobe ipmi_watchdog

4.1.2 给deploy用户添加freeipmi的执行权限

cat >> /etc/sudoers <<EOF
deploy ALL=(ALL) NOPASSWD:/usr/sbin/ipmimonitoring,/usr/sbin/ipmi-sensors,/usr/sbin/ipmi-dcmi,/usr/sbin/ipmi-raw,/usr/sbin/bmc-info,/usr/sbin/ipmi-chassis,/usr/sbin/ipmi-sel
EOF

4.2 部署管理ipmi_exporter

4.2.1 创建普通用户管理ipmi_exporter👤

useradd deploy

4.2.2 解压ipmi_exporter.tar.gz📦

注意:
  我的是x86,所以使用ipmi_exporter-1.8.0.linux-amd64.tar.gz,您可以使用uname -a命令查看系统架构

tar xvf ipmi_exporter-1.8.0.linux-amd64.tar.gz -C /home/deploy/

4.2.3 将ipmi_exporter集成到Prometheus配置中✂️

  将ipmi_exporter集成到Prometheus配置中,确保数据能够正常采集。编辑Prometheus的配置文件(通常是prometheus.yml),在scrape_configs部分添加ipmi_exporter的配置。告诉Prometheus将采集localhost:9290的数据。

  - job_name: 'ipmi_exporter'
    static_configs:
      - targets:
      - targets: ["localhost:9290"]
        labels:
          exporter: ipmi_exporter

4.2.4 更改ipmi_exporter软件包名称✂️

mv ipmi_exporter-1.8.0.linux-amd64 /home/deploy/ipmi_exporter

4.2.5 创建ipmi_remote.yml文件

vi /home/deploy/ipmi_exporter/ipmi_remote.yml

modules:
  10.131.16.137:		# ipmi地址
    user: "ipmi_user"	# ipmi用户名
    pass: "ipmi_passwod"   # ipmi密码
    privilege: "user"
    driver: "LAN_2_0"
    collectors:
    - bmc
    - ipmi
    - dcmi
    - chassis
    - sel
    custom_args:
      bmc:
      - "bmc-info"
      ipmi:
      - "ipmimonitoring"
      dcmi:
      - "ipmi-dcmi"
      chassis:
      - "ipmi-chassis"
      sel:
      - "ipmi-sel"

4.2.6 编辑ipmi_exporter.service文件📝

cat > /etc/systemd/system/ipmi_exporter.service <<EOF
[Unit]
Description=Ipmi Exporter
After=network.target

[Service]
Type=simple
User=deploy
Group=deploy
ExecStart=/home/deploy/ipmi_exporter/ipmi_exporter\
--graphite.mapping-config=/home/deploy/ipmi_exporter/ipmi_exporter \
--config.file=ipmi_remote.yml \
--freeipmi.path=/usr/local/sbin/ \
--web.listen-address=:9290
ExecReload=/bin/kill -HUP
Restart=on-failure

[Install]
WantedBy=multi-user.target
EOF

4.2.7 启动ipmi_exporter.service🔌

sudo systemctl daemon-reload

sudo systemctl enable --now ipmi_exporter.service

4.2.8 查看服务是否正常启动🔍

# 查看service服务是否启动
sudo systemctl status ipmi_exporter.service

# 查看端口是否存在
sudo ss -ntulp | grep 9290

相关资料下载地址📚

### 关于 Ansible 如何保存敏感数据 Ansible 提供了一种称为 `ansible-vault` 的工具来加密和保护敏感数据。通过该工具,可以将包含密码、密钥或其他机密信息的文件进行加密存储,只有在提供正确密码的情况下才能解密并使用这些数据[^1]。 以下是创建和使用加密文件的一个示例: ```bash # 创建一个新的加密 YAML 文件 ansible-vault create secrets.yml # 编辑已有的加密文件 ansible-vault edit secrets.yml # 在 playbook 中使用加密文件中的变量 - hosts: all vars_files: - secrets.yml tasks: - name: Example task using sensitive data debug: msg: "{{ secret_variable }}" ``` 如果需要确保 IPMI 密码等敏感信息的安全性,则可以通过上述方法将其存放在由 `ansible-vault` 加密的文件中,并在 Playbook 或 Role 中调用它们。 --- ### 针对 `'Unknown module "default"` 错误分析解决方案 此错误表明,在尝试执行某个任务时,指定的模块名称 `"default"` 并未被识别为有效的 Ansible 模块。这可能是由于以下原因之一造成的: #### 原因一:拼写错误或不存在的模块名 确认所使用的模块名称是否正确。例如,IPMI 相关的操作通常会涉及 `community.general.ipmi_power` 模块(来自社区集合),而不是默认存在的基础模块集内的某项功能。 #### 解决方案: 安装所需的额外集合以支持特定硬件交互操作。对于 IPMI 支持来说,可能需要用到 `community.general` 这样的扩展包。 ```bash ansible-galaxy collection install community.general ``` 之后更新角色或者脚本里引用到的具体模块路径至完整的命名空间形式比如改为 `community.general.ipmi_*`. #### 原因二:缺少必要的依赖库 部分高级功能依赖外部 Python 库的支持。例如,某些网络设备管理和监控任务可能会要求预先装好 pyghmi (用于处理 IPMI 协议通信) 等软件组件。 #### 解决方案: 验证目标机器上的 Python 环境已经具备所需的所有附加库。如果没有的话,请按照官方文档指导完成相应设置步骤。 ```bash pip install pyghmi ``` 另外值得注意的是,即使解决了当前这个关于未知模组的问题后,仍需注意其他潜在配置方面可能出现的新状况,像正确的凭据传递机制等等也需要仔细核查一遍才行。 --- ### 总结代码片段展示如何加载 vault 和调用正确模块 下面给出一段综合考虑安全性以及功能性需求后的完整样例程序清单作为参考依据之一: ```yaml --- - name: Manage remote system via IPMI interface securely. hosts: target_servers gather_facts: false vars_files: - "@vault_secrets" pre_tasks: - name: Ensure required python modules are present locally. pip: name: pyghmi state: latest roles: - role: configure_ipmi_settings tasks: - name: Power cycle the machine through IPMI command safely guarded by encryption techiques applied earlier on credentials storage part already discussed above. community.general.ipmi_power: hostname: "{{ inventory_hostname }}" username: "{{ ipmi_user | string }}" password: "{{ ipmi_pass | string }}" state: reset ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

喜提yBei冰美式

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值