监控 IT 资产是任何 IT 部门的基本任务。然而,由于企业网络中设备数量的不断增长,找到一种足够灵活的方法来正确监控各种可用系统变得越来越具有挑战性。拥有一个灵活、可扩展且易于使用的监控工具至关重要。
在本文中,我将演示如何安装 Checkmk,这款来自 tribe29 的监控工具,以及如何使用它来监控服务器和网络设备。
在 Linux 上安装 Checkmk
在本文中,我使用 Checkmk Raw Edition,社区 GPLv2 版本(企业版具有额外的功能和付费支持),并将其安装在 Linux 服务器上。Checkmk 可以运行在 Linux 上,包括 RHEL、CentOS、Debian 等,以及容器中或作为虚拟设备。你可以从官方 Checkmk 网站 下载适用于所有平台的最新 Checkmk 版本。
开始使用
开始使用 Checkmk 不需要很长时间,因为它已经通过其近 2,000 个插件支持了大多数监控用例。Checkmk 还为警报和警告提供了预配置的阈值,因此你无需浪费时间自己配置这些阈值,当然,你可以根据需要自定义这些阈值。
除了这些官方集成之外,你还可以使用其他用户在 Checkmk Exchange 上创建和共享的监控扩展。如果你想了解更多关于 Checkmk 工具的信息或为其做出贡献,可以查看 GitHub 仓库。
本教程不需要任何监控经验。但是,如果你想遵循此步骤,你必须拥有你用作主机的服务器的 root 访问权限。
选择并下载 Checkmk Raw Edition
- 下载 Checkmk Raw Edition(它是免费和开源的)或企业版的 Checkmk Free Edition 。
- 接下来,将安装程序文件发送到你想要托管 Checkmk 的服务器。我使用 scp 命令。在本教程中,我的主机的 IP 地址是 10.0.2.15。
$ scp check-mk-raw-X.Y.Zp8_0.focal_amd64.deb tux@10.0.2.15:/tmp
本教程中的所有后续操作都在主机服务器上执行。
- 使用
ssh
登录到你的主机。
$ ssh tux@10.0.2.15
安装 Checkmk 软件包
- 现在你必须安装软件包,包括其所有依赖项。这可以使用你的发行版的软件包管理器完成,例如
apt
或dnf
$ sudo apt install /tmp/check-mk-raw-X.Y.Zp8_0.focal_amd64.deb
- 安装完成后,你可以使用
omd
命令执行测试。
$ omd version
omd
命令用于 Open Monitoring Distribution,这是一个由 Checkmk 的创始人 Mathias Kettner 创建的开源项目。它可以帮助你安装由各种开源组件组装而成的监控解决方案。
创建一个 Checkmk 监控站点
- 下一步是启动一个初始监控站点(“站点”是一个实例)。使用
omd create
创建一个新的 Checkmk 站点,并根据你的意愿命名。在本例中,我使用checkmk_demo
。
$ sudo omd create checkmk_demo
- 作为响应,你将获得关于如何启动和访问你的 Checkmk 站点的有用信息。你可以按照步骤立即更改你的管理员密码,但我更喜欢在 Checkmk 用户界面中执行此操作。所以,现在,复制随机生成的密码(你在下一步需要它)并启动你的监控站点。
$ sudo omd start checkmk_demo
如果你想在以后更深入地研究 Checkmk,那么了解刚刚发生了什么是很重要的。
- 你创建了一个新用户,称为站点用户,以及服务器上以站点名称命名的组。
- 站点的目录已在
/omd/sites
下创建(例如,/omd/sites/checkmk_demo
)。
Checkmk 还将其默认配置复制到新目录中。 - 为 Checkmk Web 界面创建了一个名为 cmkadmin 的用户。
开始使用 Checkmk 监控
现在是时候切换到 Web 浏览器中的 Checkmk 用户界面了。每个 Checkmk 站点都有自己的 URL,由你的监控服务器的 IP 地址或主机名以及 Checkmk 站点的名称组成。在本例中,我的 Checkmk 安装位于 monitoring-host-server/checkmk_demo/。
- 在你的浏览器中打开指向你的 Checkmk 站点的链接。你可以打开终端上显示的链接。
- 以 cmkadmin 用户身份登录,使用你从终端复制的密码。
登录后,你将看到一个空白的仪表板。 - 单击左侧边栏中的用户类别,然后单击个人资料下的更改密码。在这里,你可以更改你的密码。
监控设置
Checkmk 支持多种监控服务器的方式,而服务器监控的最佳方法通常是使用 Checkmk 代理。在添加服务器之前,你需要安装代理。
- 在左侧边栏中,单击设置(带有齿轮的按钮)。
这是你执行所有配置并查找监控代理的控制面板。Raw Edition 和 Enterprise Edition 之间存在一些 UI 差异,但本文中的所有屏幕截图均来自开源 Raw Edition。 - 单击代理并为你的操作系统选择合适的软件包。
Linux 的打包代理以 RPM 和 DEB 文件格式提供。
- 在你的监控主机上下载并安装代理。
你可以通过在服务器的终端中执行 check_mk_agent
命令来测试代理是否正常工作。
添加主机
安装代理后,返回设置屏幕并选择主机。
- 单击添加主机。
- 在主机名下添加你的服务器名称。
如果你的网络中设置了 DNS,Checkmk 会自动解析你的主机名的 IP 地址。否则,通过单击IPv4 地址旁边的复选框来添加 IP 地址。如果添加 IP 地址,你可以选择任何你喜欢的主机名。保持其他区域不变。
- 单击保存并转到服务配置。Checkmk 现在会自动发现该主机上任何相关的监控服务,并将它们列为未决服务。此外,正如你在屏幕截图中看到的那样,Checkmk 会根据设备类型自动添加标签。
- 单击修复全部 以监控所有这些服务。这会将所有检测到的服务和主机标签添加到你的监控仪表板,并删除已消失的服务。当然,你可以手动管理服务,但修复全部功能使其变得容易得多。
- 接下来,通过单击右上角带有黄色感叹号 (!) 的突出显示字段来激活你的更改。单击在选定站点上激活,你就已成功将第一台服务器添加到你的监控中。
需要显式激活更改是一种安全机制。所有进行的更改首先列在待定更改下,以便你可以在任何更改影响你的监控之前查看它们。Checkmk 区分了设置作为配置环境(你在其中管理主机、服务和设置),以及称为监控的区域(在其中进行实际的操作监控)。最初,配置中的新主机和其他更改不会影响监控。你必须先激活这些更改,然后它们才能投入生产。
SNMP 监控
除了服务器监控之外,另一个重要的监控任务是网络监控。例如,我想向你展示如何通过 SNMP 监控交换机。你只需确保你要监控的设备上的 SNMP 代理已激活,并且你的 Checkmk 服务器可以访问此设备。
- 转到设置 > 主机 并单击添加主机。
- 输入主机名和 IP 地址(如果需要)。
默认情况下,Checkmk 假定你使用 Checkmk 代理,因此你需要在监控代理下编辑它。 - 选中SNMP旁边的复选框,并将框切换到你的 SNMP 版本(很可能是“SNMP v2 或 v3”)。
Checkmk 默认情况下也假定你的 SNMP 团体名称是 public,因为它也是大多数 SNMP 设备上的默认名称。如果是这种情况,你可以将SNMP 凭据框保持未选中状态(就像我一样)。否则,你必须选中此框并在此处添加你的 SNMP 凭据。
- 和以前一样,单击保存并转到服务配置,Checkmk 会发现所有当前在线的接口、正常运行时间和 SNMP 信息检查。
如果存在特定类型设备的监控插件,Checkmk 会自动检测更多监控服务。 - 单击修复全部并接受更改。
监控愉快
现在你的 Checkmk 站点将启动并运行,并且已经添加了两个主机。本教程到此结束,但你的真正监控体验才刚刚开始。你可能已经注意到 Checkmk 为几乎所有操作系统都提供了代理,因此你可以添加更多主机。与其他系统的步骤类似。Checkmk 还支持 SNMP、IPMI、HTML 和许多其他标准,因此你始终可以找到一种有效的方法来监控特定系统。请查看 Checkmk 手册,以及 官方 Checkmk 论坛。监控愉快!
1 条评论