2020 年,关于 COVID-19 的新闻铺天盖地而来,每个人都感到不知所措,类似的报道提供了不同程度的准确性更新。
但我需要知道的只是我的官方政府指南何时发生变化。 最终,这对我来说才是最重要的。
无论关注的是疫情还是最新的科技新闻,及时了解网站内容的变更都至关重要。
changedetection.io 项目提供了一个简单但功能强大的开源解决方案,用于网站变更检测和通知。 它易于设置,并且可以通过 70 多种(并且还在增加)不同的通知系统发送通知,例如 Matrix、Mattermost、Nextcloud、Signal、Zulip、Home Assistant、电子邮件等。它还会通知像 Discord、Office365、Reddit、Telegram 等专有应用程序。
但是 changedetection.io 不仅限于监视网页内容。 您还可以监控 XML 和 JSON 提要,并且它将构建已更改网站的 RSS 提要。
由于其内置的 JSON 简单存储系统,无需设置复杂的数据库来接收和存储信息。 您可以 将其作为 Docker 镜像运行或使用 pip
安装它。 该项目有一个内容丰富的 Wiki 帮助部分,其中涵盖了最常见的问题。
对于使用复杂 JavaScript 的站点,您可以使用内置的 Playwright 内容获取器将您的 changedetection.io 安装连接到 Chromium 或 Chrome 浏览器。
运行后,在您的浏览器中访问该应用程序(默认情况下为 http://localhost:5000
)。 如果您的计算机可以从外部网络访问,您可以在**设置**部分设置密码。

(Leigh Morresi, CC BY-SA 4.0)
提交您要监控的页面的 URL。 有几个与如何过滤页面相关的设置。 例如,您很可能不想知道公司网站页脚中列出的股票价格何时发生变化,但您可能想知道他们何时在其博客上发布新闻文章。
监控一个站点
假设您要将您最喜欢的网站 Opensource.com 添加到监控列表中。 您只想知道何时主要醒目标题文章包含单词“python”,并且您希望通过 Matrix 收到通知。
为此,请从**visual-selector**工具开始。(这需要连接 **playwright** 浏览器界面。)

(Leigh Morresi, CC BY-SA 4.0)
**visual-selector**工具会自动计算最佳 Xpath 或 CSS 过滤器以定位内容。 否则,您会从每日页面更新中获得很多噪音。
接下来,访问**Filters & Triggers**选项卡。

(Leigh Morresi, CC BY-SA 4.0)
在 **CSS/JSON/XPATH Filter** 字段(蓝色圆圈)中,您可以看到上一步自动生成的 CSS 过滤器。
有几个有用的过滤器可用,例如**Remove elements**(非常适合删除嘈杂的元素)、**Ignore text, Trigger/wait for text** 和 **Block change-detection if text matches**(用于等待某些文本消失,例如“已售完”)。
在 **Trigger/wait for text**(红色圆圈)中,键入您要监控的关键字。(在本例中为“python”。)
最后一步是在**Notifications**选项卡中,您可以在其中配置您希望接收通知的位置。 下面我添加了一个 Matrix 房间作为通知目标,使用 Matrix API。

(Leigh Morresi, CC BY-SA 4.0)
通知 URL 的格式为 matrixs://username:password@matrix.org/#/room/#room-name:matrix.org
但是,也支持 t2Bot 格式。 这里有更多 Matrix 通知选项。
就是这样! 现在,每当内容更改时,您都会收到一条 Matrix 消息。
还有更多
changedetection.io 还有很多内容。 如果您更喜欢调用自定义 JSON API,则不必使用 API 进行通知(使用 jsons://
)。 您还可以创建自定义 HTTP 请求(POST 和 GET)、在检查之前执行 JavaScript(也许可以预先填写用户名和密码登录字段)以及更多有趣的功能,并且还有更多功能即将推出。
停止浏览网页,开始监视网页!
评论已关闭。