changedetection.ioを使用すると、サイトに変更や更新があったときにアラートを受け取ることができます。
2020年、パンデミックのニュースは目まぐるしく駆け巡り、さまざまな最新情報を提供する類似のニュース記事に誰もが圧倒されていました。
でも、私が知りたいのは、公式のガイドラインがいつ変わるのかということ。結局のところ、私にとって重要なのはそれだけです。
パンデミック(世界的流行病)であろうと、最新の技術ニュースであろうと、ウェブサイトのコンテンツの変更について前もって知っておくことは非常に重要です。
changedetection.io プロジェクトは、ウェブサイトの変更検出と通知のためのシンプルで強力なオープンソースソリューションを提供します。セットアップは簡単で、Matrix、Mattermost、Nextcloud、Signal、Zulip、Home Assistant、Eメールなど、70種類以上の通知システムに通知できます。また、Discord、Office365、Reddit、Telegram などの独自アプリにも通知できます。
しかし、changedetection.ioはウェブコンテンツの監視だけにとどまりません。XMLやJSONフィードを監視することもでき、サイトへの変更を記録するRSSフィードを作成します。
組み込みのJSONシンプルストレージシステムのおかげで、情報を受信して保存するために複雑なデータベースをセットアップする必要はありません。 docker" イメージで実行 ことも、pipでインストールすることもできます。このプロジェクトには、ほとんどの一般的な問題をカバーする 包括的なwikiヘルプページがあります。
複雑なJavaScriptを使用しているサイトでは、組み込みの Playwrightコンテンツフェッチャーを 使用してChromiumまたはChromeにchangedetection.ioを接続することができます。
実行後、ブラウザでアプリケーションにアクセスします。外部ネットワークからアクセスできる場合は、パスワードを設定することができます。
監視したいページのURLを送信します。そのページがどのようにフィルタリングされるかに関連する設定がいくつかあります。例えば、ある企業のウェブサイトのフッターに表示されている株価がいつ変化したかを知りたいとは思わないかもしれませんが、その企業がブログに投稿したニュース記事については知りたいかもしれません。
ウェブサイトの監視
お気に入りのウェブサイト Opensource.com 監視用に追加したいとします。タグ付けされた主要な記事に "python "という単語が含まれたときに、マトリックス経由で通知を受け取りたいだけです。
そのためには、まず「"ツール"」を使います。
このツールは、コンテンツに最適なXpathまたはCSSフィルタを自動的に計算します。そうしないと、毎日のページ更新で多くのノイズが発生します。
次に「」タブにアクセスします。
のエリアには、前のステップで自動生成されたCSSフィルターが表示されています。
""、""、""、""などの便利なフィルターがあります。
には監視したいキーワードを入力します。
最後のステップは""タブで、受け取りたい通知を設定します。以下では、Matrix APIを使って、Matrixルームを通知先として追加しています。
通知のURLの形式は matrixs://username:password@matrix.org/#/room/#room-name:matrix.orgです。
ただし、t2Bot フォーマットもサポートしています。 マトリックスの通知オプションはこちらです。
以上です! これで、コンテンツに変更があるたびに、マトリックス経由でメッセージが届きます。
まだまだあります。
changedetection.ioには他にもたくさんの機能があります。カスタム JSON API を呼び出したい場合は、通知 API を使用する必要はありません。また、カスタム HTTP リクエストを作成したり、検査の前に JavaScript を実行したり、他にも興味深い機能がたくさんあります。
ウェブサイトの閲覧をやめて、ウェブの監視を始めましょう!
via:





