分析#
三角形の内角の合計は 180 度であり、これはユークリッド幾何学でのみ成立するものです。
RSS の使用も同様で、自身のニーズに合致し、便利で簡単で低コストであるかどうかを見る必要があります。RSS を使用することを確定し、Python のウェブスクレイピングやその他の方法ではなく、この RSS を使用することにします。そのために、まずシナリオを仮定しましょう。
例えば、私たちはウェブサイト「少数派」の「おすすめ」セクションが特に好きです。セクションの更新情報をタイムリーに受け取るために、アプリをダウンロードするのが最も便利な方法かもしれませんが、それはちょっと面倒であり、以前にもトップニュースを見たいと思って「澎湃新聞」をダウンロードし、人民日報の動向に興味があるために「微博」をダウンロードし、文学や芸術を見たいために「ONE」をダウンロードしました。
アプリをインストールしない場合、更新があるかどうかを確認するためにブラウザを時々開くしかありません。
これは非常に不便です。私はあなたの「おすすめ」セクションに興味があるだけであり、ウェブサイト全体を開く必要はありません。
この時、あなたはおそらくウェブスクレイピングを行い、定期的にこのウェブページをキャプチャし、その中から「おすすめ」セクションのデータのみを抽出し、携帯電話のメールなどに送信するという方法を考えるかもしれません。
明らかに、まずすべての人がウェブスクレイピングを行うわけではありませんし、その手順はやや複雑です。比較すると、ウェブページを直接開くことが最もコストパフォーマンスの高い方法になってしまいます。
しかし、非常に幸運なことに、このウェブサイトは「おすすめ」セクションのデータを専門に提供しており、つまり私たちはウェブスクレイピングの手順を省略することができます。
ウェブサイトは通常、XML または Atom 形式のファイルを提供し、開くとテキストとコードが混在しています。私たちは直接読む必要はありませんが、対応するリーダーを使用してこれらのデータを読み取り、再フォーマットすることができます。これにより、ウェブページを開かずに記事を閲覧することができます。
一つ言及すべきは、リーダーはフォーマットファイル自体のデータを解析しているだけなので、ウェブサイトのコンテンツが更新された場合、リーダーが使用しているファイルも再ダウンロードする必要があります。したがって、ウェブサイトは通常、動的に更新可能な XML リンクを提供し、ウェブサイトのコンテンツが更新されると、XML の内容も更新されます。この場合、リーダーは最新の記事を認識して読み取ることができます。
このように、全体のプロセスは次のようになります。
ウェブサイトの更新 -> XML の内容の更新 -> リーダーが XML リンクを更新 -> データの解析、フォーマット、およびプッシュ
これらの機能を実現するために使用される技術は、RSS、Really Simple Syndication、または日本語でシンプルな情報集約です。
使用の前提条件#
RSS フィードの必要性#
RSS を使用するには、まず XML リンク、つまりフィードを見つける必要があります。例えば、少数派が提供している https://sspai.com/feed などです。
ウェブサイトに独自の RSS フィードがある場合#
少数派が提供している
に参加してください。
ウェブサイトに独自の RSS フィードがない場合#
RSS フィードの作成#
以下のキーワードで検索します。
feed43
feed43 チュートリアル
feed43 の代替
RSSHub#
もし私が人民日報の Weiboのような人気のあるウェブページを購読したい場合、すでに先輩たちがフィードを作成してくれているかもしれませんので、それを直接使用することができます。
このような場合、フィードを作成できるユーザーはこれらのフィードを共有できるのではないでしょうか?
RSSHubはそのようなプロジェクトです。
"万物皆可 RSS"
開けない場合は、ネットワーク環境の問題です。
ドキュメントのミラーは
https://rsshub.netlify.app/
百度で検索してください
Welcome to RSSHub!
と入力すると、熱心なユーザーが提供しているミラーウェブサイトが表示されます。
使用方法は、フィードのリンクの https://rsshub.app/ を上記のいずれかに置き換えるだけです。
WeChat 公式アカウントの購読#
ほとんど安定したソリューションはありません。
WeChat の記事を読む最良の方法は、WeChat 読書や QQ メールを使用することかもしれません。
RSS フィードのフィルタリング#
フィードをフィルタリングすることもできますし、フィルタリングがサポートされているリーダーでフィルタリングすることもできます。
RSS リーダーの必要性#
次に、RSS リーダーを見つける必要があります。少なくともフィードを購読し、フィードを自動的に更新できるリーダーが必要です。例えば、
などです。
または、百度で検索してください
inoreader の代替
RSS リーダーの比較
最高の RSS リーダーソフトウェア
私の RSSHub の使用例#
RSS はウェブコンテンツの更新を通知するのに非常に便利です。
例を挙げましょう。
このウェブページでは、遊戯王の先行カードをダウンロードし、更新ログを確認することができます。
今、私は次の機能を実現したいと考えています:新しい先行カードがある場合、ダウンロードリンクと更新ログを受け取ることができるようにしたいです。
まず、私は RSSHub で簡単なルートを作成しました、つまりフィード
https://www.wodersshub.eu.org/ygo233/demo
このリンクにアクセスするたびに、現在のウェブページに対して RSS ファイルが手動で生成されます。
その後、ifttt や zapier などの自動化ツールを使用して、この RSS を購読し、自分のメールボックスに送信することができます。
更新の要件が非常に緊急ではないため、私はhttps://follow.it/ を使用して RSS を購読し、更新があるかどうかを 1 日に 1 回チェックし、あれば登録したメールボックスに送信します。
-
登録
-
追加
-
フィルタリング(通常は設定する必要はありません)
-
プッシュ
-
保存