分析#
三角形的内角和为 180 度,这是只有在欧氏几何中才能成立的。
RSS 的使用也是类似的,要看是否符合的自身需求且方便简单成本低,确定要使用的是 RSS,而不是 pyhton 爬虫或是别的什么。对此,我们先假设一种场景。
比如说我们特别喜欢看网站少数派的推荐一栏。为了及时收到栏目的更新,可能下载 App 是最方便的方法,不过有种为了点醋包饺子的感觉,而且之前我们因为想看头条,下载了澎湃新闻, 想关注人民日报的动态,下载了微博,想看文艺文学,下载了ONE。
要是不安装 App,就只能时不时打开浏览器去看是否有更新。
这是很不方便的。因为我只对你的推荐一栏感兴趣,没必要去打开你整个网页。
这时候你可能会想,是不是我应该做一个爬虫,定时去抓取这个网页,然后只提取出推荐一栏的数据,再发送到手机邮箱这类可以推送的什么东西上?
很显然,首先并不是我们所有人都会爬虫,其次步骤听着就有些过于复杂,对比之下,反而直接打开网页成了性价比最高的方法。
不过很幸运地是,这个网站专门提供了推荐一栏的数据,也就是我们省去了爬虫这个步骤。
网站提供的一般是 xml 或 atom 格式的文件,打开后就可以看到文字和代码混杂在一起。我们不用直接去阅读,可以用相应的阅读器去读取这些数据,并重新进行排版。就可以实现不打开网页而观看文章。
值得一提的是,因为阅读器只是在解析排版文件本身的数据,那么就会出现网站内容更新了,但阅读器所用的文件还需要重新下载的情况。因此网站一般都是提供一个可以动态更新的 xml 链接,网站内容更新后 xml 的内容也会随之更新,此时阅读器就可以识别并读取最新的文章了。
总结一下整个流程如下:
网页更新 -> xml 内容更新 -> 阅读器更新 xml 链接 -> 解析数据排版识别并推送
这些功能的实现所用到的技术就是 RSS,Really Simple Syndication,中文名简易信息聚合。
使用前提#
需要 RSS 订阅源#
想要用 RSS ,就要找到 xml 链接,也就是 feed , 通俗讲就是订阅源,比如少数派提供的 https://sspai.com/feed 。
网站有自己的 RSS 订阅源#
少数派提供的
加入订阅即可。
网站没有自己的 RSS 订阅源#
订阅源制作#
搜索关键词
feed43
feed43 教程
feed43 替代品
RSSHub#
如果我想订阅的是人民日报的微博这种热门的网页,可能已经有前辈们做好了一个订阅源,我们直接拿来用就行。
这样的话,每个有能力创建订阅源的用户是不是可以把这些订阅源分享出来?
RSSHub就是这样的项目。
“万物皆可 RSS”
打不开是网络环境的问题。
文档的镜像为
https://rsshub.netlify.app/
在百度搜索
Welcome to RSSHub!
就可以看到各位热心网友贡献出来的镜像网站了。
用法就是把订阅源链接的 https://rsshub.app/ 换成上面任何一个就行。
微信公众号的订阅#
几乎没有什么稳定的方案。
看微信文章的最好方案可能是用微信读书或者 QQ 邮箱了。
RSS 订阅源过滤#
可以从订阅源过滤,也可以在支持过滤的阅读器中过滤。
需要 RSS 阅读器#
然后就是找到一个 RSS 阅读器,至少可以订阅链接,能够自动更新订阅源,比如
或者在百度上搜索
inoreader 的替代品
RSS 阅读器对比
最好的 RSS 订阅软件
我的 RSSHub 使用案例#
rss 用来提醒网页内容的更新比较方便。
举个例子。
这个网页可以下载游戏王的先行卡片,看到它的更新日志。
现在我想要实现一个功能:当有新的先行卡时,我能收到收到下载链接和更新日志。
我先用 RSSHub 写了一个简单的路由,也就是订阅源
https://www.wodersshub.eu.org/ygo233/demo
每次访问这个链接,就相当给此时的网页手动生成了 rss 文件
这时候可以用 ifttt,zapier 这类自动化工具订阅 rss,并发送到自己的邮箱。
因为我对更新的要求不是很迫切,所以我是用https://follow.it/ 来订阅 rss,一天检测一次是否有更新,有的话发送到注册邮箱中。
-
注册
-
添加
-
过滤(一般不用设置这个)
-
推送
-
保存
-