重建资讯聚合记

重建资讯聚合记

基于 RSS

前两天,在迁移 iCloud 账号时,遇到了一个措手不及的失误。一直以来,我使用 News Explorer 作为资讯聚合的工具,收取新闻、学术期刊、网志、视频更新等内容。它不仅支持 RSS 2.0、RDFATOM)、JSON,也可以追踪 Twitter、YouTube。iCloud 同步本来是它的主要特色功能,使资讯收取可以在搭载 macOS、iOS、tvOS 和 watchOS 的 Apple 生态产品上保持同步,然而却也是造成 feed 丢失的「罪魁祸首」。

为何要迁移 iCloud 呢?此前我的账号是在香港注册的,另外分别注册了美国、日本、英国、中国等地的 Apple ID,用来下载和购买不同国家限定的应用程序。i) 随着香港政治形势的恶化,不能排除在不久的未来也会出现「云上香港」的情况;ii) 单纯从用户体验上来说,Apple 作为一间美国公司,大部分新产品和服务的推出并不会第一时间顾及东亚,例如 Arcade 就不支持香港(虽然也没有登陆几个好玩的游戏)。

在切换账号之前,News Explorer 的 iOS 客户端上开启了同步,但 macOS 是关闭的。切换之后,我先发现 iOS 上的 feed 大部分丢失了,于是将 macOS 端开启,希望能将完整的 feed 传送通过云服务同步至 iOS 上。然而总是事与愿违,开启同步的结果是 macOS 上的资讯一并消失,不知是不是随着先前账号的登出而被移除。

image.png
Feed 丢失过程

我没有时间和精力去复现验证这一问题到底是如何发生的,责备 iCloud 的同步机制也无济于事,只能告诫自己勤备份,并将其看作是重新整合一次资讯聚合的好机会。过去两天中,通过努力找回记忆、参考曾在 Telegram 频道中分享过的图片等方式,逐渐重建起来,在此记录,分享经验,也为下一次灾难之后的重建留下快照。

Table of Contents

工具

聚合技术的发展和 RSS 的历史也就在此就不赘述了。简单来说,若是想知道一个网站、博客更新了文章,除了定期自己打开查看,有几种种方法可以追踪——

a) 电子邮件推送,很多网站都会主动提示浏览者通过电子邮件订阅,如此主动当然背后是另有所图,时常收到的并不是重要内容更新,而是无关紧要的广告,而 Gmail 看似智能的分类系统有时候也会帮倒忙

b) 社交账号更新,零成本的社交账号使很多传统机构从旧媒体中拓展出来,也使个人和小团体有了发声的渠道。但混杂于其他推文之中,加之平台割据,收紧 API,前两年的一些聚合产品也都纷纷倒下。

c) RSS,从技术源流角度的全名是 RDF Site Summary,从现今定义和望文生义来说是 Really Simple Syndication。曾经大多数浏览器默认带有检查 RSS 订阅的功能,但如今只剩下 IE 这个在登陆银行、学校、政府旧系统时才会用到的浏览器还保留着。就连同支持 RSS 技术早期发展的 Netscape 紧密相关的 Firefox 也在前年移除了 RSS。即便如此,相比上述的收取资讯的工具,RSS 还是有其优势——你不是在收发电子邮件或是刷微博 / 推特的场景下,而是一个专门查看资讯的场景中,这样的不受干扰的机制有利于形成阅读资讯的习惯。

image.png
整理资讯类别与来源

我并非给 News Explorer 做广告,因为订阅了 Setapp,故测试了其中两款 RSS 客户端,另一款是 Cappuccino。另外我也用过如 Feedly、Reader 等客户端。甚至还可以用 IFTTT 添加提醒或转发等自动操作、Slack 里添加 RSS App,Telegram bot、电子邮件转发……

image.png
几款 RSS 客户端,左至右为 News Explorer、Cappuccino、Feedly 和 Reeder 4

选择何种方式、哪一款产品,需要综合考量跨平台、性价比、稳定性、操作与美观等方面同自身需求的契合程度。

方法 & 渠道

新闻

image.png
订阅的新闻媒体与新闻传播博客

不幸的是,大部分网站对于 RSS 很不友好,几乎不支持。当然可以学习自己搭建 RSS 服务,好处在于可自制性强,但同时也需要学习成本,耗费运维精力。或者也可以使用已有的 RSS 订阅源。最近 RSSHub 这个开源项目日趋完善,贡献者众多,路由覆盖广泛,除了创建未支持 RSS 的来源,也对已有 RSS 的 feed 做了优化。 我订阅了其中的美联社纽约时报BBC金融时报The Economist卫报香港电台南方周末澎湃新闻。虽然 RSSHub 也建立了几个国际媒体的路由,但只是较为出名的几个。若是有阅读英文新闻的需要,可以直接 Google 搜寻,大多数英文的新闻网站目前还勉强支持 RSS。

但我曾推荐过的 Quartz,他们十分重视电子邮件时事通讯,提供多种邮件订阅,也因此对 RSS 并不友善。不过可以借用 Kill the Newsletter 项目提供的订阅地址

学术资讯

image.png
订阅的部分社会学期刊

对我来说,主要追踪社会科学和人文学科相关的期刊更新,但创建方法是共通的,对自然科学、应用科学等也适用,即进入网站,找到 RSS 地址,添加订阅。上图中可见,社会科学出版商 SAGE 承揽了大多数社科类期刊的发行,以它为例,期刊页面的导航中提供了电子邮件和 RSS 追踪的方式,选择已打印或线上先行的更新即可。其他网站中也都不难找到,不过牛津确实别树一帜,主页中找不到,需要先进入某一期才显示。

至于如何选择期刊,不免俗的方法是从排名入手。比如 Scimago,也可以在 Wikipedia 的 list 中找寻。或者从学术学会等机构入手,也可以多关注一些关于期刊排名的研究和讨论,会有不少收获。

News Explorer 2020-03-06 at 23.18.14@2x.jpg
订阅的部分社会学博客

除了学术期刊,不少学者也会在自己的博客发表初步研究、教学感想、学习资源等,或是一些研究机构的非同行审议的学术资讯,大学的学术会议、招生等情报。不过这也是 RSS 的本职工作了。这类来源的寻找需要日积月累,或是利用 Google 等检索工具获得突破口。


最后希望自己以后不会再用到这篇文章,也希望能帮助到有资讯整合需求的人。



Some rights reserved
Except where otherwise noted, content on this page is licensed under a Creative Commons Attribution-ShareAlike 4.0 International license.