RSS訂閱微信公眾號初探-feed43

2022-08-04 06:03:21

為什麼用RSS,能怎麼用RSS訂閱微信公眾號

建議資訊聚合(Really Simple Syndication, RSS)在08年我第一次摸到自己家電腦時就給我留下了印象,當時還想這開啟都啥玩意呀怎麼一堆編碼,好多網站還都有,只怪當時無知,年少不知RSS好。RSS跳過了平臺,更方便快速地獲取各渠道來源的訂閱資訊。在平臺日益封閉、推薦演演算法日益精準、各大APP日益臃腫(沒錯就是張小聾的大而醜)的今天,若能使用RSS獲取資訊,也算是稍稍開啟資訊繭房一絲縫,獲得稍好閱讀體驗的一種方法。

RSS閱讀器儘管關了許多,但仍然有新的產品運營,我目前使用的時Fluent Reader。然而最難解決的時RSS源的獲取,有的網站還提供官方RSS源,不過如今是越來越少了。說到微信,平臺封閉性很強,過去的微廣場等都被封殺,如今的搜狗微信也無法再多顯示哪怕第二條文章推播。本文所採用的feed43方法實際是通過搜狗微信來解決的,儘管操作簡單方便,但侷限性很明顯,對有頻繁推播的公眾號是能力不足。並且feed43免費套餐更新頻率低(6小時),適用於低頻少量更新的公眾號。

此外此處也介紹一下其他微信公眾號轉RSS或者獲取RSS源的方法

  1. Huginn,這是需要自己部署的平臺,之前筆者在heroku上試過一次,但如果沒有自己的伺服器效果並不好,且具有較高操作門檻。然而其資訊源同樣是搜狗微信,那麼僅能獲取第一條文章推播的侷限性依舊存在。因此筆者不建議採用該方法。不過額外提一句,Huginn是個很強大的工具,作為私有IFTTT(If This Then That),能夠監控全網資料,適當使用相信能實現巨大價值。
  2. RSSHub,似乎有時候上不去?平臺上已有諸多RSS源,然而在筆者寫文時發現無法使用這些源。也可自己部署,不過這又有伺服器的問題了。
  3. EFB,聊天機器人,從網頁微信獲取資訊再在其他平臺轉發轉換。這是網友所提方法[1]。不過侷限性也很明顯,網頁微信我登不上了,此處我祝張小聾****
  4. feeddd,這個也挺有意思的,需要結合Hamibot使用,模擬使用者操作手機,獲取微信資訊。不過一個是對英文版系統不支援,一個是要有一段時間專門開著螢幕給軟體操作,我個人覺得如果公眾號比較多這個時間還不短。也有網友對這種需要無障礙服務許可權的極大許可權操作表示安全性的懷疑。
  5. 其他付費渠道,如WeRss(似乎目前不開放新使用者了),瓦斯閱讀,VReadTech,今天看啥(似乎不太好上?),...

Feed43的使用

Feed43由來已久,根據HTML標誌爬取靜態網頁中的內容。進入官網https://feed43.com/後就可以直接建立RSS源了,不過也可以註冊一個使用者,用於管理自己的源,還可以對RSS連結個性化重新命名。

建立的過程非常簡單,根據其步驟操作即可。以公眾號鋅刻度為例進行範例,首先找到其微訊號為znkedu。在搜狗微信對應的搜尋網址為https://weixin.sogou.com/weixin?query=znkedu,其他公眾號只需修改等號後的紅色部分。確認無誤後填入Feed43的URL框即可。值得注意的是有的微訊號能搜出多個公眾號,這塊沒關係,後面會進行篩選選擇。


點選Reload,HTML程式碼就被載入顯示出來了。第二步對特徵HTML提取,對不熟悉HTML的小夥伴可以先在原網頁用F12開啟網頁程式碼檢查視窗,對元素進行定位。能夠發現最新文章的連結對應的HTML欄位。不同公眾號其區別僅在於文章標題和網址的不同,因此可以給Feed43標誌語段如下。其中{%}表示所要提取的內容,此外還有{*}類似萬用字元表示任意字元。提取內容按順序{%1}、{%2}排列。點選Extract,可以看看所提取內容是否正確。此處也對搜出多個公眾號的情況進行了處理,"account_article_0"欄位表示第一個公眾號,"account_article_1"表示第二個,以此類推,因此若按微訊號搜尋,第一應當都是所要的公眾號,只需保持該程式碼即可。

<a target="_blank" uigs="account_article_0" href="{%}">{%}</a><span>

確保所提取內容正確後進入第三步,編輯RSS相關資訊,如源名稱、來源連結、描述等,以及最重要的RSS輸出選項。以筆者所設為例,標題為{%2},即為文章題目,內容也為該題目,而全文連結即網頁所提連結。點選Preview可以檢視RSS生成資訊

最後生成的URL即可提供給RSS閱讀器作為源使用。也可以通過Change file name來自定義URL。

自此整個生成RSS源的過程就完成了

侷限

最大的侷限性在開頭就說過,搜狗微信的來源僅能使用最新文章,很明顯,這樣的方法可能只適用於一天或者更長時間才發一次推播,且一次推播僅有一篇文章的情況。

此外,若仔細看HTML中提取的{%1}欄位,可以發現這個網址和普通的網址並不一樣,也並非mp.weixin.qq.com域名。網友也指出這個所提取的網址是有時效性,需要轉換,以及直接使用其前半部分需要驗證碼等問題。目前我所使用的閱讀器可以使用載入網頁在瀏覽器中使用完整的網址用於跳轉,這樣應當是模擬了使用者點選連結後的操作,大概吧(我沒學過HTML,基直覺理解如有錯誤還請指出)。

總而言之,本文的方法只能聊勝於無,真正要看內容需要多一級瀏覽器的跳轉,而搜狗微信什麼時候會不會又有什麼其他操作也不好說。且用且看吧。不管怎麼說,對於深惡痛絕微信的我來說,也算一個聊勝於無的方法,至少掃一眼標題也能看個大概了。

這篇文章也是輸出了一些情緒,實在是對大而醜多年來的不滿。