論文解讀(RvNN)《Rumor Detection on Twitter with Tree-structured Recursive Neural Networks》

2022-09-15 18:00:22

論文資訊

論文標題:Rumor Detection on Twitter with Tree-structured Recursive Neural Networks
論文作者:Jing Ma, Wei Gao, Kam-Fai Wong
論文來源:ACL,2018
論文地址:download 
論文程式碼:download

Abstract

  本文提出了兩種基於自下向上和自上而下的樹狀結構神經網路的遞迴神經模型用於謠言表示學習和分類,自然符合推文的傳播佈局。 

1 Introduction

  Figure 1 舉例說明了兩個謠言傳播樹,一個是假,一個是真。對於結構不敏感的方法,貼文回覆通常有支援或者否定的回答,這種方法基本上依賴於文字中不同態度的比例。同時存在一些推文不是直接回復源推文,而是直接對其祖先進行迴應,表明互動作用具有明顯的區域性特徵。

  

  本文貢獻:

    • 這是第一個基於樹狀結構遞迴神經網路的結構和內容語意,用於檢測微博貼文的謠言;
    • 提出了兩種基於自下而上和自上而下的樹狀結構的 RvNN 模型的變體,通過捕獲結構和紋理屬性來為一個宣告生成更好的整合表示;
    • 基於真實世界的Twitter資料集的實驗在謠言分類和早期檢測任務上都取得了比最先進的基線更好的改進;
Bottom-up tree
   
Top-down tree
    

2 RvNN-based Rumor Detection

  方法的核心思想是通過對樹中不同分支上的傳播結構的遞回來加強樹節點的高階表示。例如,確認或支援一個節點的響應節點(例如,「我同意」,「正確」等)可以進一步加強該節點的立場,而拒絕或質疑回答(例如,「不同意」,真的嗎?!)否則就會削弱它的立場。

2.1 Standard Recursive Neural Networks

  RvNN 是一種樹狀結構的神經網路。RvNN 的原始版本使用了二值化的句子解析樹,其中與解析樹的每個節點相關聯的表示是從其直接子節點計算出來的。標準 RvNN 的整體結構如 Figure 2 的右側所示,對應於左側的輸入解析樹。

  

  葉節點是一個輸入句子中的單詞,每個單詞都由一個低維的單詞嵌入來表示。非葉節點是句子的組成部分,通過基於子節點的表示進行遞迴計算。假設 $p$ 是用有兩個子節點  $c_{1}$  和 $c_{2}$ 的父節點 特徵向量,且可以通過子節點特徵向量計算 $p=f\left(W \cdot\left[c_{1} ; c_{2}\right]+b\right)$,其中 $f(\cdot) $ 代表著啟用函數。

  這個計算是在所有樹節點上遞迴完成的;學習到的節點的隱藏向量可以用於各種分類任務。

2.2 Bottom-up RvNN

  自底向上模型的核心思想是通過遞迴地存取從底部的葉子到頂部的根節點的每個節點,為每個子樹生成一個特徵向量。通過這種方式,具有類似上下文的子樹,例如那些具有拒絕父樹和一組支援性子樹的子樹,將被投影到表示空間中的鄰近區域。因此,這些區域性謠言指示特徵沿著不同的分支聚整合整個樹的一些全域性表示。

  原始的 RvNN 的節點表示是用 tf-didf 值初始化的,本文兩個變體的節點特徵的是向量,如下 Figure 3 所示。
  

  在本文中,選擇擴充套件 GRU 作為隱藏單元來建模樹節點上的長距離互動作用,因為它由於引數更少,效率更高。設 $S (j)$ 表示節點 $j$ 的直接子節點的集合。自底向上模型中節點 $j$ 的過渡方程公式如下:

    $\begin{aligned}\tilde{x}_{j} &=x_{j} E \\h_{\mathcal{S}} &=\sum\limits _{s \in \mathcal{S}(j)} h_{s} \\r_{j} &=\sigma\left(W_{r} \tilde{x}_{j}+U_{r} h_{\mathcal{S}}\right) \\z_{j} &=\sigma\left(W_{z} \tilde{x}_{j}+U_{z} h_{\mathcal{S}}\right) \\\tilde{h}_{j} &=\tanh \left(W_{h} \tilde{x}_{j}+U_{h}\left(h_{\mathcal{S}} \odot r_{j}\right)\right) \\h_{j} &=\left(1-z_{j}\right) \odot h_{\mathcal{S}}+z_{j} \odot \tilde{h}_{j}\end{aligned}$
  其中:
    • $x_{j}$ 是節點 $j$ 的原始輸入向量;
    • $E$ 表示引數矩陣轉換後輸入;
    • $\tilde{x}_{j}$ 是 $j$ 的轉換後表示;
    • $\left[W_{*}, U_{*}\right]$ 是 GRU 內部的權重連線;
    • $h_{j}$  和 $h_{s}$ 分別指 $j$ 的隱藏狀態及 $s$ 的隱藏狀態;
    • $h_{\mathcal{S}}$ 表示 $j$ 的所有孩子的隱藏狀態的和;
    • 重置門 $r_{j}$ 決定如何將當前輸入 $\tilde{x}_{j}$ 與子節點組合;
    • 更新門 $z_{j}$ 定義有多少子節點的級聯到當前節點;

  標準 GRU 回顧:

  

  經過自下到上的遞迴聚合後,根節點的狀態(即源推文)可以看作是用於監督分類的整個樹的表示。因此,一個輸出層連線到根節點,使用 softmax 函數來預測樹的類:

    $\hat{y}=\operatorname{Softmax}\left(V h_{0}+b\right)  \quad\quad\quad(2)$

  其中,$h_{0}$ 為學習到的根節點隱藏向量;

2.3 Top-down RvNN

   這種自上而下的方法的想法是為每個貼文的傳播路徑生成一個增強的特徵向量,其中指示謠言的特徵沿著路徑上的傳播歷史聚合。言下之意就是當前節點的父節點支援、否定源帖的行為有很大的參考價值。話是這麼說,但是公式沒有體現出來,只是單純的聚合訊息。

  假設節點 $j$ 的隱藏狀態為 $h_{j}$,然後,通過將其父節點 $j$ 的隱藏狀態 $h_{\mathcal{P}(j)}$ 與其自己的輸入向量 $x_{j}$ 相結合,可以計算出節點j的隱藏狀態 $h_{j}$ 。因此,節點 $j$ 的轉移方程可以表示為一個標準的 GRU:

    $\begin{aligned}\tilde{x}_{j} &=x_{j} E \\r_{j} &=\sigma\left(W_{r} \tilde{x}_{j}+U_{r} h_{\mathcal{P}(j)}\right) \\z_{j} &=\sigma\left(W_{z} \tilde{x}_{j}+U_{z} h_{\mathcal{P}(j)}\right) \\\tilde{h}_{j} &=\tanh \left(W_{h} \tilde{x}_{j}+U_{h}\left(h_{\mathcal{P}(j)} \odot r_{j}\right)\right) \\h_{j} &=\left(1-z_{j}\right) \odot h_{\mathcal{P}(j)}+z_{j} \odot \tilde{h}_{j}\end{aligned} \quad\quad\quad(3)$

  因此,我們新增了一個最大池化層,以取所有葉節點上向量的每個維度的最大值。這還可以幫助從所有傳播路徑中捕獲最吸引人的指示性特性。
  基於池化的結果,我們最終在輸出層中使用一個 softmax 函數來預測樹的標籤:

    $\hat{y}=\operatorname{Softmax}\left(\operatorname{Vh} h_{\infty}+b\right) \quad\quad\quad(4)$
  其中,$h_{\infty}$ 是所有葉節點上的池化向量,$V$ 和 $b$ 是輸出層中的引數。

2.4 Model Training

  損失函數如下:

    $L(y, \hat{y})=\sum\limits_{n=1}^{N} \sum\limits _{c=1}^{C}\left(y_{c}-\hat{y}_{c}\right)^{2}+\lambda\|\theta\|_{2}^{2}\quad\quad\quad$

  其中,$y_{c}$ 是真實標籤,$\hat{y}_{c}$ 是一個類的預測概率,$N$ 代表 claim 或者 event 數量。

3 Experiments

Datasets
  Twitter15 and Twitter16
Rumor Classification Performance
  

 

4 Conclusions

  我們提出了一種基於遞迴神經網路的自下而上和自頂向下的樹結構模型,用於推特謠言檢測。遞迴模型的固有特性允許它們使用傳播樹來指導從推文內容中學習表示,例如嵌入隱藏在結構中的各種指示性訊號,以便更好地識別謠言。在兩個公開的推特資料集上的結果表明,與最先進的基線相比,我們的方法在非常大的利潤範圍內提高了謠言檢測效能。

  在我們未來的工作中,我們計劃將其他型別的資訊,如使用者屬性,整合到結構化的神經模型中,以進一步增強表示學習,同時檢測謠言散佈者。我們還計劃通過利用結構資訊來使用無監督模型。