在上一篇部落格《圖資料探勘:網路中的級聯行為》中介紹了用基於決策的模型來對級聯行為進行建模,該模型是基於效用(Utility)的且是是確定性的,主要關注於單個節點如何根據其鄰居的情況來做決策,需要大量和資料相關的先驗資訊。這篇部落格就讓我們來介紹基於概率的傳播模型,這種模型基於對資料的觀測來構建,不過不能對因果性進行建模。
接下來我們介紹一種基於隨機樹的傳染病模型,它是分支過程(branching processes)的一種變種。在這種模型中,一個病人可能接觸\(d\)個其他人,對他們中的每一個都有概率\(q>0\)將其傳染,如下圖所示:
接下來我們來看當\(d\)和\(q\)取何值時,流行病最終會消失(die out),也即滿足
這裡\(p_h\)為在深度\(h\)處存在感染節點的概率(是關於\(q\)和\(d\)的函數)。如果流行病會永遠流行下去,則上述極限應該\(>0\)。
\(p_h\)滿足遞迴式:
這裡\(\left(1-q \cdot p_{h-1}\right)^d\)表示在距離根節點\(h\)深度處沒有感染節點的概率。
接下來我們通過對函數
進行迭代來得到\(\lim _{h \rightarrow \infty} p_h\)。我們從根節點\(x=1\)(因為\(p_1=1\))開始,依次迭代得到\(x_1=f(1), x_2=f(x_1),x_3=f(x_2)\)。事實上,該迭代最終會收斂到不動點\(f(x)=x\),如下圖所示:
這裡\(x\)是在深度\(h-1\)處存在感染節點的概率,\(f(x)\)是在深度為\(h\)處存在感染節點的概率,\(q\)為感染概率,\(d\)為節點的度。
如果我們想要傳染病最終消失,那麼迭代\(f(x)\)的結果必須要趨向於\(0\),也即不動點需要為0。而這也就意味著\(f(x)\)必須要在\(y=x\)下方,如下所示:
如何控制\(f(x)\)必須要在\(y=x\)下方呢?我們先來分析下\(f(x)\)的影象形狀,我們有以下結論:
\(f(x)\)是單調的:對\(0 \leq x, q \leq 1, d>1\),\(f'(x)=q \cdot d(1-q x)^{d-1}>0\),故\(f(x)\)是單調的。
\(f'(x)\)是非增的:\(f'(x)=q \cdot d(1-q x)^{d-1}\)會著\(x\)減小而減小。
而\(f(x)\)低於\(y=x\),則需要滿足
綜上所述,我們有結論:
這裡\(R_0=q\cdot d\)表示每個被感染的個體在期望意義上所產生的新的病體數,我們將其稱為基本再生數(reproductive number),它決定了傳染病病是否會流行:
在病毒的傳播中,有兩個最基本的引數:
網路中的節點可以在以下四個狀態(S+E+I+R)之間做轉移:
狀態轉移圖如下圖所示(圖中的\(Z\)表示人工免疫):
其中狀態轉移的概率由我們前面提到的模型引數\(\beta\)和\(\delta\)控制。
在SIR模型中,節點經歷S-I-R三個階段:
事實上,該模型可用於對水痘和鼠疫的建模,也即一旦我治癒了,那我就永遠不會再被感染了。
假設模型滿足完美混合(即網路是完全圖),則模型的動力方程為:
處於\(S\)、\(I\)、\(R\)狀態的節點數量隨著時間變化曲線如下圖所示:
SIS模型中節點只有S-I兩個階段,它假設已經治癒的節點會立即變為易感節點。節點的狀態轉移圖如下:
這裡我們把\(s=\frac{\beta}{\delta}\)定義為病毒的「力量」(strength)。
該模型可用於對流感的建模,也即已被感染的節點經過治癒後會重新回到易感狀態。
同樣我們假設模型滿足完美混合(即網路是完全圖),則模型的動力方程為:
處於\(S\)、\(I\)狀態的節點數量隨著時間變化曲線如下圖所示:
接下來我們考慮SIS模型中的傳染閾值(epidemic threshold)\(\tau\)。對於\(SIS\)模型而言,流行閾值可以是任意的。
我們設圖\(G\)的傳染閾值為\(\tau\)。如果病毒的「力量」\(s=\frac{\beta}{\delta} < \tau\)(這裡\(\beta\)指病毒的死亡率,\(\delta\)指病毒的出生率),則疾病的流行就不會發生(它最終會消失)。事實上,圖\(G\)的傳染閾值\(\tau\)可以表示為
這裡\(\lambda_{1, A}\)為圖\(G\)的鄰接矩陣最大的特徵值。這個定理看起來非常神奇,因為我們只用\(\lambda_{1,A}\)就捕捉到了整個圖的屬性!
以下是在AS圖上,當\(s\)大於、小於或等於傳染閾值\(\tau\)時的感染節點數量隨時間變化圖:
如果我們再考慮不同的初始感染人數,則會得到以下的感染人數變化影象:
在一個埃博拉的例子[1]中,設定如下的轉換狀態:
當設定\(R_0=1.5\text{-}2.0\)時,總死亡人數隨時間變化如下:
[1] Gomes M F C, y Piontti A P, Rossi L, et al. Assessing the international spreading risk associated with the 2014 West African Ebola outbreak[J]. PLoS currents, 2014, 6.
[2] http://web.stanford.edu/class/cs224w/
[3] Easley D, Kleinberg J. Networks, crowds, and markets: Reasoning about a highly connected world[M]. Cambridge university press, 2010.
[4] Barabási A L. Network science[J]. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 2013, 371(1987): 20120375.