應用隨機過程 $5 更新過程

2020-08-11 20:35:45

§5 更新過程

C1 更新過程

1)更新過程:時間到達間隔X(t)X(t)獨立同分佈(FF)的計數過程N(t)N(t)

  • 避免平凡情形,令P{Xn=0}<1P\{X_n=0\}<1,記Sn=i=1nXiS_n=\sum\limits_{i=1}^nX_i,則N(t)=max{nSnt}N(t) = \max\{n|S_n\le t\}
  • 以概率1有N(t)<N(t)<\infin

2)分佈:P{N(t)=n}=P{N(t)n}P{N(t)n+1}=P{Snt}P{Sn+1t}P\{N(t) = n\} = P\{N(t)\ge n\}-P\{N(t)\ge n+1\}=P\{S_n\le t\}-P\{S_{n+1}\le t\},而SnS_n的分佈即FFnn重折積FnF_n

3)更新函數m(t)=EN(t)=n=1P{N(t)n}=n=1P{Snt}=n=1Fn(t)m(t)=EN(t)=\sum\limits_{n=1}^\infin P\{N(t)\ge n\}=\sum\limits_{n=1}^\infin P\{S_n\le t\}=\sum\limits_{n=1}^\infin F_n(t)

  • 以概率1有m(t)<m(t)\lt \infin

  • m(t)=0E[N(t)X1=x]f(x)dx=F(t)+0tm(tx)f(x)dxm(t) = \int^\infin_0 E[N(t)|X_1=x]f(x)\mathrm{d}x=F(t)+\int_0^tm(t-x)f(x)\mathrm{d}x

    均勻到達:F=U(0,1):m(t)=et1,t[0,1]F = U(0,1):m(t) = e^t -1,t\in[0,1]

  • 近似計算方法:mn=k=1n1(1+mrk)E[XkeλX](λk/k!)+EeλX1EeλX,λ=nt,limnmn=m(t)m_n = \frac{\sum\limits_{k=1}^{n-1}(1+m_{r-k})E[X^ke^{-\lambda X}](\lambda^k/k!)+Ee^{-\lambda X}}{1-Ee^{-\lambda X}},\lambda=\frac{n}{t},\lim\limits_{n\to\infin}m_n=m(t)

C2 極限定理

1)定理P{limtN(t)t=1μ}=1P\{\lim\limits_{t\to \infin} \frac{N(t)}{t} =\frac{1}{\mu} \} = 1。即期望每μ\mu個時間單位發生一次更新

假設n個玩家單局獲勝率爲PiP_i,當某玩家連勝時結束比賽,求期望結束時間和連勝率

  • 對於單個玩家,連勝期望次數爲ENi=Pik(1Pi)1PikEN_i = \frac{P_i^k(1-P_i)}{1-P_i^k},則其獲勝速率爲vi=1ENiv_i =\frac1{EN_i},獲勝率vijvj\frac{v_i}{\sum\limits_j v_j}
  • 期望遊戲時間爲1ivi\frac{1}{\sum\limits_i v_i}

2)基本更新定理P{limtm(t)t=1μ}=1P\{\lim\limits_{t\to \infin} \frac{m(t)}{t} =\frac{1}{\mu} \} = 1

  • 隨機變數以概率1收斂到E,其期望也不一定是E

  • 證明:

    • 停時:對於隨機變數序列XiX_i,若隨機變數NN滿足P{N=n}P\{N=n\}獨立於Xi,i>nX_i,i\gt n有關,則NN稱停時

      如:N(t)+1=nN(t)+1 = n只依賴於X1,,XnX_1,\dots,X_n

    • 瓦爾德方程XiX_i獨立同分佈,EXEX有限,NN爲停時且ENEN有限,則Ei=1NXi=ENEXE\sum\limits_{i=1}^NX_i=ENEX

      ESN(t)+1=μ(m(t)+1)ES_{N(t)+1} = \mu(m(t)+1)

    • 證明過程:

      ESN(t)+1=t+Δt=μ(m(t)+1)ES_{N(t)+1} = t+\Delta t = \mu(m(t)+1)

      m(t)t1μ=Δtμt1t1t\frac{m(t)}{t}-\frac{1}{\mu}=\frac{\Delta t}{\mu t}-\frac{1}{t}\ge\frac{1}{t}

      P{Xi<M}=1P\{X_i<M\}=1,得m(t)t1μ=Δtμt1tMμt+1t\frac{m(t)}{t}-\frac{1}{\mu}=\frac{\Delta t}{\mu t}-\frac{1}{t}\le\frac{M}{\mu t}+\frac{1}{t},夾逼取極限即可得證

      XiX_i無界,令新的更新過程N(t)N'(t)具有更新間隔min{Xi,M}\min\{X_i,M\},則m(t)tm(t)t1μ\frac{m(t)}{t}\le\frac{m'(t)}{t} \to \frac{1}{\mu}

      • 其中Δt\Delta t稱爲超額時間,若可確定超額時間則可確定更新函數
  • 推論:在時刻tt發生更新的概率趨於1μ\frac{1}{\mu}

3)更新過程的中心極限定理limtP{N(t)t/μtσ2/μ3<x}=12πxex2/2dx\lim\limits_{t\to \infin}P\{\frac{N(t)-t/\mu}{\sqrt{t\sigma^2/\mu^3}}<x\}=\frac{1}{\sqrt{2\pi}}\int^x_{-\infin}e^{-x^2/2}\mathrm{d}x

  • N(t)tN(1μ,σ2μ3)\frac{N(t)}{t}\rightsquigarrow N(\frac{1}{\mu},\frac{\sigma^2}{\mu^3})

4)檢驗悖論:包含時刻tt的更新間隔XN(t)+1=A(t)+Y(t)X_{N(t)+1}=A(t)+Y(t)的期望長度大於XX

  • lims0sXN(t)+1dts=EX2EX\lim\limits_{s\to\infin}\frac{\int_0^s X_{N(t)+1}\mathrm{d}t}{s}=\frac{EX^2}{EX}

    註記:需要C3-2)的引理

  • 使用交替更新過程確定XN(t)+1>sX_{N(t)+1}>s的長程時間比例爲cxf(x)dxEX\frac{\int_c^\infin xf(x)\mathrm{d} x}{EX}

C3 更新報酬過程

1)更新報酬過程:在第nn次更新時獲取報酬RnR_n,則R(t)=n=1N(t)RnR(t) = \sum\limits_{n=1}^{N(t)}R_n

2)期望:若ER,EXER,EX有限則以概率1limtR(t)t=limtER(t)t=EREX\lim\limits_{t\to\infin}\frac{R(t)}{t}=\lim\limits_{t\to\infin}\frac{ER(t)}{t}=\frac{ER}{EX}

  • 若報酬是在更新過程中逐步獲取的,該式仍然成立

    更新的平均年齡:最後一次更新到現在的時間A(t)=tSN(t)A(t) = t - S_{N(t)}

    lims0sA(t)dtsEX22EX\lim\limits_{s\to\infin}\frac{\int_0^sA(t)\mathrm{d}t}{s}\rightsquigarrow\frac{EX^2}{2EX}

    更新的超額壽命:下次更新到現在的時間Y(t)=SN(t)+1tY(t) = S_{N(t)+1}-t

    lims0sY(t)dtsEX22EX\lim\limits_{s\to\infin}\frac{\int_0^sY(t)\mathrm{d}t}{s}\rightsquigarrow\frac{EX^2}{2EX}

C4 再生過程

1)再生過程:隨機過程週期性地從一些「再生點」開始執行

e.g. 常返Markov鏈每次回到某狀態可視爲一次再生

2)命題:Pi=0T(X(t)=i?1:0)dtETP_i=\frac{\int_0^T (X(t)=i?1:0)\mathrm{d}t}{ET}

3)交替更新過程:在兩個狀態開、閉間轉換,在開態維持ZnZ_n,閉態維持YnY_n

  • PY=EYEY+EZ;PZ=EZEY+EZP_Y = \frac{EY}{EY+EZ};P_Z = \frac{EZ}{EY+EZ}

    更新過程年齡比例:早於c的年齡比例爲:Emin{X,c}ET=01F(x)dxEX\frac{E\min\{X,c\}}{ET}=\frac{\int_0^\infin1-F(x)\mathrm{d}x}{EX}

C5 半Markov過程

1)半Markov過程:在狀態{1,,N}\{1,\dots,N\}間轉移,並在每個狀態停留μi\mu_i時間

2)長程比例:Pi=πiμijπjμjP_i = \frac{\pi_i\mu_i}{\sum\limits_j \pi_j\mu_j}π\pi是嵌入鏈極限概率

若到達間隔滿足P{X=i}=piP\{X = i\}=p_i,則包含時刻tt的區間長度L(t)L(t)具有極限概率Pi=ipijjpjP_i=\frac{ip_i}{\sum\limits_jjp_j}

C6 模型應用

1)保險破產模型:理賠過程是更新報酬過程i=1N(t)Yi\sum\limits_{i=1}^{N(t)}Y_i,公司初始資金爲xx,並以常數速率cc收取保費

  • 破產率:R(x)=P{t0:i=1M(t)Yi>x+ct}=E(λμc)N(x)+1,λμc<1R(x) = P\{\exist t\ge 0:\sum\limits_{i=1}^{M(t)}Y_i\gt x+ct\}=E(\frac{\lambda\mu}{c})^{N(x)+1},\frac{\lambda\mu}{c}<1
  • 其中N(x)N(x)是一個更新間隔滿足f(x)=FˉY(x)μf(x) = \frac{\bar F_Y(x)}{\mu}的更新過程