§5 更新過程
C1 更新過程
1)更新過程
:時間到達間隔X(t)獨立同分佈(F)的計數過程N(t)
- 避免平凡情形,令P{Xn=0}<1,記Sn=i=1∑nXi,則N(t)=max{n∣Sn≤t}
- 以概率1有N(t)<∞
2)分佈:P{N(t)=n}=P{N(t)≥n}−P{N(t)≥n+1}=P{Sn≤t}−P{Sn+1≤t},而Sn的分佈即F的n重折積Fn
3)更新函數
:m(t)=EN(t)=n=1∑∞P{N(t)≥n}=n=1∑∞P{Sn≤t}=n=1∑∞Fn(t)
-
以概率1有m(t)<∞
-
m(t)=∫0∞E[N(t)∣X1=x]f(x)dx=F(t)+∫0tm(t−x)f(x)dx
均勻到達:F=U(0,1):m(t)=et−1,t∈[0,1]
-
近似計算方法:mn=1−Ee−λXk=1∑n−1(1+mr−k)E[Xke−λX](λk/k!)+Ee−λX,λ=tn,n→∞limmn=m(t)
C2 極限定理
1)定理:P{t→∞limtN(t)=μ1}=1。即期望每μ個時間單位發生一次更新
假設n個玩家單局獲勝率爲Pi,當某玩家連勝時結束比賽,求期望結束時間和連勝率
- 對於單個玩家,連勝期望次數爲ENi=1−PikPik(1−Pi),則其獲勝速率爲vi=ENi1,獲勝率j∑vjvi
- 期望遊戲時間爲i∑vi1
2)基本更新定理:P{t→∞limtm(t)=μ1}=1
3)更新過程的中心極限定理:t→∞limP{tσ2/μ3N(t)−t/μ<x}=2π1∫−∞xe−x2/2dx
- tN(t)⇝N(μ1,μ3σ2)
4)檢驗悖論:包含時刻t的更新間隔XN(t)+1=A(t)+Y(t)的期望長度大於X
-
s→∞lims∫0sXN(t)+1dt=EXEX2
註記:需要C3-2)的引理
-
使用交替更新過程確定XN(t)+1>s的長程時間比例爲EX∫c∞xf(x)dx
C3 更新報酬過程
1)更新報酬過程
:在第n次更新時獲取報酬Rn,則R(t)=n=1∑N(t)Rn
2)期望:若ER,EX有限則以概率1t→∞limtR(t)=t→∞limtER(t)=EXER
-
若報酬是在更新過程中逐步獲取的,該式仍然成立
更新的平均年齡
:最後一次更新到現在的時間A(t)=t−SN(t)
有s→∞lims∫0sA(t)dt⇝2EXEX2
更新的超額壽命
:下次更新到現在的時間Y(t)=SN(t)+1−t
有s→∞lims∫0sY(t)dt⇝2EXEX2
C4 再生過程
1)再生過程
:隨機過程週期性地從一些「再生點」開始執行
e.g. 常返Markov鏈每次回到某狀態可視爲一次再生
2)命題:Pi=ET∫0T(X(t)=i?1:0)dt
3)交替更新過程:在兩個狀態開、閉間轉換,在開態維持Zn,閉態維持Yn
C5 半Markov過程
1)半Markov過程
:在狀態{1,…,N}間轉移,並在每個狀態停留μi時間
2)長程比例:Pi=j∑πjμjπiμi,π是嵌入鏈極限概率
若到達間隔滿足P{X=i}=pi,則包含時刻t的區間長度L(t)具有極限概率Pi=j∑jpjipi
C6 模型應用
1)保險破產模型:理賠過程是更新報酬過程i=1∑N(t)Yi,公司初始資金爲x,並以常數速率c收取保費
- 破產率:R(x)=P{∃t≥0:i=1∑M(t)Yi>x+ct}=E(cλμ)N(x)+1,cλμ<1
- 其中N(x)是一個更新間隔滿足f(x)=μFˉY(x)的更新過程