虛擬記憶體的實現需要建立在離散分配的記憶體管理方式的基礎上,實現方法有3種:1、請求分頁儲存管理方式;2、請求分段儲存管理方式;3、段頁式儲存管理方式。不管哪種方式,都需要有一定的硬體支援:1、一定容量的記憶體和外存;2、頁表機制(或段表機制),作為主要的資料結構;3、中斷機構,當使用者程式要存取的部分尚未調入記憶體,則產生中斷;4、地址變換機構,邏輯地址到實體地址的變換。
程式設計師必備介面測試偵錯工具:
本教學操作環境:linux7.3系統、Dell G3電腦。
傳統儲存管理方式同時將多個程序儲存在記憶體中以便允許多道程式設計。它們都具有以下兩個共同的特徵:
- 一次性: 作業必須一次性全部裝入記憶體後,方能開始執行。這會導致兩種情況發生:
1)當作業很大,不能全部被裝入記憶體時,將使該作業無法執行;
2)當大量作業要求執行時,由於記憶體不足以容納所有作業,只能使少數作業先執行,導致多道程式度的下降。- 駐留性: 作業被裝入記憶體後,就一直駐留在記憶體中,其任何部分都不會被換出,直至作業執行結束。執行中的程序,會因等待 I/O 而被阻塞,可能處於長期等待狀態。
因此,許多在程式執行中不用或暫時不用的程式(資料)佔據了大量的記憶體空間,而一些需要執行的作業又無法裝入執行,顯然浪費了寶貴的記憶體資源。
1.1 虛擬記憶體的定義和特徵
基於區域性性原理,在程式裝入時,可以將程式的一部分裝入記憶體,而將其餘部分留在外存,就可以啟動程式執行。在程式執行過程中,當所存取的資訊不在記憶體時,由作業系統將所需要的部分調入記憶體,然後繼續執行程式。另一方面,作業系統將記憶體中暫時不使用的內容換出到外存上,從而騰出空間存放將要調入記憶體的資訊。
這樣,由於系統提供了部分裝入、請求調入和置換功能後(對使用者完全透明),給使用者的感覺是好像存在一個比實際實體記憶體大得多的記憶體,稱為虛擬記憶體。
虛擬記憶體的大小由計算機的地址結構決定,並非是記憶體和外存的簡單相加。
虛擬記憶體有以下三個主要特徵:
1.2 虛擬記憶體技術的實現
虛擬記憶體中,允許將一個作業分多次調入記憶體。
釆用連續分配方式時,會使相當一部分記憶體空間都處於暫時或「永久」的空閒狀態,造成記憶體資源的嚴重浪費,而且也無法從邏輯上擴大記憶體容量。
因此,虛擬記憶體的實現需要建立在離散分配的記憶體管理方式的基礎上。虛擬記憶體的實現有以下三種方式:
不管哪種方式,都需要有一定的硬體支援。一般需要的支援有以下幾個方面:
連續分配方式:指為一個使用者程式分配一個連續的記憶體空間。
- 固定分割區分配:將記憶體空間劃分為若干個固定大小的區域,在每個分割區中只裝入一道作業,便可以有多道作業並行執行。缺乏靈活性,會產生大量的內部碎片,記憶體的利用率很低。
- 動態分割區分配:根據程序的實際需要,動態地為之分配記憶體空間。作業裝入記憶體時,把可用記憶體分出一個連續區域給作業,且分割區的大小正好合適作業大小的需要。會產生很多外部碎片。
離散分配方式:將一個程序分散地裝入到許多不相鄰的分割區中,便可充分地利用記憶體。
分頁儲存的概念:
- 頁面、頁框和塊。程序中的塊稱為頁或頁面(Page),具有頁號;記憶體中的塊稱為頁框(Page Frame,頁框=記憶體塊=物理塊=物理頁面),具有頁框號。外存也以同樣的單位進行劃分,直接稱為塊(Block)。程序在執行時需要申請主記憶體空間,就是要為每個頁面分配主記憶體中的可用頁框,這就產生了頁和頁框的一一對應。各個頁面不必連續存放,可以放到不相鄰的各個頁框中。
- 地址結構:前一部分為頁號P,後一部分為頁內偏移量W。地址長度為32 位,其中0~11位為頁內地址,即每頁大小為4KB;12~31位元為頁號,地址空間最多允許有2^20頁。
- 頁表。為了便於在記憶體中找到程序的每個頁面所對應的物理塊,系統為每個程序建立一張頁表,記錄頁面在記憶體中對應的物理塊號,頁表一般存放在記憶體中。在設定了頁表後,程序執行時,通過查詢該表,即可找到每頁在記憶體中的物理塊號。可見,頁表的作用是實現從頁號到物理塊號的地址對映。
請求分頁是目前最常用的一種實現虛擬記憶體的方法。
請求分頁系統建立在基本分頁系統基礎之上,為了支援虛擬記憶體功能而增加了請求調頁功能和頁面置換功能。
在請求分頁系統中,只要求將當前需要的一部分頁面裝入記憶體,便可以啟動作業執行。
在作業執行過程中,當所要存取的頁面不在記憶體時,再通過調頁功能將其調入,同時還可以通過置換功能將暫時不用的頁面換出到外存上,以便騰出記憶體空間。
為了實現請求分頁,系統必須提供一定的硬體支援。除了需要一定容量的記憶體及外存的計算機系統,還需要有頁表機制、缺頁中斷機構、地址變換機構。
2.1 頁表機制
請求分頁系統的頁表機制不同於基本分頁系統,請求分頁系統在一個作業執行之前不要求全部一次性調入記憶體。
因此在作業的執行過程中,必然會出現要存取的頁面不在記憶體的情況,如何發現和處理這種情況是請求分頁系統必須解決的兩個基本問題。為此,在請求頁表項中增加了四個欄位,分別為:
頁號 | 物理塊號 | 狀態位 P | 存取欄位 A | 修改位 M | 外存地址 |
2.2 缺頁中斷機構
在請求分頁系統中,每當所要存取的頁面不在記憶體時,便產生一個缺頁中斷,請求作業系統將所缺的頁調入記憶體。
此時應將缺頁的程序阻塞(調頁完成喚醒),如果記憶體中有空閒塊,則分配一個塊,將要調入的頁裝入該塊,並修改頁表中相應頁表項;若此時記憶體中沒有空閒塊,則要淘汰某頁(若被淘汰頁在記憶體期間被修改過,則要將其寫回外存)。
缺頁中斷作為中斷同樣要經歷,諸如保護CPU環境、分析中斷原因、轉入缺頁中斷處理程式、恢復CPU環境等幾個步驟。但與一般的中斷相比,它有以下兩個明顯的區別:
2.3 地址變換機構
請求分頁系統中的地址變換機構,是在分頁系統地址變換機構的基礎上,為實現虛擬記憶體,又增加了某些功能而形成的。
在進行地址變換時,先檢索快表:
頁表指出邏輯地址中的頁號與所佔主記憶體物理塊號的對應關係。頁式儲存管理在用動態重定位方式裝入作業時,要利用頁表做地址轉換工作。
快表(TLB,Translation Lookaside Buffer)就是存放在高速緩衝記憶體的部分頁表。作為當前程序頁表的Cache,它的作用與頁表相似,但加快了地址對映速度,提高了存取速率。由於採用頁表做地址轉換,讀寫記憶體資料時CPU要存取兩次主記憶體(查詢頁表、存取目的地址)。
有了快表,有時只要存取一次高速緩衝記憶體,一次主記憶體,這樣可加速查詢並提高指令執行速度。
程序執行時,若其存取的頁面不在記憶體而需將其調入,但記憶體已無空閒空間時,就需要從記憶體中調出一頁程式或資料,送入磁碟的對換區。
選擇調出頁面的演演算法就稱為頁面置換演演算法。好的頁面置換演演算法應有較低的頁面更換頻率,也就是說,應將以後不會再存取或者以後較長時間內不會再存取的頁面先調出。
3.1 最佳置換演演算法(OPT)
最佳(Optimal, OPT)置換演演算法所選擇的被淘汰頁面將是以後永不使用的,或者是在最長時間內不再被存取的頁面,這樣可以保證獲得最低的缺頁率。
但由於人們目前無法預知程序在記憶體下的若千頁面中哪個是未來最長時間內不再被存取的,因而該演演算法無法實現,但最佳置換演演算法可以用來評價其他演演算法。
假定系統為某程序分配了三個物理塊,並考慮有以下頁面號參照串:
7, 0, 1, 2, 0, 3, 0, 4, 2, 3, 0, 3, 2, 1, 2, 0, 1, 7, 0, 1
程序執行時,先將7, 0, 1三個頁面依次裝入記憶體。程序要存取頁面2時,產生缺頁中斷,根據最佳置換演演算法,選擇第18次存取才需調入的頁面7予以淘汰。然後,存取頁面0時,因為已在記憶體中所以不必產生缺頁中斷。存取頁面3時又會根據最佳置換演演算法將頁面1淘汰……依此類推。從圖中可以看出釆用最佳置換演演算法時的情況。
存取頁面 | 7 | 0 | 1 | 2 | 0 | 3 | 0 | 4 | 2 | 3 | 0 | 3 | 2 | 1 | 2 | 0 | 1 | 7 | 0 | 1 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
物理塊1 | 7 | 7 | 7 | 2 | 2 | 2 | 2 | 2 | 7 | |||||||||||
物理塊2 | 0 | 0 | 0 | 0 | 4 | 0 | 0 | 0 | ||||||||||||
物理塊3 | 1 | 1 | 3 | 3 | 3 | 1 | 1 | |||||||||||||
缺頁否 | √ | √ | √ | √ | √ | √ | √ | √ |
可以看到,發生缺頁中斷的次數為9,頁面置換的次數為6。
3.2 先進先出(FIFO)頁面置換演演算法
優先淘汰最早進入記憶體的頁面,亦即在記憶體中駐留時間最久的頁面。
該演演算法實現簡單,只需把調入記憶體的頁面根據先後次序連結成佇列,設定一個指標總指向最早的頁面。但該演演算法與程序實際執行時的規律不適應,因為在程序中,有的頁面經常被存取。
存取頁面 | 7 | 0 | 1 | 2 | 0 | 3 | 0 | 4 | 2 | 3 | 0 | 3 | 2 | 1 | 2 | 0 | 1 | 7 | 0 | 1 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
物理塊1 | 7 | 7 | 7 | 2 | 2 | 2 | 4 | 4 | 4 | 0 | 0 | 0 | 7 | 7 | 7 | |||||
物理塊2 | 0 | 0 | 0 | 3 | 3 | 3 | 2 | 2 | 2 | 1 | 1 | 1 | 0 | 0 | ||||||
物理塊3 | 1 | 1 | 1 | 0 | 0 | 0 | 3 | 3 | 3 | 2 | 2 | 2 | 1 | |||||||
缺頁否 | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ |
利用FIFO演演算法時進行了 12 次頁面置換,比最佳置換演演算法正好多一倍。
FIFO演演算法還會產生當所分配的物理塊數增大而頁故障數不減反增的異常現象,這是由 Belady於1969年發現,故稱為Belady異常,如下表所示。
存取頁面 | 1 | 2 | 3 | 4 | 1 | 2 | 5 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
物理塊1 | 1 | 1 | 1 | 4 | 4 | 4 | 5 | 5 | 5 | |||
物理塊2 | 2 | 2 | 2 | 1 | 1 | 1 | 3 | 3 | ||||
物理塊3 | 3 | 3 | 3 | 2 | 2 | 2 | 4 | |||||
缺頁否 | √ | √ | √ | √ | √ | √ | √ | √ | √ | |||
增加物理塊數後對比 | ||||||||||||
物理塊1* | 1 | 1 | 1 | 1 | 5 | 5 | 5 | 5 | 4 | 4 | ||
物理塊2* | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | 5 | |||
物理塊3* | 3 | 3 | 3 | 3 | 2 | 2 | 2 | 2 | ||||
物理塊4* | 4 | 4 | 4 | 4 | 3 | 3 | 3 | |||||
缺頁否 | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ |
只有FIFO演演算法可能出現Belady異常,而LRU和OPT演演算法永遠不會出現Belady異常。
3.3 最近最久未使用(LRU)置換演演算法
最近最久未使用(LRU,Least Recently Used)置換演演算法選擇最近最長時間未存取過的頁面予以淘汰,它認為過去一段時間內未存取過的頁面,在最近的將來可能也不會被存取。
該演演算法為每個頁面設定一個存取欄位,來記錄頁面自上次被存取以來所經歷的時間,淘汰頁面時選擇現有頁面中值最大的予以淘汰。
存取頁面 | 7 | 0 | 1 | 2 | 0 | 3 | 0 | 4 | 2 | 3 | 0 | 3 | 2 | 1 | 2 | 0 | 1 | 7 | 0 | 1 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
物理塊1 | 7 | 7 | 7 | 2 | 2 | 4 | 4 | 4 | 0 | 1 | 1 | 1 | ||||||||
物理塊2 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 3 | 3 | 0 | 0 | |||||||||
物理塊3 | 1 | 1 | 3 | 3 | 2 | 2 | 2 | 2 | 2 | 7 | ||||||||||
缺頁否 | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ | √ |
LRU效能較好,但需要暫存器和棧的硬體支援,開銷更大。
LRU是堆疊類的演演算法。理論上可以證明,堆疊類演演算法不可能出現Belady異常。FIFO演演算法基於佇列實現,不是堆疊類演演算法。
3.4 時鐘(CLOCK)置換演演算法
LRU演演算法的效能接近於OPT,但是實現起來比較困難,且開銷大;FIFO演演算法實現簡單,但效能差。所以作業系統的設計者嘗試了很多演演算法,試圖用比較小的開銷接近LRU的效能,這類演演算法都是CLOCK演演算法的變體。
簡單的CLOCK演演算法是給每一幀關聯一個附加位,稱為使用位。當某一頁首次裝入主記憶體,以及後續被存取時,使用位被置為1。
對於頁替換演演算法,用於替換的候選幀集合看做一個迴圈緩衝區,並且有一個指標與之相關聯。當某一頁被替換時,該指標被設定成指向緩衝區中的下一幀。
當需要替換一頁時,作業系統掃描緩衝區,以查詢第一個使用位為0的一幀。每當遇到一個使用位為1的幀時,作業系統就將該位重新置為0;如果所有幀的使用位均為1,則指標在緩衝區中完整地迴圈一週,把所有使用位都置為0,並且停留在最初的位置上,替換該幀中的頁。由於該演演算法迴圈地檢查各頁面的情況,故稱為CLOCK演演算法,又稱為最近未用(Not Recently Used, NRU)演演算法。
CLOCK演演算法的效能比較接近LRU,而通過增加使用的位數目,可以使得CLOCK演演算法更加高效。在使用位used的基礎上再增加一個修改位modified,則得到改進型的CLOCK置換演演算法。
每一幀都處於以下四種情況之一:
最近未被存取,也未被修改(u=0, m=0)。
最近被存取,但未被修改(u=1, m=0)。
最近未被存取,但被修改(u=0, m=1)。
最近被存取,被修改(u=1, m=1)。
演演算法執行如下操作步驟:
從指標的當前位置開始,掃描幀緩衝區。在這次掃描過程中,對使用位不做任何修改。選擇遇到的第一個幀(u=0, m=0)用於替換。
如果第1步失敗,則重新掃描,查詢(u=0, m=1)的幀。選擇遇到的第一個這樣的幀用於替換。在這個掃描過程中,對每個跳過的幀,把它的使用位設定成0。
如果第2步失敗,指標將回到它的最初位置,並且集合中所有幀的使用位均為0。重複第1步,並且如果有必要,重複第2步。這樣將可以找到供替換的幀。
改進型的CLOCK演演算法優於簡單CLOCK演演算法之處在於替換時首選沒有變化的頁。由於修改過的頁在被替換之前必須寫回,因而這樣做會節省時間。
4.1 駐留集大小
對於分頁式的虛擬記憶體,在準備執行時,不需要也不可能把一個程序的所有頁都讀取到主記憶體,因此,作業系統必須決定讀取多少頁。也就是說,給特定的程序分配多大的主記憶體空間,這需要考慮以下幾點:
分配給一個程序的儲存量越小,在任何時候駐留在主記憶體中的程序數就越多,從而可以提高處理機的時間利用效率。
如果一個程序在主記憶體中的頁數過少,儘管有區域性性原理,頁錯誤率仍然會相對較高。
如果頁數過多,由於區域性性原理,給特定的程序分配更多的主記憶體空間對該程序的錯誤率沒有明顯的影響。
基於這些因素,現代作業系統通常釆用三種策略:
固定分配區域性置換:它為每個程序分配一定數目的物理塊,在整個執行期間都不改變。若程序在執行中發生缺頁,則只能從該程序在記憶體中的頁面中選出一頁換出,然後再調入需要的頁面。實現這種策略難以確定為每個程序應分配的物理塊數目:太少會頻繁出現缺頁中斷,太多又會使CPU和其他資源利用率下降。
可變分配全域性置換:這是最易於實現的物理塊分配和置換策略,為系統中的每個程序分配一定數目的物理塊,作業系統自身也保持一個空閒物理塊佇列。當某程序發生缺頁時,系統從空閒物理塊佇列中取出一個物理塊分配給該程序,並將欲調入的頁裝入其中。
可變分配區域性置換:它為每個程序分配一定數目的物理塊,當某程序發生缺頁時,只允許從該程序在記憶體的頁面中選出一頁換出,這樣就不會影響其他程序的執行。如果程序在執行中頻繁地缺頁,系統再分配若干物理塊給該程序,直至該程序缺頁率趨於適當程度; 反之,若程序在執行中缺頁率特別低,則可適當減少分配給該程序的物理塊。
4.2 調入頁面的時機
為確定系統將程序執行時所缺的頁面調入記憶體的時機,可釆取以下兩種調頁策略:
預調頁策略:根據區域性性原理,一次調入若干個相鄰的頁可能會比一次調入一頁更高效。但如果調入的一批頁面中大多數都未被存取,則又是低效的。所以就需要釆用以預測為基礎的預調頁策略,將預計在不久之後便會被存取的頁面預先調入記憶體。但目前預調頁的成功率僅約50%。故這種策略主要用於程序的首次調入時,由程式設計師指出應該先調入哪些頁。
請求調頁策略:程序在執行中需要存取的頁面不在記憶體而提出請求,由系統將所需頁面調入記憶體。由這種策略調入的頁一定會被存取,且這種策略比較易於實現,故在目前的虛擬記憶體中大多釆用此策略。它的缺點在於每次只調入一頁,調入調出頁面數多時會花費過多的I/O開銷。
4.3 從何處調入頁面
請求分頁系統中的外存分為兩部分:用於存放檔案的檔案區和用於存放對換頁面的對換區。對換區通常是釆用連續分配方式,而檔案區釆用離散分配方式,故對換區的磁碟I/O速度比檔案區的更快。這樣從何處調入頁面有三種情況:
系統擁有足夠的對換區空間:可以全部從對換區調入所需頁面,以提髙調頁速度。為此,在程序執行前,需將與該程序有關的檔案從檔案區複製到對換區。
系統缺少足夠的對換區空間:凡不會被修改的檔案都直接從檔案區調入(換出時不必寫回)。但對於那些可能被修改的部分,在將它們換出時須調到對換區,以後需要時再從對換區調入。
UNIX方式:與程序有關的檔案都放在檔案區,故未執行過的頁面,都應從檔案區調入。曾經執行過但又被換出的頁面,由於是被放在對換區,因此下次調入時應從對換區調入。程序請求的共用頁面若被其他程序調入記憶體,則無需再從對換區調入。
5.1 頁面抖動(顛簸)
在頁面置換過程中的一種最糟糕的情形是,剛剛換出的頁面馬上又要換入主記憶體,剛剛換入的頁面馬上就要換出主記憶體,這種頻繁的頁面排程行為稱為抖動,或顛簸。如果一個程序在換頁上用的時間多於執行時間,那麼這個程序就在顛簸。
頻繁的發生缺頁中斷(抖動),其主要原因是某個程序頻繁存取的頁面數目高於可用的物理頁幀數目。虛擬記憶體技術可以在記憶體中保留更多的程序以提高系統效率。在穩定狀態,幾乎主記憶體的所有空間都被程序塊佔據,處理機和作業系統可以直接存取到儘可能多的程序。但如果管理不當,處理機的大部分時間都將用於交換塊,即請求調入頁面的操作,而不是執行程序的指令,這就會大大降低系統效率。
5.2 工作集(駐留集)
工作集(或駐留集)是指在某段時間間隔內,程序要存取的頁面集合。經常被使用的頁面需要在工作集中,而長期不被使用的頁面要從工作集中被丟棄。為了防止系統出現抖動現象,需要選擇合適的工作集大小。
工作集模型的原理是:讓作業系統跟蹤每個程序的工作集,併為程序分配大於其工作集的物理塊。如果還有空閒物理塊,則可以再調一個程序到記憶體以增加多道程式數。如果所有工作集之和增加以至於超過了可用物理塊的總數,那麼作業系統會暫停一個程序,將其頁面調出並且將其物理塊分配給其他程序,防止出現抖動現象。
正確選擇工作集的大小,對記憶體的利用率和系統吞吐量的提高,都將產生重要影響。
分頁管理方式和分段管理方式在很多地方相似,比如記憶體中都是不連續的、都有地址變換機構來進行地址對映等。但兩者也存在著許多區別,表3-20列出了分頁管理方式和分段管理方式在各個方面的對比。
分頁 | 分段 | |
---|---|---|
目 的 | 頁是資訊的物理單位,分頁是為實現離散分配方式,以消減記憶體的外零頭,提髙記憶體的利用率。或者說,分頁僅權是由於系統管理的需要而不是使用者的需要 | 是資訊的邏輯單位,它含有一組其意義相對完整的資訊。分段的目的是為了能更好地滿足使用者的需要 |
長 度 | 頁的大小固定且由系統決定,由系統把邏輯地址劃分為頁號和頁內地址兩部分,是由機器硬體實現的,因而在系統中只能有一種大小的頁面 | 段的長度不固定,決定於使用者所編寫的程式, 通常由編譯程式在對流程式進行編譯時,根據資訊的性質來劃分 |
地址空間 | 作業地址空間是一維的,即單一的線性地址空間,程式設計師只需利用一個記憶符,即可表示 一個地址 | 作業地址空間是二維的,程式設計師在標識一個地址時,既需給出段名,又需給出段內地址 |
碎 片 | 有內部碎片,無外部碎片 | 有外部碎片,無內部碎片 |
」共用「和「動態連結」 | 不容易實現 | 容易實現 |
相關推薦:《Linux視訊教學》
以上就是linux使用什麼實現虛擬記憶體的詳細內容,更多請關注TW511.COM其它相關文章!