PA1

2020-10-04 07:00:13

 

PA1.1

 

 

1.實現用於模擬暫存器的結構體 CPU_state

在 nemu\include\cpu\reg.h 中。

我們都知道,cpu的暫存器是公用記憶體的,所以要用到union(這個我記得網上有答案,所以不講了)

實現後:

2.思考題:在 cmd_c() 函數中, 呼叫 cpu_exec() 的時候傳入了引數 -1 , 你知道這是什麼意思嗎?

cput_exec()在nemu\src\monitor\cpu-exec.c中。我們會發現:

n是無符號整型,-1表示最大的數。所以for 迴圈可以執行最大次數的迴圈,而ecex_wrapper()函數就是執行%eip 指向的當前指令並更新%eip。最終就可以執行完所有指令。

 

3.單步執行 si N

先了解這三個函數的用途readline(),strtok(),sscanf()。

在nemu\src\monitor\debug\ui.c中。

可以知道是用 readline 讀取我們輸入的命令之後,用 strtok()分解第一個字串(以空格分開),然後與cmd_table[]中的 name 比較,執行對應的函數。

在cmd_table中新增si;在單步執行的函數中,應當再用strtok()分解一次字元,然後用sscanf轉化為數位,執行相應的次數。

4.列印暫存器

和1.3類似,printf出暫存器。

regsl[i],32 位暫存器的名字,regsw[i],16 位,regsb[i],8 位。

在前面的暫存器的結構體 CPU_state中我們可以知道cpu.gpr[i]._32放了32位元暫存器的值,16位元8位元類似。

5.掃描記憶體

講義前面提到過:記憶體通過在 nemu\src\memory\memory.c 中定義的大陣列 pmem 來模擬. 在客戶程式執行的過程中, 總是使用 vaddr_read() 和 vaddr_write() 存取模擬的記憶體. vaddr, paddr分別代表虛擬地址和實體地址. 

vaddr_read 函數呼叫 paddr_read,傳入兩個引數:起始地址,掃描長度。所以我們通過 strtok 分別獲得字串型的地址和掃描長度,用 sscanf 轉換為要求的形式,呼叫 vaddr_read 函數掃描記憶體。

PA1.2

1首先需要我們瞭解一下正規表示式。

2然後我們要去為token新增規則。

需要新增空格 == ( ) * / + - != && || ! 十六進位制 十進位制 暫存器 變數等16種規則。瞭解正規表示式之後我們知道+*/|都需要跳脫,因為正規表示式元字元的存在。前三個需要跳脫兩次,一次跳脫\,\再跳脫+*/。有的例如(可以直接用ascii碼,有的例如||需要在enum中賦值。十進位制十六進位制暫存器變數的形式用正規表示式表示,舉個小例子:{"\\$[a-dA- D][hlHL]|\\$[eE]?(ax|dx|cx|bx|bp|si|di|sp)",TK_register}是暫存器。{"\\|\\|",TK_logical_OR}是||。注意:要將!=放在!前面,防止被識別為!和=。

3接下來我們要完善make_token()函數。

函數目的是為了識別出表示式中的每一個token。在for迴圈中,用regexec()函數匹配目標文字串和前面定義的rules[i]中的正規表示式比較,pmatch.rm_so==0表示匹配串在目標串中的第一個位置,pmatch.rm_eo表示結束位置,position和substr_len表示讀取完後的位置和讀取長度。成功識別得到該字元或者字串的對應規則後,我們需要用switch語句將表示式中每一個部分用對應的數位表示type,將==、十進位制數等複製到tokens[nr_token].str中,會用到strcpy或者strncpy函數。

4檢查左右括號是否匹配。

我的思路是,在check_parentheses() 函數中,設定了兩個變數left=0,flag=0,若tokens[p]為左括號,則判斷從tokens[p+1]到tokens[q]。遇到了左括號則left++;遇到右括號則left--,且判斷left是否等於0且當前位置是否到了末尾,若left為0且當前位置不在末位,flag賦值1,說明兩側括號不匹配,若left小於0則assert(0),因為說明出現了講義中提到的類似(4+3))*((2+1)的情況。最後若(left==0)&&(tokens[q]為) )&&flag!=1,即該表示式僅有一對括號,位於兩端,互相匹配,則返回1;若left!=0則assert(0),說明可能出現了不匹配的括號;其他情況都返回0;

5尋找dominant operator。

可以在rules中再設定一個變數用來記錄運運算元優先順序。思路是,不考慮十進位制十六進位制暫存器和非,將op值設為起始位置(若表示式為!2,則返回op為!的位置),然後判斷當前位置的運運算元,(若遇到左括號,用r來記錄括號的對數,然後從左右括號包含的範圍之後的一位再判斷運運算元優先順序,跳過括號內的運運算元),與op位置的運運算元比較優先順序,優先順序小於等於op位置,則op=當前位置。其中,-和*需要再判斷它是否是第一個位置或者前面一位是否為符號,右括號除外,為了避免將指標與乘和減號與負號錯認。

6完善求值函數eval()。

eval(p,q)函數大體上就是先判斷表示式的首尾地址是否合理,不合理assert(0);

再判斷pq是否相等,若相等,它要麼是十進位制或十六進位制或暫存器,若是暫存器,利用regsl等函數判斷出它是32位元或16位元,並判斷出位置是第幾個,然後求值。8位元暫存器一個個判斷。不管如何,它最終必然是一個數值並返回該值;

然後運用check_parentheses函數判斷該表示式是否被一對匹配的括號包圍著,若是則遞迴求值括號包圍的那個表示式。

若以上判斷都是否,則用find_dominant_operator函數找出最後一步執行的運運算元所在位置op,而後遞迴呼叫eval函數,求出op左右兩端表示式的值val1,val2,再根據op的運運算元進行對應的操作並返回結果。判斷*,要麼是*0x100000 要麼是*(0x10000+4)兩種情況,進行判斷,然後用eval得到整數,用vaddr_read()讀取記憶體。判斷負號,負號是不會被視作op的,所以它只能最後被分解為最小的表示式,例如3--2,最後會eval(2,3),即-2。判斷!,要麼是!2要麼是!(1-1)這兩種情況,進行判斷。剩餘幾個判斷不說了。

PA1.3

1監視點的結構體

在原有的基礎上結構體還要加上新值、舊值、型別(判斷是斷點or監視點)、是否開啟、監視的表示式。

2實現監視點池的管理

new_wp是從free連結串列中取一個結點給head連結串列,且將表示式、值賦給它,修改開關,並輸出該節點的編號。運用正規表示式判斷是否為斷點,若是則type為b,否則為w。

正規表示式的使用可以仿照這個來https://www.jb51.net/article/119725.htm

free_wp函數是遍歷head連結串列直到找出對應NO的結點,從head中刪除,新增到free連結串列中。同時修改型別、表示式、值、開關。

3實現監視點

如講義中所言,每當cpu_exec()執行完一條指令,呼叫函數judge_wp對所有表示式求值判斷是否變化,若變化則返回-1,暫停,輸出提示並返回。在cpu_exec.c中修改,並且需要宣告judge_wp()函數。其中的judge_wp()函數在watchpoint.c中寫。

使用info w來列印監視點資訊。這裡在cmd_info中呼叫了函數print_wp()。

刪除監視點。在cmd_d中呼叫free_wp函數即可。

4斷點

就是2所說的,運用正規表示式判斷是否為斷點格式:$eip==0x16進位制數位,regcomp()函數編譯正規表示式,執行成功返回0,則type為b,否則為w。

5

find . -name "*[.h|.cpp]" | xargs wc -l   可用於計算.c .h檔案有多少行。

find . -name "*[.cpp| .h]" | xargs grep "^."| wc -l 用於計算.c .h檔案除去空格有多少行。