#include <stdio.h>
int main(void)
{
printf("hello world\n");
return 0;
}
Hello程式
hello程式作為C語言最經典的程式,雖然在實現上非常簡單,無非就是在顯示器上列印 " hello world " 幾個字元,但是卻需要計算機上幾乎所有硬體裝置以及作業系統、系統軟體協同工作才能執行起來。
近幾年來,在軟體工程師(特別是C語言工程師)的面試過程中,對於 「 hello程式是如何執行起來的 」 之類 的面試題不斷出現,由此,在這篇博文上將」對hello程式從誕生到死亡的各個階段發生了什麼,以及計算機是如何執行該程式進行詳解。
博文共分為五個部分,講述了hello程式的一生,分別為:孕育、出生、實現 「 碼 」生價值、休眠、死亡。
從我們開始構思hello程式的功能開始,hello程式小生命的光輝一生便已開啟,直到確定hello程式的功能是在顯示器上顯示 " hello world "這句話時,就像一顆受精卵 ( Idea ) 在溫床上著陸。
此時我們開啟一個編輯器(類似Linux作業系統上的vim編輯器),將手放在鍵盤上,開始敲擊鍵盤,按下腦子裡所想的字元,直到程式碼完成,生成hello.c檔案,此刻hello程式小生命的模樣被勾勒完成,等待出生。
在這些過程中值得思考的是,我們寫的hello.c程式碼檔案(一般稱為原始檔)究竟是什麼東西?計算機在這個過程中又做了哪些事情?
首先,我們寫的hello.c程式碼檔案(一般稱為原始檔)究竟是什麼東西?其實,我們寫的原始檔是一系列由0和1組成的位序列,8個位為一組,被稱之為位元組,而每個位元組就是原始檔上的每個字元,這些字元是由ASCII碼錶示的字元。因此,原始檔被稱之為文字檔案,與之相對應的是二進位制檔案,文字檔案與二進位制檔案的區別在於文字檔案只能存放char型字元變數,而二進位制檔案能夠存放char/int/float/double等等的資料。
其次,計算機在這個過程中又做了哪些事情呢?為使大家能夠更加清晰的理解計算機的運作過程,博主繪製瞭如下的計算機硬體系統圖,並依據此圖進行講解。
計算機硬體系統主要由中央處理單元(CPU)、主記憶體儲器(主記憶體)、匯流排、輸入輸出裝置(I/O裝置)組成,各個部分的功能如下:
1、中央處理單元(CPU)
簡稱處理器,它主要用作解釋或執行主記憶體中儲存的指令。而處理器主要分為四個部分,分別是程式計數器(PC)、暫存器、算術/邏輯單元(ALU)、CPU對外匯流排介面。從系統上電開始,程式計數器便會指向主記憶體中的某一條程式指令,處理器會不斷地去處理執行PC指向的程式指令。當程式計數器指向某一條指令時,處理器會讀取該指令,執行該指令表達的動作,然後更新PC,繼續執行新的指令。暫存器是一個小的儲存裝置,是由一些一個字長的暫存器組成。ALU能夠計算新的程式指令地址以及資料。CPU對外匯流排介面是CPU與外界通訊的虛擬媒介,對於 " 介面 " 這個概念,我們可以理解為插頭與插座,CPU對外匯流排介面好比插座,外界的資料流好比插頭,插頭與插座相匹配才能資訊往來。
2、主記憶體儲器(主記憶體)
主記憶體是一個臨時儲存裝置,它的作用是儲存程式指令以及程式處理的資料。它是一個掉電丟失的裝置,當我們使用word等文字編輯器時,在沒有儲存檔案時,檔案裡的資料都會儲存在記憶體中,一旦計算機被斷電,檔案裡的資料將會直接丟失!
3、匯流排
一種電子線管道,用於在計算機各個部分之間傳遞位元組資訊
4、輸入輸出裝置(I/O裝置)
能夠與計算機系統建立連線的裝置,是控制訊號輸入或資訊輸出的媒介。常見的輸入輸出裝置包括滑鼠、鍵盤、顯示器等等。當然,只有輸入輸出裝置是不足以和計算機成功建立連線,每個輸入輸出裝置都需要有一個控制器或介面卡與計算機連線(準確的說是與I/O匯流排進行連線)。
在講解好計算機硬體系統後,我們在計算機硬體系統的基礎上看看我們敲下的字元都去哪了。
在上面這張圖上我們可以看到1和2兩條線路,這兩條線路就是我們敲下的字元以及最後的原始檔的成長路線。首先來看1號線路,在我們敲下某一個字元時,字元隨著鍵盤到達USB控制器,後面便隨著I/O匯流排一路奔向CPU,中途經過的I/O橋是外界資料流與CPU的月老,能夠將兩者牽上紅繩,友好交流,隨後,字元到達CPU對外匯流排介面,並流向暫存器,最終通過系統匯流排、記憶體匯流排到達主記憶體,並隨著一個個字元的輸入,字元會在主記憶體內按次序堆積。直到我們按下 " 儲存檔案 " 鍵,剛剛存放的所有字元便隨著既定好的2號線湧向磁碟,儲存在磁碟的某一塊區域。
至此,hello程式小生命的 " 碼 " 生便來到了轉折點,即將開啟 " 碼 " 生第二階段:出生。
在 " 十月懷胎 " 後,hello程式小生命將會出生,會面臨四大階段:預處理、編譯、組合、連結。這四個階段的目的是為了將高階語言轉換為為機器碼,讓計算機能夠知道hello程式小生命的使命。
前處理器會根據 " # " 這個命令去修改原始檔。hello程式第一行程式碼 " #include <stdio.h> " 告訴前處理器需要在當前位置包含 " stdio.h " 這個標頭檔案的內容,因此,前處理器便查詢該標頭檔案,並將該標頭檔案的內容完整的替換" #include <stdio.h> " 這句話。修改完成的原始檔名變為 " hello.i "。
編譯器將修改過的原始檔進行一次編譯,生成 " hello.s " 檔案,該檔案是一個組合程式檔案。
組合器將組合程式檔案再一次轉換,轉換為計算機能夠看懂的機器碼,機器碼檔案是由0或1組成的檔案,也被稱為可重定向目標檔案,該檔案(hello.o)實質上是一個二進位制檔案。如果我們用文字檔案去檢視該檔案,則看到的將是一堆亂碼。
由於hello程式內使用了printf庫函數,而printf庫函數存放於單獨編譯好了的 " printf.o " 檔案內,我們需要將 " printf.o " 檔案與 " hello.o " 檔案進行合併。整個程式碼需要正常執行還需要啟動程式碼檔案還能正常啟動執行,因此,連結器將 " printf.o " 、" hello.o " 、啟動程式碼檔案進行連結,生成 " hello " 可執行目標檔案,儲存在硬碟裡,該檔案可以被直接載入執行。
經過出生的四大階段,我們的hello程式小生命已經誕生,接下來它將會經歷成長,並實現它的 「碼 」 生價值。
hello程式小生命的一生極其短暫,它的使命在它把 " hello world " 這句話顯示在顯示器上時便完成。下面我們來探索一下它的短暫 " 碼 " 生。
由於在windows的整合環境下啟動hello程式使得hello程式小生命得一生被安排得明明白白,以至於我們無法一步步看清它的成長, 因此這裡以Linux作業系統為例進行講解,shell是Linux作業系統下的命令直譯器,當shell的滑鼠遊標在閃爍時,提示我們輸入命令,我們輸入 " ./hello " 後,shell便會把從鍵盤輸入的 " ./hello " 讀入暫存器,儲存在主記憶體中。具體過程如下圖1號線路。
當我們輸入 " ./hello " 後按下確認鍵,則shell便會執行命令,shell將使用一些指令將硬碟中存放的hello可執行檔案程式指令以及資料複製到主記憶體,為最終使命做準備。具體過程如下圖2號線路。
當主記憶體中載入了hello程式指令以及資料時,處理器便會開始執行程式指令,最終,處理器將主記憶體中存放的 " hello world\n " 字元複製到暫存器, 在經I/O匯流排流向顯示器,在顯示器中顯示 " hello world " 。具體過程如下圖3號線路。
當程式執行完後,hello程式積攢的能量被釋放完,將進入休眠狀態,它沉睡於硬碟的某個區域,等待喚醒(在shell中輸入 " ./hello ")。當再次被喚醒時,它會再次儲備能量並釋放能量。
當我們將硬碟中的hello程式相關檔案全部刪除時,hello程式小生命的一生在此終結。