揭開 gcc 編輯器的面貌

2020-10-18 12:01:01

說明:本實驗均在 Ubuntu 64 作業系統下進行的,有關 ubuntu 的安裝請參考:VMware安裝Ubuntu 18.04(必會)

一、可執行程式是如何被組裝的?

①寫三個 .c 檔案並編譯生成靜態庫,並用 ar 連結 main.c 檔案,生成最終的可執行程式,記錄檔案的大小。
②將目標檔案生成動態庫檔案, 然後用 gcc 將連結 main.c 函數生成可執行檔案,記錄檔案的大小,並與之前做對比。

0)引言

gcc 可以將C檔案編譯成可執行檔案,可是追根究底,C檔案是如何被組裝成可執行檔案呢?接下來我們就一起探究一下,相信一定會見到另一番風景。

1)生成靜態庫 .a 靜態庫

第一步:準備4個C語言檔案
建立一個資料夾 test1 用來儲存C檔案,再切換到該檔案工作目錄下。

mkdir test1
cd test1

在這裡插入圖片描述
使用 nano 編輯器,編寫4個C語言檔案。

注:若沒有安裝 nano 編輯器,可以輸入命令:sudo apt install nano 進行安裝。

在這裡插入圖片描述
x2x.c

//加法運算
#include <stdio.h>
void x2x(int x,int y){
	int m = x + y;
	printf("x+y=%d\n",m);
}

x2y.c

//減法運算
#include <stdio.h>
void x2y(int x,int y){
	int m = x + y;
	printf("x-y=%d\n",m);
}

xy.h

#ifndef XY_H
#define XY_H
void x2x(int,int);
void x2y(int,int);
#endif

main.c

#include "xy.h"
int main(){
	x2x(236,524);
	x2y(513,145);
}

第二步:生成 .a 靜態庫檔案
先用 gcc 將三個 .c 檔案編譯為3個 .o 目標檔案。

gcc -c x2x.c x2y.c main.c
ls

在這裡插入圖片描述
可見有個3個 .o 檔案了。
然後將 x2x.o 和 x2y.o 目標檔案用 ar 工具生成1個 .a 靜態庫檔案。

靜態庫:靜態庫檔案命名規範是以 lib 為字首,緊接著跟靜態庫名,擴充套件名為 .a。例如:建立的靜態庫名為 afile ,則靜態庫檔名就是 libafile.a 。

ar -crv libafile.a x2x.o x2y.o
ls

在這裡插入圖片描述
可以看見有了一個 libafile.a 靜態庫檔案了。
第三步:連結靜態庫檔案
用 gcc 將 main 函數的目標檔案(main.o)與此靜態庫檔案(libafile.a)進行連結。
方法一:

gcc -o test main.c -L. -lafile

在這裡插入圖片描述
方法二:

gcc main.c libafile.a -o test

方法三:
先生成 main.o :

gcc -c main.c

再生成可執行檔案:

gcc -o test main.o libafile.a

執行結果:

./test

在這裡插入圖片描述
使用命令 ls -lht 或者 ll 可以檢視資料夾內的所有檔案大小,記下來。

size test

在這裡插入圖片描述
可以看到 test 檔案的大小。

說明:即使刪掉 libafile.a 靜態庫檔案,test 可執行檔案照常執行,說明靜態庫中的公用函數已經連結到 .o 目標檔案中了

2)生成 .so 動態庫

動態庫檔名命名規範和靜態庫一樣,只不過副檔名為 .so 了。例如:動態庫名為 sofile ,則動態庫檔名就是 libsofile.so 。

第一步:生成 .so 動態庫檔案
刪除靜態庫檔案和可執行檔案,只保留目標檔案。

rm -f libafile.a test
ls

在這裡插入圖片描述
由 .o 目標檔案建立動態庫檔案。

gcc -shared -fpic -o libsofile.so x2x.o x2y.o  (-o 不可少)

在這裡插入圖片描述
可以看見,生成了動態庫檔案 libsofile.so 。
第二步:連結動態庫檔案
生成可執行檔案 test 。

gcc main.c libsofile.so -o test

在這裡插入圖片描述
執行它。

./test

在這裡插入圖片描述
阿歐!出錯了!別急,這是因為雖然 main.c 連結的是當前目錄的動態庫,但是執行時,是到 /usr/lib 檔案下找庫檔案,所以將檔案 libsofile.so 複製到目錄 /usr/lib 中就 OK 啦。
首先切換到 root 使用者。

su  (輸入密碼後,敲回車)

注意:若第一次使用 root 使用者,要先啟用,使用命令:sudo passwd root
然後連續輸入兩個密碼即可

在這裡插入圖片描述
移動 .so 動態庫檔案並執行 test 檔案。

mv libsofile.so /usr/lib
exit  (退出 root 使用者)
./test

在這裡插入圖片描述
可以看見終於成功執行了,沒有錯誤!
現在來看一下最終的可執行檔案有多大?
在這裡插入圖片描述
可以看到 test 的大小,與之前用靜態庫連結生成的 test 可執行檔案的大小差不太多。

3)小結

根據以上情況來說,函數庫分為靜態庫和動態庫兩種。靜態庫在程式編譯的時候會連結到目的碼中,但是執行的時候不再需要靜態庫了;動態庫在程式編譯的時候不會被連結到目的碼中,而是程式在執行的時候才會被載入。當動態庫和靜態庫同時存在同一個資料夾中時,gcc 會優先連結動態庫,所以最終的可執行檔案的大小差不了多少,而在程式執行時還是需要動態庫的存在。

二、探究 nasm 組合器與 gcc 編譯的區別

①as 組合編譯器針對的是 AT&T 組合程式碼風格, Intel 風格的組合程式碼則可以用 nasm 組合編譯器編譯生成執行程式。
②在 ubuntu 中下載安裝 nasm ,對範例程式碼「 hello.asm 」編譯生成可執行程式,並與「 hello world 」C 程式碼的編譯生成的程式大小進行對比。

0)引言

GCC(GNU C Compiler)是編譯工具,其背後有多個編輯器和工具,分別介紹如下:

  • addr2line:用來將程式地址轉換成其所對應的程式原始檔及所對應的程式碼行也可以得到所對應的函數。該工具將幫助偵錯程式在偵錯的過程中定位對 應的原始碼位置。
  • as:主要用於組合。
  • ld:主要用於連結。
  • ar:主要用於建立靜態庫。
  • ldd:可以用於檢視一個可執行程式依賴的共用庫。
  • objcopy:將一種物件檔案翻譯成另一種格式,譬如將 .bin 轉換成 .elf 或者將.elf 轉換成.bin 等。
  • objdump:主要的作用是反組合。
  • readelf:顯示有關 ELF 檔案的資訊。
  • size:列出可執行檔案每個部分的尺寸和總尺寸,程式碼段、資料段、總大小 等。

1)用 nasm 組合編輯器編譯 .asm 檔案

第一步:安裝 nasm 組合編譯器。

sudo apt install nasm

在這裡插入圖片描述
第二步:hello.asm 檔案。

nano hello.asm

在這裡插入圖片描述
hello.asm

; hello.asm 
section .data            ; 資料段宣告
        msg db "Hello, world!", 0xA     ; 要輸出的字串
        len equ $ - msg                 ; 字串長度
section .text            ; 程式碼段宣告
global _start            ; 指定入口函數
_start:                  ; 在螢幕上顯示一個字串
        mov edx, len     ; 引數三:字串長度
        mov ecx, msg     ; 引數二:要顯示的字串
        mov ebx, 1       ; 引數一:檔案描述符(stdout) 
        mov eax, 4       ; 系統呼叫號(sys_write) 
        int 0x80         ; 呼叫核心功能
                         ; 退出程式
        mov ebx, 0       ; 引數一:退出程式碼
        mov eax, 1       ; 系統呼叫號(sys_exit) 
        int 0x80         ; 呼叫核心功能

第三步:使用 nasm 編譯
接下來我們就用 nasm 編譯 hello.asm 檔案生成 .o 目標檔案,再用 ld 工具連結生成可執行檔案並執行該檔案。

nasm -felf64 hello.asm  (我們ubuntu是64位元作業系統,如果你的是32位元,則用 -felf)
ld -o hello -e _start hello.o
./hello

在這裡插入圖片描述
檢視 hello 可執行檔案的大小。

size hello

在這裡插入圖片描述
我天,這麼小!比第一部分使用 ar 、gcc 編譯成靜態庫、動態庫,再連結成可執行檔案都要小得多。
我們再來看看有沒有連結動態庫。

ldd hello

在這裡插入圖片描述
可以發現,並沒有連結動態庫。由連結器連結生成的最終檔案為 ELF 格式的可執行檔案,一個 ELF 可執行檔案通常被連結為不同的段,常見的段譬如 .text 、.data 、.rodata 、.bss等段。若有興趣深入瞭解 ELF 檔案,可以閱讀:ELF 檔案格式的詳解
asm 檔案生成的可執行檔案為什麼這麼小呢?如果有興趣深入學習,可以參考:建立超小的ELF可執行檔案(真是變態)

2)用 gcc 編譯 .c 檔案

第一步:新建一個 helloworld.c 檔案。

nano helloworld.c

在這裡插入圖片描述
helloworld.c

#include <stdio.h>
int main(void){
	printf("Hello World!\n");
	return 0;
}

第二步:預處理

問題:預處理都在做什麼內容呢?

  1. 將所有的#define 刪除,並且展開所有的宏定義,並且處理所有的條件預編 譯指令,比如#if #ifdef #elif #else #endif 等。
  2. 處理#include 預編譯指令,將被包含的檔案插入到該預編譯指令的位置。
  3. 刪除所有註釋「//」和「/* */」。
  4. 新增行號和檔案標識,以便編譯時產生偵錯用的行號及編譯錯誤警告行號。
  5. 保留所有的#pragma 編譯器指令,後續編譯過程需要使用它們。

接下來就來開始使用預處理命令:

gcc -E helloworld.c -o helloworld.i

在這裡插入圖片描述
該 .i 檔案可以開啟看。

第三步:編譯

編譯過程就是對預處理完的檔案進行一系列的詞法分析,語法分析,語意分析及 優化後生成相應的組合程式碼。

使用編譯命令:

gcc -S helloworld.i -o helloworld.s

在這裡插入圖片描述
該 .s 檔案可以開啟看,是組合語言。

第四步:組合

組合過程呼叫對組合程式碼進行處理,生成處理器能識別的指令,儲存在字尾為.o 的目標檔案中。

使用組合命令:

gcc -c helloworld.s -o hello.o

或者

as -c helloworld.s -o hello.o

在這裡插入圖片描述
第五步:連結

將 .o 檔案連結生成可執行檔案,並執行程式。

gcc helloworld.o -o helloworld
./helloworld

注:該連結語句預設連結動態庫,如果要連結靜態庫,使用命令:gcc -static helloworld.c -o helloworld

在這裡插入圖片描述
看一下檔案大小

size helloworld

在這裡插入圖片描述
相比於 nasm 編譯 .asm 檔案,gcc 編譯連結生成的可執行檔案要大得多。
再看看有沒有連結動態庫檔案。

ldd helloworld

在這裡插入圖片描述
可以發現有連結動態庫檔案。
再來試試用 gcc 將靜態庫加入到可執行檔案中去。

gcc -static helloworld.c -o helloworld  (連結)
./helloworld  (執行程式)
sieze helloworld  (檢視檔案大小)
ldd helloworld  (檢視連結庫檔案情況)

在這裡插入圖片描述
可以發現大得多了!!!並沒有連結動態庫檔案。

3)小結

用 nasm 組合 Intel 風格的組合程式碼,再連結成可執行檔案,可以發現檔案是極小的,而用 gcc 連結到動態庫是比較大的,更突然的是將靜態庫檔案加入的最終的可執行檔案是大得多的,這也是合理的,畢竟將那麼多庫檔案加入到最終的可執行檔案。

三、瞭解程式如何藉助第三方庫函數

0)引言

每一個程式背後都站著一堆優秀的程式碼庫,瞭解實際程式是如何藉助第三方庫函數的。

1)測試 telnet 協定

TELNET 協定是 Internet 遠端登入服務的標準協定和主要方式,是 TCP/IP 協定族中的一員。有關它的詳細介紹請參考:TELNET協定

接下來就來了解下如何開啟 telnet 協定。

首先,Win10系統下,開啟 「 控制面板 」 後,點選 「 程式 」。

在這裡插入圖片描述
點選 「 啟用或關閉 Windows 功能 」。

在這裡插入圖片描述
勾選上 「 Telent Client 」 功能。
在這裡插入圖片描述
勾選 「 適用於 Linux 的 Windows 子系統 」。(後續要用到)

在這裡插入圖片描述
重新啟動後,即可完成設定。
然後開啟Windows 的 cmd 命令列執行命令:

telnet bbs.newsmth.net

在這裡插入圖片描述
顯示如上,說明 telnet 功能正常,這是一個命令列指令碼的遊戲,使用 telnet 協定遠端存取上了。

2)安裝 curses 庫

在 Ubuntu 系統使用命令列安裝 curses 庫

sudo apt-get install libcourses5-dev

在這裡插入圖片描述
安裝好了後,檢視一下安裝目錄,使用命令:

whereis curses.h
whereis libncurses

在這裡插入圖片描述
可以看見標頭檔案 curses.h 是在目錄:/usr/include 下的,而靜態庫和動態庫都是在目錄:/usr/lib/x86_64-gnu 下的。

3)用 gcc 將 curses 庫連結到 c 檔案中

首先編寫一個貪吃蛇遊戲的 C 檔案,程式碼如下。
snake.c

//mysnake1.0.c
//編譯命令:cc mysnake1.0.c -lcurses -o mysnake1.0
//用方向鍵控制蛇的方向
#include <stdio.h>
#include <stdlib.h>
#include <curses.h>
#include <signal.h>
#include <sys/time.h>
#define NUM 60

struct direct                //用來表示方向的
{
    int cx;
    int cy;
};
typedef struct node            //連結串列的結點
{
    int cx;
    int cy;
    struct node *back;
    struct node *next;
}node;

void initGame();            //初始化遊戲
int setTicker(int);            //設定計時器
void show();                //顯示整個畫面
void showInformation();        //顯示遊戲資訊(前兩行)
void showSnake();            //顯示蛇的身體
void getOrder();            //從鍵盤中獲取命令
void over(int i);            //完成遊戲結束後的提示資訊

void creatLink();                //(帶頭尾結點)雙向連結串列以及它的操作
void insertNode(int x, int y);   
void deleteNode();
void deleteLink();

int ch;                                //輸入的命令
int hour, minute, second;            //時分秒
int length, tTime, level;            //(蛇的)長度,計時器,(遊戲)等級
struct direct dir, food;            //蛇的前進方向,食物的位置
node *head, *tail;                    //連結串列的頭尾結點

int main()
{
    initscr();
    initGame();
    signal(SIGALRM, show);
    getOrder();
    endwin();
    return 0;
}

void initGame()
{
    cbreak();                    //把終端的CBREAK模式開啟
    noecho();                    //關閉回顯
    curs_set(0);                //把遊標置為不可見
    keypad(stdscr, true);        //使用使用者終端的鍵盤上的小鍵盤
    srand(time(0));                //設定亂數種子
    //初始化各項資料
    hour = minute = second = tTime = 0;
    length = 1;
    dir.cx = 1;
    dir.cy = 0;
    ch = 'A';
    food.cx = rand() % COLS;
    food.cy = rand() % (LINES-2) + 2;
    creatLink();
    setTicker(20);
}

//設定計時器(這個函數是書本上的例子,有改動)
int setTicker(int n_msecs)
{
    struct itimerval new_timeset;
    long    n_sec, n_usecs;

    n_sec = n_msecs / 1000 ;
    n_usecs = ( n_msecs % 1000 ) * 1000L ;
    new_timeset.it_interval.tv_sec  = n_sec;        
    new_timeset.it_interval.tv_usec = n_usecs;      
    n_msecs = 1;
    n_sec = n_msecs / 1000 ;
    n_usecs = ( n_msecs % 1000 ) * 1000L ;
    new_timeset.it_value.tv_sec     = n_sec  ;      
    new_timeset.it_value.tv_usec    = n_usecs ;     
    return setitimer(ITIMER_REAL, &new_timeset, NULL);
}

void showInformation()
{
    tTime++;
    if(tTime >= 1000000)                //
        tTime = 0;
    if(1 != tTime % 50)
        return;
    move(0, 3);   
    //顯示時間
    printw("time: %d:%d:%d %c", hour, minute, second);
    second++;
    if(second > NUM)
    {
        second = 0;
        minute++;
    }
    if(minute > NUM)
    {
        minute = 0;
        hour++;
    }
    //顯示長度,等級
    move(1, 0);
    int i;
    for(i=0;i<COLS;i++)
        addstr("-");
    move(0, COLS/2-5);
    printw("length: %d", length);
    move(0, COLS-10);
    level = length / 3 + 1;
    printw("level: %d", level);
}

//蛇的表示是用一個帶頭尾結點的雙向連結串列來表示的,
//蛇的每一次前進,都是在連結串列的頭部增加一個節點,在尾部刪除一個節點
//如果蛇吃了一個食物,那就不用刪除節點了
void showSnake()
{
    if(1 != tTime % (30-level))
        return;
    //判斷蛇的長度有沒有改變
    bool lenChange = false;
    //顯示食物
    move(food.cy, food.cx);
    printw("@");
    //如果蛇碰到牆,則遊戲結束
    if((COLS-1==head->next->cx && 1==dir.cx)
        || (0==head->next->cx && -1==dir.cx)
        || (LINES-1==head->next->cy && 1==dir.cy)
        || (2==head->next->cy && -1==dir.cy))
    {
        over(1);
        return;
    }
    //如果蛇頭砬到自己的身體,則遊戲結束
    if('*' == mvinch(head->next->cy+dir.cy, head->next->cx+dir.cx) )
    {
        over(2);
        return;
    }
    insertNode(head->next->cx+dir.cx, head->next->cy+dir.cy);
    //蛇吃了一個「食物」
    if(head->next->cx==food.cx && head->next->cy==food.cy)
    {
        lenChange = true;
        length++;
        //恭喜你,通關了
        if(length >= 50)
        {
            over(3);
            return;
        }
        //重新設定食物的位置
        food.cx = rand() % COLS;
        food.cy = rand() % (LINES-2) + 2;
    }
    if(!lenChange)
    {
        move(tail->back->cy, tail->back->cx);
        printw(" ");
        deleteNode();
    }
    move(head->next->cy, head->next->cx);
    printw("*");
}

void show()
{
    signal(SIGALRM, show);        //設定中斷訊號
    showInformation();
    showSnake();
    refresh();                    //重新整理真實螢幕
}

void getOrder()
{
    //建立一個死迴圈,來讀取來自鍵盤的命令
    while(1)
    {
        ch = getch();
        if(KEY_LEFT == ch)
        {
            dir.cx = -1;
            dir.cy = 0;
        }
        else if(KEY_UP == ch)
        {
            dir.cx = 0;
            dir.cy = -1;
        }
        else if(KEY_RIGHT == ch)
        {
            dir.cx = 1;
            dir.cy = 0;
        }
        else if(KEY_DOWN == ch)
        {
            dir.cx = 0;
            dir.cy = 1;
        }
        setTicker(20);
    }
}

void over(int i)
{
    //顯示結束原因
    move(0, 0);
    int j;
    for(j=0;j<COLS;j++)
        addstr(" ");
    move(0, 2);
    if(1 == i)
        addstr("Crash the wall. Game over");
    else if(2 == i)
        addstr("Crash itself. Game over");
    else if(3 == i)
        addstr("Mission Complete");
    setTicker(0);                //關閉計時器
    deleteLink();                //釋放連結串列的空間
}

//建立一個雙向連結串列
void creatLink()
{
    node *temp = (node *)malloc( sizeof(node) );
    head = (node *)malloc( sizeof(node) );
    tail = (node *)malloc( sizeof(node) );
    temp->cx = 5;
    temp->cy = 10;
    head->back = tail->next = NULL;
    head->next = temp;
    temp->next = tail;
    tail->back = temp;
    temp->back = head;
}

//在連結串列的頭部(非頭結點)插入一個結點
void insertNode(int x, int y)
{
    node *temp = (node *)malloc( sizeof(node) );
    temp->cx = x;
    temp->cy = y;
    temp->next = head->next;
    head->next = temp;
    temp->back = head;
    temp->next->back = temp;
}

//刪除連結串列的(非尾結點的)最後一個結點
void deleteNode()
{
    node *temp = tail->back;
    node *bTemp = temp->back;
    bTemp->next = tail;
    tail->back = bTemp;
    temp->next = temp->back = NULL;
    free(temp);
    temp = NULL;
}

//刪除整個連結串列
void deleteLink()
{
    while(head->next != tail)
        deleteNode();
    head->next = tail->back = NULL;
    free(head);
    free(tail);
}

用 gcc 將 curses 庫連結到可執行檔案 snake 中。

gcc mysnake1.0.c -lcurses -o mysnake1.0

在這裡插入圖片描述
編譯生成了一個可執行檔案 snake 。
在這裡插入圖片描述
執行一下程式。

./snake

在這裡插入圖片描述
在這裡插入圖片描述

4)小結

該部分主要了解一下如何將一個 curses 庫連結到 C 檔案,然後生成可執行檔案。總體來說,gcc 編譯工具集還是十分強大的,專用於 C 語言的各種編譯。

四、參考資料

1、Linux 環境下 C 語言編譯實現貪吃蛇遊戲
2、下面這個是我這篇文章的重要參考資料,有興趣可以閱讀。
連結:https://pan.baidu.com/s/1PrfV1s4QHNQViVCUbCB-iw
提取碼:ukdm