C語言結構體大小分析

2023-04-05 12:06:15
title: C語言結構體大小分析
author: saopigqwq233
date: 2022-04-05

C語言結構體大小分析

一,基本型別

C語言自帶的資料型別大小如下

資料型別 大小(位元組)
char 1
short 2
int 4
long 4或8
float 4
double 8
long double 16

二,自定義型別---struct

C語言除了以上這些基本型別,還支援使用者自己定義資料型別

類似於一下形式:

struct Student{
    char name[10];//學生姓名
    int age;//學生年齡
};

這裡自定義了一個struct Student 型別的資料型別,包含有字元陣列整形兩種內容。

三,自定義結構體大小分析

1.錯誤示範

如果直接按照結構體內的成員型別相加,那麼如上struct Student型別的大小應該是

10+4=14

似乎沒什麼問題,但是,當我們用以下程式碼做測試時,卻發現出了問題

#include"stdio.h"
#include"stdlib.h"
struct Student{
    char name[10];//學生姓名
    int age;//學生年齡
};
int main()
{
    printf("%d\n",sizeof(struct Student));//測試struct Student大小
    system("pause");
    return 0;
}

執行結果

可以發現,結構體大小並非結構體成員大小簡單相加

為什麼會出現這樣的結果?這是因為C語言中存在一種行為叫結構體記憶體對齊。

2.記憶體對齊

結構體成員在記憶體存放時,編譯器會在結構體成員之間新增填充位元組,以保證結構體成員的對齊要求。

2.1對齊規則

1)結構體第一個成員永遠放在0偏移處

在C語言中,結構體第一個成員的地址和整個結構體的初始地址是相同的,也就是說,結構體的第一個成員始終位於結構體的初始地址處。

可以用以下程式碼證明:

#include"stdio.h"
#include"stdlib.h"
struct student {
    char name[20];
    int age;
    float score;
};
int main()
{
    struct student stu;
    printf("%p\n%p\n",&(stu),&(stu.name));
    system("pause");
    return 0;
}

執行結果如下(不同裝置上執行的數值可能不相同,但是一臺裝置上兩行的資料相同):

可以看到,結構體變數的地址和結構體變數第一個成員的地址是相同的。

2)從第二個成員開始,以後的每個成員的地址距離都要對齊到某個對齊數的整數倍處,這個對齊數是:(成員自身大小和預設對齊數)的較小值

這句話是什麼意思呢,讓我們先看一個例子:

#include"stdio.h"
struct S
{
    char a;
    int b;
    char c;
    long long d;
}s;//建立結構體變數s
int main()
{
    printf("結構體大小:%d\n",sizeof(struct S));
    printf("各個成員的地址:\n");
    printf("%p char a\n",&(s.a));
    printf("%p int b\n",&(s.b));
    printf("%p char c\n",&(s.c));
    printf("%p long long d",&(s.d));
    return 0;
}

執行結果如下:

需要注意的是,%p是以16進位制的格式進行輸出,最後一個long long 型資料d的大小為8位元組,則其結束地址應該是7d057

因此,結構體大小:7d057(16)-7d039(16)=18(16)=24(10)

接下來我們將以excel表格代表記憶體空間,分析每個成員在記憶體的分佈

其中,D列的0到23代表每個地址距離起始地址的偏移量

@1 首先是 char a,已知結構體第一個成員永遠放在0偏移處,且char 只佔1位元組,那麼a在記憶體的分佈暫時是這樣的

@2 接下來是int b,第二個成員要對齊到對齊數的整數倍,也就是說,它的起始地址的偏移量必須是對齊數的整數倍。

對齊數:1)資料型別自身的對齊數:char型資料自身對齊值為1位元組,short型資料為2位元組,int/float型為4位元組,double型為8位元組。

2)預設對齊數:VS2013預設對齊數為8,或#pragma pack (value)時的指定對齊值value。

3)資料成員、結構體的有效對齊數:自身對齊值和指定對齊值中較小者,即有效對齊值=min{自身對齊值,當前指定的pack值}。

*需要注意的是gcc無預設對齊數

由於我使用的是gcc編譯器,則int b的對齊數是其自身對齊值4,如果使用的是Visual Studio這個IDE,那麼其對齊數為min(4,8)=4

因此,編譯器將會在成員char a後再填補3個位元組,使int b對齊,記憶體分佈如下:

@3 接下來是char c,其對齊數是min(1,8)=1,大小是1位元組,那麼,直接接在偏移量為8的地方

@4 最後一個成員是long long d,對齊數是8,大小8位元組,則需要對齊到8*2=16這個偏移量的地址,並在char c佔用記憶體後填補7個位元組,記憶體分佈如下:

3)結構體大小是所有成員對齊數中最大對齊數的整數倍

當最後一個結構體成員存放後,如果結構體大小不是所有成員的對齊數中最大對齊數的整數倍,那麼會在結構體最後的成員後補位元組。

#include"stdio.h"
struct S{
    int a;
    char c;
}s;
int main()
{
    printf("%d struct S\n",sizeof(struct S));
    printf("%p int a\n",&(s.a));
    printf("%p char c\n",&(s.c));
    return 0;
}
return 0;
}

接下來我們分析結構體成員是如何分佈在記憶體中的

@1 首先是int a,對齊數為4,大小是4個位元組,由於是第一個成員,直接放在0偏移處

@2 其次是char c,對齊數為1,大小是一個位元組,則可以存放在偏移量為4的地方

@3 我們發現,如果結構體到這裡就分配結束,那麼結構體大小應該為5,但是實際情況卻是結構體大小為8。實際上結構體也要進行記憶體對齊。

此結構體中int a和char c的對齊數分別為4和1,結構體對齊數是成員對齊數中的最大對齊數,則此結構體對齊數大小MAX(4,1)=4,那麼,就需要在char c後填補位元組到結構體大小為8.

4)巢狀結構體中子結構體對齊到子結構體自己成員的最大對齊數的整數倍

@1 offsetof(type, member-designator) 求偏移量宏

此庫宏需要包含標頭檔案「stddef.h」,會生成一個型別為size_t的整形數,代表該成員在記憶體中距離起始地址的偏移量。

範例可參考:C 庫宏 – offsetof() | 菜鳥教學 (runoob.com)

話不多說,上程式碼:

#include"stdio.h"
#include"stddef.h"
struct stu{
    int name;
    double grades;
};
struct team{
    char name[6];
    struct stu Students;
    int num_stu;
};
int main()
{
    struct team Team;
    printf("%d struct stu\n",sizeof(struct stu));
    printf("%d struct team\n",sizeof(struct team));
    printf("%p char name[10]\n"
    "%p struct stu Students\n"
    "%p int num_stu\n",(Team.name),&(Team.Students),&(Team.num_stu));
    printf("%d struct stu Students\n%d int num_stu\n",offsetof(struct team,Students),offsetof(struct team,num_stu));
    return 0;
}

執行結果如下:

@2 根據上面三個規律,可以得出struct stu的大小是16,接下來我們看看struct team的成員是怎麼分佈的

@3 首先是char name[6],第一個成員直接佔用6位元組,我知道你們都懂