title: C語言結構體大小分析
author: saopigqwq233
date: 2022-04-05
C語言自帶的資料型別大小如下
資料型別 | 大小(位元組) |
---|---|
char | 1 |
short | 2 |
int | 4 |
long | 4或8 |
float | 4 |
double | 8 |
long double | 16 |
C語言除了以上這些基本型別,還支援使用者自己定義資料型別
類似於一下形式:
struct Student{
char name[10];//學生姓名
int age;//學生年齡
};
這裡自定義了一個struct Student 型別的資料型別,包含有字元陣列和整形兩種內容。
如果直接按照結構體內的成員型別相加,那麼如上struct Student型別的大小應該是
10+4=14
似乎沒什麼問題,但是,當我們用以下程式碼做測試時,卻發現出了問題
#include"stdio.h"
#include"stdlib.h"
struct Student{
char name[10];//學生姓名
int age;//學生年齡
};
int main()
{
printf("%d\n",sizeof(struct Student));//測試struct Student大小
system("pause");
return 0;
}
執行結果
可以發現,結構體大小並非結構體成員大小簡單相加
為什麼會出現這樣的結果?這是因為C語言中存在一種行為叫結構體記憶體對齊。
結構體成員在記憶體存放時,編譯器會在結構體成員之間新增填充位元組,以保證結構體成員的對齊要求。
在C語言中,結構體第一個成員的地址和整個結構體的初始地址是相同的,也就是說,結構體的第一個成員始終位於結構體的初始地址處。
可以用以下程式碼證明:
#include"stdio.h"
#include"stdlib.h"
struct student {
char name[20];
int age;
float score;
};
int main()
{
struct student stu;
printf("%p\n%p\n",&(stu),&(stu.name));
system("pause");
return 0;
}
執行結果如下(不同裝置上執行的數值可能不相同,但是一臺裝置上兩行的資料相同):
可以看到,結構體變數的地址和結構體變數第一個成員的地址是相同的。
這句話是什麼意思呢,讓我們先看一個例子:
#include"stdio.h"
struct S
{
char a;
int b;
char c;
long long d;
}s;//建立結構體變數s
int main()
{
printf("結構體大小:%d\n",sizeof(struct S));
printf("各個成員的地址:\n");
printf("%p char a\n",&(s.a));
printf("%p int b\n",&(s.b));
printf("%p char c\n",&(s.c));
printf("%p long long d",&(s.d));
return 0;
}
執行結果如下:
需要注意的是,%p是以16進位制的格式進行輸出,最後一個long long 型資料d的大小為8位元組,則其結束地址應該是7d057
因此,結構體大小:7d057(16)-7d039(16)=18(16)=24(10)
接下來我們將以excel表格代表記憶體空間,分析每個成員在記憶體的分佈
其中,D列的0到23代表每個地址距離起始地址的偏移量
@1 首先是 char a,已知結構體第一個成員永遠放在0偏移處,且char 只佔1位元組,那麼a在記憶體的分佈暫時是這樣的
@2 接下來是int b,第二個成員要對齊到對齊數的整數倍,也就是說,它的起始地址的偏移量必須是對齊數的整數倍。
對齊數:1)資料型別自身的對齊數:char型資料自身對齊值為1位元組,short型資料為2位元組,int/float型為4位元組,double型為8位元組。
2)預設對齊數:VS2013預設對齊數為8,或#pragma pack (value)時的指定對齊值value。
3)資料成員、結構體的有效對齊數:自身對齊值和指定對齊值中較小者,即有效對齊值=min{自身對齊值,當前指定的pack值}。
*需要注意的是gcc無預設對齊數
由於我使用的是gcc編譯器,則int b的對齊數是其自身對齊值4,如果使用的是Visual Studio這個IDE,那麼其對齊數為min(4,8)=4。
因此,編譯器將會在成員char a後再填補3個位元組,使int b對齊,記憶體分佈如下:
@3 接下來是char c,其對齊數是min(1,8)=1,大小是1位元組,那麼,直接接在偏移量為8的地方
@4 最後一個成員是long long d,對齊數是8,大小8位元組,則需要對齊到8*2=16這個偏移量的地址,並在char c佔用記憶體後填補7個位元組,記憶體分佈如下:
當最後一個結構體成員存放後,如果結構體大小不是所有成員的對齊數中最大對齊數的整數倍,那麼會在結構體最後的成員後補位元組。
#include"stdio.h"
struct S{
int a;
char c;
}s;
int main()
{
printf("%d struct S\n",sizeof(struct S));
printf("%p int a\n",&(s.a));
printf("%p char c\n",&(s.c));
return 0;
}
return 0;
}
接下來我們分析結構體成員是如何分佈在記憶體中的
@1 首先是int a,對齊數為4,大小是4個位元組,由於是第一個成員,直接放在0偏移處
@2 其次是char c,對齊數為1,大小是一個位元組,則可以存放在偏移量為4的地方
@3 我們發現,如果結構體到這裡就分配結束,那麼結構體大小應該為5,但是實際情況卻是結構體大小為8。實際上結構體也要進行記憶體對齊。
此結構體中int a和char c的對齊數分別為4和1,結構體對齊數是成員對齊數中的最大對齊數,則此結構體對齊數大小MAX(4,1)=4,那麼,就需要在char c後填補位元組到結構體大小為8.
@1 offsetof(type, member-designator) 求偏移量宏
此庫宏需要包含標頭檔案「stddef.h」,會生成一個型別為size_t的整形數,代表該成員在記憶體中距離起始地址的偏移量。
範例可參考:C 庫宏 – offsetof() | 菜鳥教學 (runoob.com)
話不多說,上程式碼:
#include"stdio.h"
#include"stddef.h"
struct stu{
int name;
double grades;
};
struct team{
char name[6];
struct stu Students;
int num_stu;
};
int main()
{
struct team Team;
printf("%d struct stu\n",sizeof(struct stu));
printf("%d struct team\n",sizeof(struct team));
printf("%p char name[10]\n"
"%p struct stu Students\n"
"%p int num_stu\n",(Team.name),&(Team.Students),&(Team.num_stu));
printf("%d struct stu Students\n%d int num_stu\n",offsetof(struct team,Students),offsetof(struct team,num_stu));
return 0;
}
執行結果如下:
@2 根據上面三個規律,可以得出struct stu的大小是16,接下來我們看看struct team的成員是怎麼分佈的
@3 首先是char name[6],第一個成員直接佔用6位元組,我知道你們都懂