linux 与windows地址对齐问题

翔云123456 2012-08-09 09:37:13

结构体

typedef struct {
__u8 a1:4;
__u8 a2:1;
__u16 a3:11;
__u16 a4;
__u16 a5;
}mystr;

在linux下sizeof(mystr)结果是6字节

windows下sizeof(mystr)结果是8字节

编译器的对齐方式造成的吗？

有没有不进行优化的对齐方式呢？也就是在windows下sizeof(mystr)结果也是6字节？

各位大侠请赐教。

...全文

429 13 打赏收藏转发到动态举报

写回复

用AI写文章

13 条回复

切换为时间正序

请发表友善的回复…

发表回复

lindeshi 2012-09-04

打赏
举报

[Quote=引用 12 楼的回复:]
一.内存对齐的初步讲解
内存对齐可以用一句话来概括：
“数据项只能存储在地址是数据项大小的整数倍的内存位置上”
例如int类型占用4个字节，地址只能在0，4，8等位置上。
例1：
#include <stdio.h>
struct xx{
char b;
int a;
int c;
char d;
};
int main()
{
struct xx bb;
print……
[/Quote]

数据项只能存储在地址是数据项大小的整数倍的内存位置上

不敢苟同啊~~~

我在VS08上的测试~~ double 类型的变量基本上没有对齐到8字节倍数的地址上
而且结构体的话也是不会特意对齐到8字节倍数的地址上的，4字节地址上到是真的，除了 char 这些变量和一些只包含一个char的结构体以外，
只有一个char 的可以对齐到单数的地址上~~~~

+ &d4 0x0012f4bc double *
+ &d1 0x0012f504 double *
+ &d2 0x0012f4f4 double *
+ &d3 0x0012f4d8 double *

linuxblack125125 2012-08-10

打赏
举报

[Quote=引用 4 楼的回复:]

http://blog.csdn.net/wshn13/article/details/7835155
[/Quote]

好东西！

夏天__ 2012-08-10

打赏
举报

一.内存对齐的初步讲解
内存对齐可以用一句话来概括：
“数据项只能存储在地址是数据项大小的整数倍的内存位置上”
例如int类型占用4个字节，地址只能在0，4，8等位置上。
例1：
#include <stdio.h>
struct xx{
char b;
int a;
int c;
char d;
};
int main()
{
struct xx bb;
printf("&a = %p\n", &bb.a);
printf("&b = %p\n", &bb.b);
printf("&c = %p\n", &bb.c);
printf("&d = %p\n", &bb.d);
printf("sizeof(xx) = %d\n", sizeof(struct xx));
return 0;
}
执行结果如下：
&a = ffbff5ec
&b = ffbff5e8
&c = ffbff5f0
&d = ffbff5f4
sizeof(xx) = 16
会发现b与a之间空出了3个字节，也就是说在b之后的0xffbff5e9,0xffbff5ea,0xffbff5eb空了出来，a直接存储在了0xffbff5ec，因为a的大小是4，只能存储在4个整数倍的位置上。打印xx的大小会发现，是16，有些人可能要问，b之后空出了3个字节，那也应该是13啊？其余的3个呢？这个往后阅读本文会理解的更深入一点，这里简单说一下就是d后边的3个字节，也会浪费掉，也就是说，这3个字节也被这个结构体占用了.
可以简单的修改结构体的结构，来降低内存的使用，例如可以将结构体定义为：
struct xx{
char b;
char d;
int a;
int c;
};
这样打印这个结构体的大小就是12，省了很多空间，可以看出，在定义结构体的时候，一定要考虑要内存对齐的影响，这样能使我们的程序占用更小的内存。
二.操作系统的默认对齐系数
每个操作系统都有自己的默认内存对齐系数，如果是新版本的操作系统，默认对齐系数一般都是8，因为操作系统定义的最大类型存储单元就是8个字节，例如 long long（为什么一定要这样，在第三节会讲解），不存在超过8个字节的类型（例如int是4，char是1，long在32位编译时是4，64位编译时是 8）。当操作系统的默认对齐系数与第一节所讲的内存对齐的理论产生冲突时，以操作系统的对齐系数为基准。
例如：
假设操作系统的默认对齐系数是4，那么对与long long这个类型的变量就不满足第一节所说的，也就是说long long这种结构，可以存储在被4整除的位置上，也可以存储在被8整除的位置上。
可以通过#pragma pack()语句修改操作系统的默认对齐系数，编写程序的时候不建议修改默认对齐系数，在第三节会讲解原因
例2：
#include <stdio.h>
#pragma pack(4)
struct xx{
char b;
long long a;
int c;
char d;
};
#pragma pack()
int main()
{
struct xx bb;
printf("&a = %p\n", &bb.a);
printf("&b = %p\n", &bb.b);
printf("&c = %p\n", &bb.c);
printf("&d = %p\n", &bb.d);
printf("sizeof(xx) = %d\n", sizeof(struct xx));
return 0;
}
打印结果为：
&a = ffbff5e4
&b = ffbff5e0
&c = ffbff5ec
&d = ffbff5f0
sizeof(xx) = 20
发现占用8个字节的a，存储在了不能被8整除的位置上，存储在了被4整除的位置上，采取了操作系统的默认对齐系数。
三.内存对齐产生的原因

内存对齐是操作系统为了快速访问内存而采取的一种策略，简单来说，就是为了放置变量的二次访问。操作系统在访问内存时，每次读取一定的长度（这个长度就是操作系统的默认对齐系数，或者是默认对齐系数的整数倍）。如果没有内存对齐时，为了读取一个变量是，会产生总线的二次访问。
例如假设没有内存对齐，结构体xx的变量位置会出现如下情况：
struct xx{
char b; //0xffbff5e8
int a; //0xffbff5e9
int c; //0xffbff5ed
char d; //0xffbff5f1
};
操作系统先读取0xffbff5e8-0xffbff5ef的内存，然后在读取0xffbff5f0-0xffbff5f8的内存，为了获得值c，就需要将两组内存合并，进行整合，这样严重降低了内存的访问效率。（这就涉及到了老生常谈的问题，空间和效率哪个更重要？这里不做讨论）。
这样大家就能理解为什么结构体的第一个变量，不管类型如何，都是能被8整除的吧（因为访问内存是从8的整数倍开始的，为了增加读取的效率）！

内存对齐的问题主要存在于理解struct等复合结构在内存中的分布。
首先要明白内存对齐的概念。
许多实际的计算机系统对基本类型数据在内存中存放的位置有限制，它们会要求这些数据的首地址的值是某个数k(通常它为4或8)的倍数，这就是所谓的内存对齐。
这个k在不同的cpu平台下，不同的编译器下表现也有所不同。比如32位字长的计算机与16位字长的计算机。这个离我们有些远了。我们的开发主要涉及两大平台，windows和linux（unix），涉及的编译器也主要是microsoft编译器(如cl),和gcc。
内存对齐的目的是使各个基本数据类型的首地址为对应k的倍数，这是理解内存对齐方式的终极法宝。另外还要区分编译器的分别。明白了这两点基本上就能搞定所有内存对齐方面的问题。
不同编译器中的k：
1、对于microsoft的编译器，每种基本类型的大小即为这个k。大体上char类型为8，int为32，long为32，double为64。
2、对于linux下的gcc编译器，规定大小小于等于2的，k值为其大小，大于等于4的为4。
明白了以上的说明对struct等复合结构的内存分布就应该很清楚了。
下面看一下最简单的一个类型：struct中成员都为基本数据类型，例如：
struct test1
{
char a;
short b;
int c;
long d;
double e;
};
在windows平台，microsoft编译器下：
假设从0地址开始，首先a的k值为1，它的首地址可以使任意位置，所以a占用第一个字节，即地址0；然后b的k值为2，他的首地址必须是2的倍数，不能是1，所以地址1那个字节被填充，b首地址为地址2，占用地址2，3；然后到c，c的k值为4，他的首地址为4的倍数，所以首地址为4，占用地址4，5，6，7；再然后到d，d的k值也为4，所以他的首地址为8，占用地址8，9，10，11。最后到e，他的k值为8，首地址为8的倍数，所以地址12，13，14，15被填充，他的首地址应为16，占用地址16-23。显然其大小为24。
这就是 test1在内存中的分布情况。我们建立一个test1类型的变量，a、b、c、d、e分别赋值2、4、8、16、32。然后从低地址依次打印出内存中每个字节对应的16进制数为：
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 0 0 0 0 40 40
验证：
显然推断是正确的。
在linux平台，gcc编译器下：
假设从0地址开始，首先a的k值为1，它的首地址可以使任意位置，所以a占用第一个字节，即地址0；然后b的k值为2，他的首地址必须是2的倍数，不能是1，所以地址1那个字节被填充，b首地址为地址2，占用地址2，3；然后到c，c的k值为4，他的首地址为4的倍数，所以首地址为4，占用地址4，5，6，7；再然后到d，d的k值也为4，所以他的首地址为8，占用地址8，9，10，11。最后到e，从这里开始与microsoft的编译器开始有所差异，他的k值为不是8，仍然是4，所以其首地址是12，占用地址12-19。显然其大小为20。
验证：
我们建立一个test1类型的变量，a、b、c、d、e分别赋值2、4、8、16、32。然后从低地址依次打印出内存中每个字节对应的16进制数为：
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 40 40
显然推断也是正确的。
接下来，看一看几类特殊的情况，为了避免麻烦，不再描述内存分布，只计算结构大小。
第一种：嵌套的结构
struct test2
{
char f;
struct test1 g;
};
在windows平台，microsoft编译器下：
这种情况下如果把test2的第二个成员拆开来，研究内存分布，那么可以知道，test2的成员f占用地址0，g.a占用地址1，以后的内存分布不变，仍然满足所有基本数据成员的首地址都为其对应k的倍数这一原则，那么test2的大小就还是24了。但是实际上test2的大小为32，这是因为：不能因为test2的结构而改变test1的内存分布情况，所以为了使test1种各个成员仍然满足对齐的要求，f成员后面需要填充一定数量的字节，不难发现，这个数量应为7个，才能保证test1的对齐。所以test2相对于test1来说增加了8个字节，所以test2的大小为32。
在linux平台，gcc编译器下：
同样，这种情况下如果把test2的第二个成员拆开来，研究内存分布，那么可以知道，test2的成员f占用地址0，g.a占用地址1，以后的内存分布不变，仍然满足所有基本数据成员的首地址都为其对应k的倍数这一原则，那么test2的大小就还是20了。但是实际上test2的大小为24，同样这是因为：不能因为test2的结构而改变test1的内存分布情况，所以为了使test1种各个成员仍然满足对齐的要求，f成员后面需要填充一定数量的字节，不难发现，这个数量应为3个，才能保证test1的对齐。所以test2相对于test1来说增加了4个字节，所以test2的大小为24。
第二种：位段对齐
struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};
或者
struct test3
{
unsigned int a:4;
int b:4;
char c;
};
在windows平台，microsoft编译器下：
相邻的多个同类型的数(带符号的与不带符号的，只要基本类型相同，也为相同的数),如果他们占用的位数不超过基本类型的大小，那么他们可作为一个整体来看待。不同类型的数要遵循各自的对齐方式。
如：test3中，a、b可作为一个整体，他们作为一个int型数据来看待，所以test3的大小为8字节。并且a与b的值在内存中从低位开始依次排列，位于4字节区域中的前0-3位和4-7位
如果test4位以下格式
struct test4
{
unsigned int a:30;
unsigned int b:4;
char c;
};
那么test4的大小就为12个字节，并且a与b的值分别分布在第一个4字节的前30位，和第二个4字节的前4位。
如过test5是以下形式
struct test5
{
unsigned int a:4;
unsigned char b:4;
char c;
};
那么由于int和char不同类型，他们分别以各自的方式对齐，所以test5的大小应为8字节，a与b的值分别位于第一个4字节的前4位和第5个字节的前4位。
在linux平台，gcc编译器下：
struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};
gcc下，相邻各成员，不管类型是否相同，占的位数之和超过这些成员中第一个的大小的时候，在结构中以k值为1对齐，在结构外k值为其基本类型的值。不超过的情况下在内存中依次排列。
如test3，其大小为4。a，b的值在内存中依次排列分别为第一个四字节中的0-3和4-7位。
如果test4位以下格式
struct test4
{
unsigned int a:20;
unsigned char b:4;
char c;
};
test4的大小为4个字节，并且a与b的值分别分布在第一个4字节的0-19位，和20-23位，c存放在第4个字节中。
如过test5是以下形式
struct test5
{
unsigned int a:10;
unsigned char b:4;
short c;
};
那么test5的大小应为4字节，a，b的值为0-9位和10-13位。c存放在后两个字节中。如果a的大小变成了20
那么test5的大小应为8字节。即
struct test6
{
unsigned int a:20;
unsigned char b:4;
short c;
};
此时，test6的a、b共占用0，1，2共3字节，c的k值为2，其实可以4位首位置，但是在结构外，a要以int的方式对齐。也就是说连续两个test6对象在内存中存放的话，a的首位置要保证为4的倍数，那么c后面必须多填充2位。所以test6的大小为8个字节。
关于位段结构的部分是比较复杂的。暂时我就知道这么多。

翔云123456 2012-08-10

打赏
举报

[Quote=引用 9 楼的回复:]
只能说gcc强大，尽管类型不同，但是还是把前3个合为一体用2字节存储，这跟字节对齐没关系
想一样的话大概把
__u8 a1:4;
__u8 a2:1;
都修改为u16应该就可以了
[/Quote]
正如
nice_cxf所说

Windows下，将结构体中前三个字段类型改为一致

typedef struct {
__u16 a1:4;
__u16 a2:1;
__u16 a3:11;
__u16 a4;
__u16 a5;
}mystr;

sizeof(myst)结果为6字节

编译器地址优化的时候，前三个字段类型相同，合为2个字节（前提：地址对齐方式2字节或更大）

地址对齐可以参考上面提到的

http://blog.csdn.net/wshn13/article/details/7835155

感谢大家的帮助，结贴。

AnYidan 2012-08-10

打赏
举报

printf("%u\n", sizeof(int)); // 检查下你的系统

nice_cxf 2012-08-10

打赏
举报

只能说gcc强大，尽管类型不同，但是还是把前3个合为一体用2字节存储，这跟字节对齐没关系
想一样的话大概把
__u8 a1:4;
__u8 a2:1;
都修改为u16应该就可以了

自信男孩 2012-08-10

打赏
举报

你可以设置结构体的对齐方式，在windows下，结构体对齐的方式是按结构体中成员变量最大的对齐，没有最高限制；在linux下，结构体对齐的方式是按结构体中成员变量最大的对齐，结构体对齐的最高位4个字节。

翔云123456 2012-08-10

打赏
举报

[Quote=引用 2 楼的回复:]
你的第二个问题，我想用 #pragma pack(1)可以办到 //等会儿代码测试下才能确认

第一个问题，我觉得你可以自己写一个位移宏，验证关心的元素的位移，就知道是否填充，进而知道原因了
#define OFFSET(A,a) &(((A)*)(void * )0 ->(a) ) //A是结构体名称,a是结构体成员
[/Quote]

#pragma pack( 1 )

测得结果是7字节

冰与火 2012-08-09

打赏
举报

linux默认最高4字节对齐？

wshn13 2012-08-09

打赏
举报

http://blog.csdn.net/wshn13/article/details/7835155

linuxblack125125 2012-08-09

打赏
举报

不知道是编译器还是操作系统的原因，反正在linux下所有位域加起来不足1byte的补足1byte ,大于1byte小于2byte的补足2byte。。。

windows下看结果好像是对每个位域都采取了linux下的措施。

titer1 2012-08-09

打赏
举报

你的第二个问题，我想用 #pragma pack(1)可以办到 //等会儿代码测试下才能确认

第一个问题，我觉得你可以自己写一个位移宏，验证关心的元素的位移，就知道是否填充，进而知道原因了
#define OFFSET(A,a) &(((A)*)(void * )0 ->(a) ) //A是结构体名称,a是结构体成员

Gloveing 2012-08-09

打赏
举报

#pragma pack( [ n] )

Specifies packing alignment for structure and union members. Whereas the packing alignment of structures and unions is set for an entire translation unit by the /Zp option, the packing alignment is set at the data-declaration level by the pack pragma. The pragma takes effect at the first structure or union declaration after the pragma is seen; the pragma has no effect on definitions.

When you use #pragma pack(n), where n is 1, 2, 4, 8, or 16, each structure member after the first is stored on the smaller member type or n-byte boundaries. If you use #pragma pack without an argument, structure members are packed to the value specified by /Zp. The default /Zp packing size is /Zp8.