.bss段和.data段数据分析

  • Post author:
  • Post category:其他


BSS段:BSS段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。

数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

代码段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

栈(stack):栈又称堆栈,是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

【例一】

用cl编译两个小程序如下:

程序1:

int ar[30000];

void main()

{

……

}

程序2:

int ar[300000] = {1, 2, 3, 4, 5, 6 };

void main()

{

……

}

发现程序2编译之后所得的.exe文件比程序1的要大得多。当下甚为不解,于是手工编译了一下,并使用了/FAs编译选项来查看了一下其各自的.asm,发现在程序1.asm中ar的定义如下:

_BSS SEGMENT

?ar@@3PAHA DD 0493e0H DUP (?) ; ar

_BSS ENDS

而在程序2.asm中,ar被定义为:

_DATA SEGMENT

?ar@@3PAHA DD 01H ; ar

DD 02H

DD 03H

ORG $+1199988

_DATA ENDS

区别很明显,一个位于.bss段,而另一个位于.data段,两者的区别在于:全局的未初始化变量存在于.bss段中,具体体现为一个占位符;全局的已初始化变量存于.data段中;而函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的,其内容由操作系统初始化(清零);而.data却需要占用,其内容由程序初始化,因此造成了上述情况。

【例二】

编译如下程序(test.cpp):

include

define LEN 1002000

int inbss[LEN];

float fA;

int indata[LEN]={1,2,3,4,5,6,7,8,9};

double dbB = 100.0;

const int cst = 100;

int main(void)

{

int run[100] = {1,2,3,4,5,6,7,8,9};

for(int i=0; i

printf(“%d “, inbss[i]);

return 0;

}

命令:cl /FA test.cpp 回车 (/FA:产生汇编代码)

产生的汇编代码(test.asm):

TITLE test.cpp

.386P

include listing.inc

if @Version gt 510

.model FLAT

else

_TEXT SEGMENT PARA USE32 PUBLIC ‘CODE’

_TEXT ENDS

_DATA SEGMENT DWORD USE32 PUBLIC ‘DATA’

_DATA ENDS

CONST SEGMENT DWORD USE32 PUBLIC ‘CONST’

CONST ENDS

_BSS SEGMENT DWORD USE32 PUBLIC ‘BSS’

_BSS ENDS

_TLS SEGMENT DWORD USE32 PUBLIC ‘TLS’

_TLS ENDS

FLAT GROUP _DATA, CONST, _BSS

ASSUME CS: FLAT, DS: FLAT, SS: FLAT

endif

PUBLIC ?inbss@@3PAHA ; inbss

PUBLIC ?fA@@3MA ; fA

PUBLIC ?indata@@3PAHA ; indata

PUBLIC ?dbB@@3NA ; dbB

_BSS SEGMENT

?inbss@@3PAHA DD 0f4a10H DUP (?) ; inbss

?fA@@3MA DD 01H DUP (?) ; fA

_BSS ENDS

_DATA SEGMENT

?indata@@3PAHA DD 01H ; indata

DD 02H

DD 03H

DD 04H

DD 05H

DD 06H

DD 07H

DD 08H

DD 09H

ORG









+


4007964


?


d




b


B




@






@




3


N




A


D


Q


04059000000000000


r


;


100


;


d




b





B






D







A


T




A


E




N




D


S




P




U




B


L


I







C








m







a


i


n


E




X




T




R





N








p







r


i


n


t


f








:


N




E




A





R






D







A


T




A


S




E




G


M




E




N




T
















+

4007964

?

d

b

B

@

@

3

N

A

D

Q

04059000000000000

r

;

100

;

d

b

B

D

A

T

A

E

N

D

S

P

U

B

L

I

C

m

a

i

n

E

X

T

R

N

p

r

i

n

t

f

:

N

E

A

R

D

A

T

A

S

E

G

M

E

N

T



SG537 DB ‘%d ‘, 00H

_DATA ENDS

_TEXT SEGMENT

_run







=








400






i















=

400

i



= -404

_main PROC NEAR

; File test.cpp

; Line 13

push ebp

mov ebp, esp

sub esp, 404 ; 00000194H

push edi

; Line 14

mov DWORD PTR _run







[


e


b


p


]


,


1


m


o


v


D


W




O


R


D


P




T







R






r







u


n










[

e

b

p

]

,

1

m

o

v

D

W

O

R

D

P

T

R

r

u

n



[ebp+4], 2

mov DWORD PTR _run







[


e


b


p


+


8


]


,


3


m


o


v


D


W




O


R


D


P




T







R






r







u


n










[

e

b

p

+

8

]

,

3

m

o

v

D

W

O

R

D

P

T

R

r

u

n



[ebp+12], 4

mov DWORD PTR _run







[


e


b


p


+


16


]


,


5


m


o


v


D


W




O


R


D


P




T







R






r







u


n










[

e

b

p

+

16

]

,

5

m

o

v

D

W

O

R

D

P

T

R

r

u

n



[ebp+20], 6

mov DWORD PTR _run







[


e


b


p


+


24


]


,


7


m


o


v


D


W




O


R


D


P




T







R






r







u


n










[

e

b

p

+

24

]

,

7

m

o

v

D

W

O

R

D

P

T

R

r

u

n



[ebp+28], 8

mov DWORD PTR _run







[


e


b


p


+


32


]


,


9


m


o


v


e


c


x


,


91


;


0000005


b


H




x


o


r


e


a


x


,


e


a


x


l


e


a


e


d




i


,


D


W




O


R


D


P




T







R






r







u


n










[

e

b

p

+

32

]

,

9

m

o

v

e

c

x

,

91

;

0000005

b

H

x

o

r

e

a

x

,

e

a

x

l

e

a

e

d

i

,

D

W

O

R

D

P

T

R

r

u

n



[ebp+36]

rep stosd

; Line 15

mov DWORD PTR _i







[


e


b


p


]


,


0


j


m


p


S




H




O


R


T












[

e

b

p

]

,

0

j

m

p

S

H

O

R

T



L534








L


535


:


m


o


v


e


a


x


,


D


W




O


R


D


P




T







R






i















L

535

:

m

o

v

e

a

x

,

D

W

O

R

D

P

T

R

i



[ebp]

add eax, 1

mov DWORD PTR _i







[


e


b


p


]


,


e


a


x










[

e

b

p

]

,

e

a

x



L534:

cmp DWORD PTR _i







[


e


b


p


]


,


1002000


;


000


f




4


a


10


H




j


g




e


S




H




O


R


T












[

e

b

p

]

,

1002000

;

000

f

4

a

10

H

j

g

e

S

H

O

R

T



L536

; Line 16

mov ecx, DWORD PTR _i







[


e


b


p


]


m


o


v


e


d




x


,


D


W




O


R


D


P




T




R


?


i


n


b


s


s




@






@




3


P




A


H




A


[


e


c


x





4


]


p


u


s


h


e


d




x


p


u


s


h


O


F




F




S




E




T




F




L


A


T




:










[

e

b

p

]

m

o

v

e

d

x

,

D

W

O

R

D

P

T

R

?

i

n

b

s

s

@

@

3

P

A

H

A

[

e

c

x

4

]

p

u

s

h

e

d

x

p

u

s

h

O

F

F

S

E

T

F

L

A

T

:



SG537

call _printf

add esp, 8

jmp SHORT







L


535










L

535



L536:

; Line 17

xor eax, eax

; Line 18

pop edi

mov esp, ebp

pop ebp

ret 0

_main ENDP

_TEXT ENDS

END

----------------------------------------

通过汇编文件可以看到,数组inbss和indata位于不同的段(inbss位于bss段,而indata位于data段)

若把test.cpp中的indata数组拿掉,查看生成的exe文件的大小,可以发现,indata拿掉之后exe文件的大小小了很多。而若拿掉的是inbss数组,exe文件大小跟没拿掉时相差无几。

说明了:

bss段(未手动初始化的数据)并不给该段的数据分配空间,只是记录数据所需空间的大小。

data(已手动初始化的数据)段则为数据分配空间,数据保存在目标文件中。

数据段包含经过初始化的全局变量以及它们的值。BSS段的大小从可执行文件中得到,然后链接器得到这个大小的内存块,紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和BSS段的整个区段此时通常称为数据区。