C语言 数组初始化的三种常用方法({0}, memset, for循环赋值)以及原理

  • Post author:
  • Post category:其他


C语言中,数组初始化的方式主要有三种:


1、声明时,使用 {0} 初始化;

2、使用memset;

3、用for循环赋值。

那么,这三种方法的原理以及效率如何呢? 请看下面的测试代码:

#define ARRAY_SIZE_MAX  (1*1024*1024)
 
void function1()
{
    char array[ARRAY_SIZE_MAX] = {0};  //声明时使用{0}初始化为全0
}
 
void function2()
{
    char array[ARRAY_SIZE_MAX];
    memset(array, 0, ARRAY_SIZE_MAX);  //使用memset方法
}
 
void function3()
{
    int i = 0;
    char array[ARRAY_SIZE_MAX];
    for (i = 0; i < ARRAY_SIZE_MAX; i++)  //for循环赋值
    {
        array[i] = 0;
    }
}

效率:

分别执行上面三种方法,统计下平均时间可以得出:

for循环浪费的时间最多,{0} 与memset 耗时差不多。


原理:

1、for循环赋值,就是循环赋值,不解释了

2、memset,很容易找到memset内部实现代码,这里也不解释了

3、{0} 内部是怎么实现的呢?

将上述代码编译成汇编格式如下:

function1如下:

	pushl	%ebp
	movl	%esp, %ebp
	subl	$1048600, %esp
	leal	-1048584(%ebp), %eax
	movl	$1048576, %edx
	movl	%edx, 8(%esp)
	movl	$0, 4(%esp)
	movl	%eax, (%esp)
	call	memset
	leave
	ret

function2如下:

	pushl	%ebp
	movl	%esp, %ebp
	subl	$1048600, %esp
	movl	$1048576, 8(%esp)
	movl	$0, 4(%esp)
	leal	-1048584(%ebp), %eax
	movl	%eax, (%esp)
	call	memset
	leave
	ret

通过汇编代码可以看出,{0}初始化方式,调用了memset函数!


对三种方法的选取:

1、for 最浪费时间,不建议(其实memset内部也是用循环实现的,只不过memset经过了严格优化,所以性能更高);

2、{0} 可能有移植性问题,虽然绝大多数编译器看到{0} 都是将数组全部初始化为0, 但是不保证所有编译器都是这样实现的;

3、综合1、2, 推荐使用memset方法。



补充:

看如下的例子:



wchar_t wname[128]={0};

char cname[256]={0};

我感兴趣的是:

1.这种赋值的结果.

2.这种形式是否符合标准编码规则?

有如下资料:



初始化值的个数可少于数组元素个数.当初始化值的个数少于数组元素个数时,前面的按序初始化相应值, 后面的初始化为0(全局或静态数组)或为不确定值(局部数组).

我相信上面的资料是C和C++语言的标准规范,但实际编译器处理时,可能会和规范有所不同.因为编译器原则上要遵从语言规范,但对于局部数组的不确定值到底是多少,怎么处理,编译器就可以灵活处理.我测试了三种编译器,其实编译器赋予的值是固定的,都是0。

/*

一直以为 int a[256]={0};是把a的所有元素初始化为0,int a[256]={1};是把a所有的元素初始化为1。调试的时查看内存发现不是那么一回事,翻了一下《The C++ Programming Language》总算有定论。PDF的竟然不然复制,就把它这章翻译了,如下

5.2.1 数组初始化

数组可以用一个列值来初始化,例如

int v1[] ={1,2,3,4};

char v2[]={‘a’,‘b’,‘c’,0};

当数组定义时没有指定大小,当初始化采用列表初始化了,那么数组的大小由初始化时列表元素个数决定。所以v1和v2分别为 int[4] 和char[4]类型。如果明确指定了数组大小,当在初始化时指定的元素个数超过这个大小就会产生错误。例如:

char v3[2] ={‘a’,‘b’,0}; //错误:太多的初始化值了

char v3[3] ={‘a’,‘b’,0}; //正确

如果初始化时指定的的元素个数比数组大小少,剩下的元素都回被初始化为 0。例如

int v5[8]={1,2,3,4};

等价于

int v5[8]={1,2,3,4,0,0,0,0};

注意没有如下形式的数组赋值:

void f()

{


v4={‘c’,‘d’,0}; //错误:不是数组赋值

}

如果你想这样的复制的话,请使用 vector(16章第三节) 或者 valarray(22章第四节)。

字符数组可以方便地采用字符串直接初始化(参考第五章 2.2小节)

译注: 就是 这样啦 char alpha []=“abcdefghijklmn”;

*/


举个例子:

#include <iostream.h>

int array1[5]={1,2,3};
static int array2[5]={1};


void main()
{
    int arr1[5]={2};
    static int arr2[5]={1,2};
    
    int n;
    cout <<"global: ";
    for(n=0; n<5; n++)
        cout <<" " <<array1[n];
    
    cout <<" global static: ";
    for(n=0; n<5; n++)
        cout <<" " <<array2[n];
    
    cout <<" local: ";
    for(n=0; n<5; n++)
        cout <<" " <<arr1[n];
    
    cout <<" local static: ";
    for(n=0; n<5; n++)
        cout <<" " <<arr2[n];
    cout <<endl;
}

在这个例子中,全局和静态数组都按语言规范要求被初始化为0,但是局部数组并没有向前面所说的为不确定值,下面是用gcc,VC6.0,tuborC++分别编译的结果(注意gcc用g++编译c++文件,gcc不会链接库的):

/*

GCC 可同时用来编译 C 程序和 C++ 程序。一般来说,C 编译器通过源文件的后缀名来判断是 C 程序还是 C++ 程序。在 Linux 中,C 源文件的后缀名为 .c,而 C++ 源文件的后缀名为 .C 或 .cpp。

但是,gcc 命令只能编译 C++ 源文件,而不能自动和 C++ 程序使用的库连接。因此,通常使用 g++ 命令来完成 C++ 程序的编译和连接,该程序会自动调用 gcc 实现编译。

*/

这说明了对局部数组没有初始化的元素的值,这几种编译器都将其设置为0.但是,如果如果不对数组进行初始化,即在定义的同时没有用列表初始化,那么局部数组的值就取决于编译器而对程序员来说就是不可预料的了.有时间可以测试一下各个编译器,不过在vc中是0xcc.所以对局部数组的初始化要特别小心.但是全局的数组和静态数组还是会被正确的赋于0值的。

重申对变量初始化的重要性!