曾经有一家公司有一道面试题目如下:
在Linux x86_64 gcc环境下,下面的程序会出现什么问题?运行结果是什么?为什么?
肯定很多面试者看到了就立马说:“数组越界了嘛。”
确实如此,但是结果是什么呢?想必很多人都是不知道的,结果是死循环打印数字,让我们来分析分析。
因为我用的是VS编译器,那么我这里就写一个和题目相仿的题来分析:
#include <stdio.h>
int main()
{
long i;
long arr[16];
for (i = 0; i <= 18; i++)
{
arr[i] = 0;
printf("%d",i);
}
return 0;
}
代码的结果是死循环打印数字,准确来说我这道题是死循环打印0-17的数字,那么原因是什么呢?
-
当我们调试起来的时候可以看到:
因为刚开始我们并没有给变量i和arr数组初始值,所以他们刚开始的值都为随机值,这都没有什么问题。 -
当我们按F10继续调试时可以观察到,数组中的元素也一一被赋值为0,i的值也随之增加:
-
走到越界后的arr[16]和arr[17]时:
我们发现虽然数组以及越界但是我们确确实实吧arr[16]和arr[17]的值也赋值为0了,这个问题也不大,因为语言本身是不做越界检查的 -
当调试到后面将arr[18]也赋值为0时发现,i的值也被赋值为0:
这是为什么呢?其实善于观察的朋友们会发现arr[18]和i的值一开始就是一样的(不信你再看看前面几张图),于是我们会想:难道arr[18]里面就是i的值吗?
-
想知道这个也不难,我们只需要看看他们在内存中的地址是否相同即可:
看到他们的地址确实相同,这也说明了他们都表示同一个数。那么原理是什么呢?
原理:
首先i和arr数组都是局部变量,所以他们都是放在内存中的栈区上的,而栈区内存的使用有一个规定:先使用高地址处的空间,再使用低地址处的空间。
而数组也有一个规定:数组随着下标的变化,地址由低到高。
因为i变量定义在arr数组之前,所以i变量的地址就比arr数组的高,这样我们可以通过画图来解释:
所以,当数组适当越界得情况下,就可能导致越界访问到循环变量i,改变i得值就可能导致死循环。
这样,i的值就一直循环地从0-17,也就是循环打印0-17得数字了。
相信有博友会质疑为什么一定i和arr数组之间就恰好各了两个空格(也就是8个字节)呢?这难道不是巧合吗?
确实,编译器不同i和arr数组之间所差的字节不同,而在VS编译器下就差8个字节,但是在开头所说的Linux x86_64 gcc环境下,它们所差的就是4个字节(也就是一个格子),所以我在VS编译器中运行时就故意将题中的条件:i<=17改为了i<=18,这样才能变为死循环。