为何C语言会出现StackOverFlow的漏洞而高级语言不会?

0x01 背景

最近看了一下python的VM实现,就一直在思考,为何C语言会出现StackOverFlow的漏洞而高级语言本质上不会?

0x01 分析

python的VM是这样的,有一个局部变量表,有一个求值栈(evaluation stack),有一个调用栈(call stack,或者frame)。python的调用栈结构体里管理着求值栈和局部变量,当然还有bytecode等。而C语言也是有一个栈,但这个栈不是求值栈,而是局部变量表和调用栈公用的存储空间,C语言没有求值栈,求值使用寄存器完成。所以我们说C语言是基于寄存器的语言,而python是基于栈(可以看到,这里的栈不是C语言的栈,而是求值栈)的语言。

而为何C语言会出现StackOverFlow的漏洞正是因为C语言的栈是由局部变量表和调用栈公用,导致用户可以通过篡改局部变量来影响调用栈的内容。具体来说就是用户通过越界修改栈伤的局部变量,覆盖栈上保存的函数返回地址。

而python这样的语言,调用栈是由VM来控制的,且局部变量表是在调用栈结构体(PyFrameObject)内部,调用栈对于局部变量表是不可见的,用户不可能通过修改局部变量来影响调用栈的内容,所以不会产生StackOverFlow这样的漏洞。

0x02 具体一点

具体可以看这两篇python VM的介绍:https://leanpub.com/insidethepythonvirtualmachine/read
这里可以看到PyFrameObject管理着python的bytecode,局部变量,全局变量,求值栈等,一个PyFrameObject可以看作一个函数。所以函数的返回地址是由PyFrameObject控制记录的,跟函数的局部变量完全不在一个层面上。

这里的https://opensource.com/article/18/4/introduction-python-bytecode Inside the Python virtual machine 一节也佐证了python VM的构造。

反观C语言,调用栈的frame完全是在栈上存储的,局部变量也是在栈上存储的,导致了StackOverFlow发生的可能性。