尝试理解 gcc 在 main 函数顶部的复杂堆栈对齐,该对齐复制了返回地址
- 2024-10-30 08:35:00
- admin 原创
- 45
问题描述:
你好,为了更好地理解它是如何工作的,我反汇编了一些我编写的程序(linux),我注意到主要函数总是以以下内容开头:
lea ecx,[esp+0x4] ; I assume this is for getting the adress of the first argument of the main...why ?
and esp,0xfffffff0 ; ??? is the compiler trying to align the stack pointer on 16 bytes ???
push DWORD PTR [ecx-0x4] ; I understand the assembler is pushing the return adress....why ?
push ebp
mov ebp,esp
push ecx ;why is ecx pushed too ??
所以我的问题是:为什么要做所有这些工作?我只了解以下用途:
push ebp
mov ebp,esp
其余的对我来说似乎没用......
解决方案 1:
我已经尝试过了:
;# As you have already noticed, the compiler wants to align the stack
;# pointer on a 16 byte boundary before it pushes anything. That's
;# because certain instructions' memory access needs to be aligned
;# that way.
;# So in order to first save the original offset of esp (+4), it
;# executes the first instruction:
lea ecx,[esp+0x4]
;# Now alignment can happen. Without the previous insn the next one
;# would have made the original esp unrecoverable:
and esp,0xfffffff0
;# Next it pushes the return addresss and creates a stack frame. I
;# assume it now wants to make the stack look like a normal
;# subroutine call:
push DWORD PTR [ecx-0x4]
push ebp
mov ebp,esp
;# Remember that ecx is still the only value that can restore the
;# original esp. Since ecx may be garbled by any subroutine calls,
;# it has to save it somewhere:
push ecx
解决方案 2:
这样做是为了让堆栈与 16 字节边界对齐。某些指令要求某些数据类型与多达 16 字节边界对齐。为了满足此要求,GCC 确保堆栈最初与 16 字节对齐,并以 16 字节的倍数分配堆栈空间。这可以使用选项-mpreferred-stack-boundary= num来控制。如果您使用 -mpreferred-stack-boundary=2(用于 2 2 =4 字节对齐),则不会生成此对齐代码,因为堆栈始终至少与 4 字节对齐。但是,如果您的程序使用任何需要更强对齐的数据类型,您可能会遇到麻烦。
根据 gcc 手册:
在 Pentium 和 PentiumPro 上,double 和 long double 值应与 8 字节边界对齐(请参阅 -malign-double),否则运行时性能会受到严重影响。在 Pentium III 上,如果 Streaming SIMD Extension (SSE) 数据类型 __m128 未与 16 字节对齐,则可能无法正常工作。
为了确保堆栈上的这些值正确对齐,堆栈边界必须与堆栈上存储的任何值所需的边界对齐。此外,必须生成每个函数以使其保持堆栈对齐。因此,从使用较低首选堆栈边界编译的函数调用使用较高首选堆栈边界编译的函数很可能会使堆栈错位。建议使用回调的库始终使用默认设置。
这种额外的对齐确实会消耗额外的堆栈空间,并且通常会增加代码大小。对堆栈空间使用敏感的代码(例如嵌入式系统和操作系统内核)可能希望将首选对齐减少到 -mpreferred-stack-boundary=2。
将lea
原始堆栈指针(在调用之前main
)加载到中ecx
,因为堆栈指针即将被修改。这有两个用途:
访问函数的参数
main
,因为它们相对于原始堆栈指针在从
main
解决方案 3:
lea ecx,[esp+0x4] ; I assume this is for getting the adress of the first argument of the main...why ?
and esp,0xfffffff0 ; ??? is the compiler trying to align the stack pointer on 16 bytes ???
push DWORD PTR [ecx-0x4] ; I understand the assembler is pushing the return adress....why ?
push ebp
mov ebp,esp
push ecx ;why is ecx pushed too ??
即使每条指令都能完美运行,即使操作数任意对齐,也不会影响速度,对齐仍会提高性能。想象一下,一个循环引用一个 16 字节的数量,该数量刚好与两个缓存行重叠。现在,要将这个小 wchar 加载到缓存中,必须逐出两个完整的缓存行,如果您在同一个循环中需要它们怎么办?缓存比 RAM 快得多,因此缓存性能始终至关重要。
此外,将未对齐的操作数移入寄存器通常会降低速度。鉴于堆栈正在重新对齐,我们自然必须保存旧的对齐方式,以便遍历堆栈帧以获取参数并返回。
ecx 是一个临时寄存器,因此必须保存。此外,根据优化级别,一些似乎对运行程序来说并非绝对必要的帧链接操作可能对设置可跟踪的帧链非常重要。
- 2024年20款好用的项目管理软件推荐,项目管理提效的20个工具和技巧
- 2024年开源项目管理软件有哪些?推荐5款好用的项目管理工具
- 项目管理软件有哪些?推荐7款超好用的项目管理工具
- 项目管理软件哪个最好用?盘点推荐5款好用的项目管理工具
- 项目管理软件有哪些最好用?推荐6款好用的项目管理工具
- 项目管理软件有哪些,盘点推荐国内外超好用的7款项目管理工具
- 2024项目管理软件排行榜(10类常用的项目管理工具全推荐)
- 项目管理软件排行榜:2024年项目经理必备5款开源项目管理软件汇总
- 2024年常用的项目管理软件有哪些?推荐这10款国内外好用的项目管理工具
- 项目管理必备:盘点2024年13款好用的项目管理软件