如何在内联汇编中通过 syscall 或 sysenter 调用系统调用?
- 2024-10-10 09:28:00
- admin 原创
- 208
问题描述:
如何在 x86 Linux 中直接使用 sysenter/syscall 实现系统调用?有人能帮忙吗?如果您还能展示 amd64 平台的代码就更好了。
我知道在 x86 中我们可以使用
__asm__(
" movl $1, %eax
"
" movl $0, %ebx
"
" call *%gs:0x10
"
);
间接路由至 sysenter。
但是我们如何直接使用 sysenter/syscall 编写代码来发出系统调用呢?
我找到了一些资料http://damocles.blogbus.com/tag/sysenter/。但仍然觉得很难弄清楚。
解决方案 1:
首先,您不能安全地使用 GNU C Basicasm("");
语法(没有输入/输出/破坏约束)。您需要扩展 asm 来告诉编译器您修改的寄存器。请参阅GNU C 手册中的内联 asm和内联汇编标签 wiki以获取指向其他指南的链接,以了解诸如"D"(1)
作为asm()
语句的一部分的含义的详细信息。
您还需要asm volatile
,因为这对于具有 1 个或多个输出操作数的扩展语句来说不是隐含的asm
。
我将向您展示如何通过编写一个Hello World!
使用write()
系统调用写入标准输出的程序来执行系统调用。以下是没有实际系统调用实现的程序源代码:
#include <sys/types.h>
ssize_t my_write(int fd, const void *buf, size_t size);
int main(void)
{
const char hello[] = "Hello world!
";
my_write(1, hello, sizeof(hello));
return 0;
}
您可以看到,我将自定义系统调用函数命名为,my_write
以避免与write
libc 提供的“正常”函数发生名称冲突。本答案的其余部分包含my_write
i386 和 amd64 的源代码。
i386
i386 Linux 中的系统调用是使用第 128 个中断向量实现的,例如通过调用int 0x80
汇编代码,当然,需要事先设置相应的参数。也可以通过 执行相同操作SYSENTER
,但实际执行此指令是通过虚拟映射到每个正在运行的进程的 VDSO 实现的。由于SYSENTER
它从来都不是int 0x80
API 的直接替代品,它从不由用户空间应用程序直接执行 - 相反,当应用程序需要访问某些内核代码时,它会调用 VDSO 中的虚拟映射例程(这就是call *%gs:0x10
代码中的 的用途),其中包含支持该指令的所有代码SYSENTER
。由于指令的实际工作方式,所以代码量相当大。
如果您想了解更多信息,请查看此链接。它包含对内核和 VDSO 中应用的技术的简要概述。另请参阅(x86) Linux 系统调用权威指南- 一些系统调用(如getpid
和)非常简单,内核可以导出在用户空间中运行的代码 + 数据,因此 VDSO 永远不需要进入内核,从而使其速度比可能的clock_gettime
速度快得多。sysenter
使用较慢的版本int $0x80
来调用 32 位 ABI 要容易得多。
// i386 Linux
#include <asm/unistd.h> // compile with -m32 for 32 bit call numbers
//#define __NR_write 4
ssize_t my_write(int fd, const void *buf, size_t size)
{
ssize_t ret;
asm volatile
(
"int $0x80"
: "=a" (ret)
: "0"(__NR_write), "b"(fd), "c"(buf), "d"(size)
: "memory" // the kernel dereferences pointer args
);
return ret;
}
可以看出,使用int 0x80
API 相对简单。系统调用的编号存入寄存器eax
,而系统调用所需的所有参数分别存入ebx
、ecx
、edx
、esi
、edi
和ebp
。系统调用号可以通过读取文件 来获取/usr/include/asm/unistd_32.h
。
该函数的原型和描述可以在手册的第 2 部分找到,因此在这种情况下write(2)
。
内核保存/恢复所有寄存器(EAX 除外),因此我们可以将它们用作内联汇编的仅输入操作数。请参阅i386 和 x86-64 上 UNIX 和 Linux 系统调用(和用户空间函数)的调用约定是什么
请记住,clobber 列表还包含memory
参数,这意味着指令列表中列出的指令引用内存(通过buf
参数)。 (输入到内联 asm 的指针并不意味着指向的内存也是输入。请参阅如何指示可以使用内联 ASM 参数指向的内存?)
amd64
在 AMD64 架构上,情况有所不同,它采用了一条名为 的新指令SYSCALL
。它与原始SYSENTER
指令有很大不同,并且绝对更容易从用户空间应用程序使用 -CALL
实际上,它真的很像一个正常的 ,并且将旧指令改编int 0x80
为新SYSCALL
指令非常简单。(除了它使用 RCX 和 R11 而不是内核堆栈来保存用户空间 RIP 和 RFLAGS,以便内核知道返回到哪里)。
在这种情况下,系统调用的编号仍在寄存器中传递,但用于保存参数的rax
寄存器现在几乎符合函数调用约定:rdi
、、、、和按此顺序排列。(rsi
本身会被破坏,所以使用 而不是rdx
,让libc 包装器函数只使用/ 。)r10
`r8r9
syscallrcx` `r10
rcxmov r10, rcx
syscall`
// x86-64 Linux
#include <asm/unistd.h> // compile without -m32 for 64 bit call numbers
// #define __NR_write 1
ssize_t my_write(int fd, const void *buf, size_t size)
{
ssize_t ret;
asm volatile
(
"syscall"
: "=a" (ret)
// EDI RSI RDX
: "0"(__NR_write), "D"(fd), "S"(buf), "d"(size)
: "rcx", "r11", "memory"
);
return ret;
}
(参见Godbolt上的汇编)
请注意,实际上唯一需要更改的是寄存器名称和用于进行调用的实际指令。这主要归功于 gcc 的扩展内联汇编语法提供的输入/输出列表,它会自动提供执行指令列表所需的适当移动指令。
匹配约束"0"(callnum)
可以写成,"a"
因为操作数 0("=a"(ret)
输出)只有一个寄存器可供选择;我们知道它会选择 EAX。使用您认为更清楚的任何一个。
请注意,非 Linux 操作系统(如 MacOS)使用不同的调用号。甚至 32 位的参数传递约定也不同。
解决方案 2:
显式寄存器变量
https://gcc.gnu.org/onlinedocs/gcc-8.2.0/gcc/Explicit-Register-Variables.html#Explicit-Reg-Vars)
我相信这现在应该是优于寄存器约束的推荐方法,因为:
它可以表示所有寄存器,包括和
r8
,用于系统调用参数:如何在 GCC 内联汇编中指定 Intel x86_64 寄存器 r8 到 r15 上的寄存器约束?r9
`r10`对于除 x86 之外的其他 ISA(如 ARM),它是唯一的最佳选择,它们没有魔术寄存器约束名称:如何在 ARM GCC 内联汇编中将单个寄存器指定为约束?(除了使用临时寄存器 + clobbers + 和额外的 mov 指令)
我认为这种语法比使用单字母助记符更具可读性,例如
S -> rsi
寄存器变量例如在 glibc 2.29 中使用,参见:sysdeps/unix/sysv/linux/x86_64/sysdep.h
。
主寄存器
#define _XOPEN_SOURCE 700
#include <inttypes.h>
#include <sys/types.h>
ssize_t my_write(int fd, const void *buf, size_t size) {
register int64_t rax __asm__ ("rax") = 1;
register int rdi __asm__ ("rdi") = fd;
register const void *rsi __asm__ ("rsi") = buf;
register size_t rdx __asm__ ("rdx") = size;
__asm__ __volatile__ (
"syscall"
: "+r" (rax)
: "r" (rdi), "r" (rsi), "r" (rdx)
: "rcx", "r11", "memory"
);
return rax;
}
void my_exit(int exit_status) {
register int64_t rax __asm__ ("rax") = 60;
register int rdi __asm__ ("rdi") = exit_status;
__asm__ __volatile__ (
"syscall"
: "+r" (rax)
: "r" (rdi)
: "rcx", "r11", "memory"
);
}
void _start(void) {
char msg[] = "hello world
";
my_exit(my_write(1, msg, sizeof(msg)) != sizeof(msg));
}
GitHub 上游。
编译并运行:
gcc -O3 -std=c99 -ggdb3 -ffreestanding -nostdlib -Wall -Werror \n -pedantic -o main_reg.out main_reg.c
./main.out
echo $?
输出
hello world
0
为了进行比较,以下类似于如何在内联汇编中通过 syscall 或 sysenter 调用系统调用?产生等效的汇编:
主约束.c
#define _XOPEN_SOURCE 700
#include <inttypes.h>
#include <sys/types.h>
ssize_t my_write(int fd, const void *buf, size_t size) {
ssize_t ret;
__asm__ __volatile__ (
"syscall"
: "=a" (ret)
: "0" (1), "D" (fd), "S" (buf), "d" (size)
: "rcx", "r11", "memory"
);
return ret;
}
void my_exit(int exit_status) {
ssize_t ret;
__asm__ __volatile__ (
"syscall"
: "=a" (ret)
: "0" (60), "D" (exit_status)
: "rcx", "r11", "memory"
);
}
void _start(void) {
char msg[] = "hello world
";
my_exit(my_write(1, msg, sizeof(msg)) != sizeof(msg));
}
GitHub 上游。
拆卸两者:
objdump -d main_reg.out
几乎完全相同,以下是其中main_reg.c
之一:
Disassembly of section .text:
0000000000001000 <my_write>:
1000: b8 01 00 00 00 mov $0x1,%eax
1005: 0f 05 syscall
1007: c3 retq
1008: 0f 1f 84 00 00 00 00 nopl 0x0(%rax,%rax,1)
100f: 00
0000000000001010 <my_exit>:
1010: b8 3c 00 00 00 mov $0x3c,%eax
1015: 0f 05 syscall
1017: c3 retq
1018: 0f 1f 84 00 00 00 00 nopl 0x0(%rax,%rax,1)
101f: 00
0000000000001020 <_start>:
1020: c6 44 24 ff 00 movb $0x0,-0x1(%rsp)
1025: bf 01 00 00 00 mov $0x1,%edi
102a: 48 8d 74 24 f3 lea -0xd(%rsp),%rsi
102f: 48 b8 68 65 6c 6c 6f movabs $0x6f77206f6c6c6568,%rax
1036: 20 77 6f
1039: 48 89 44 24 f3 mov %rax,-0xd(%rsp)
103e: ba 0d 00 00 00 mov $0xd,%edx
1043: b8 01 00 00 00 mov $0x1,%eax
1048: c7 44 24 fb 72 6c 64 movl $0xa646c72,-0x5(%rsp)
104f: 0a
1050: 0f 05 syscall
1052: 31 ff xor %edi,%edi
1054: 48 83 f8 0d cmp $0xd,%rax
1058: b8 3c 00 00 00 mov $0x3c,%eax
105d: 40 0f 95 c7 setne %dil
1061: 0f 05 syscall
1063: c3 retq
因此我们看到 GCC 按要求内联了那些微小的系统调用函数。
my_write
和my_exit
两者相同,但_start
略有main_constraint.c
不同:
0000000000001020 <_start>:
1020: c6 44 24 ff 00 movb $0x0,-0x1(%rsp)
1025: 48 8d 74 24 f3 lea -0xd(%rsp),%rsi
102a: ba 0d 00 00 00 mov $0xd,%edx
102f: 48 b8 68 65 6c 6c 6f movabs $0x6f77206f6c6c6568,%rax
1036: 20 77 6f
1039: 48 89 44 24 f3 mov %rax,-0xd(%rsp)
103e: b8 01 00 00 00 mov $0x1,%eax
1043: c7 44 24 fb 72 6c 64 movl $0xa646c72,-0x5(%rsp)
104a: 0a
104b: 89 c7 mov %eax,%edi
104d: 0f 05 syscall
104f: 31 ff xor %edi,%edi
1051: 48 83 f8 0d cmp $0xd,%rax
1055: b8 3c 00 00 00 mov $0x3c,%eax
105a: 40 0f 95 c7 setne %dil
105e: 0f 05 syscall
1060: c3 retq
有趣的是,在这种情况下,GCC 通过选择找到了稍短的等效编码:
104b: 89 c7 mov %eax,%edi
将 设置fd
为1
,它等于1
系统调用号中的 ,而不是更直接的:
1025: bf 01 00 00 00 mov $0x1,%edi
有关调用约定的深入讨论,另请参阅:i386 和 x86-64 上 UNIX 和 Linux 系统调用(以及用户空间函数)的调用约定是什么
在 Ubuntu 18.10、GCC 8.2.0 中测试。