调试在客户机器上生成的核心文件

2024-10-09 09:11:00
admin
原创
102
摘要:问题描述:我们通过在客户的机器上运行我们的软件来获取核心文件。不幸的是,由于我们一直使用 -O2 进行编译而不使用调试符号,这导致我们无法弄清楚它崩溃的原因,我们修改了构建,现在它们一起生成 -g 和 -O2。然后我们建议客户运行 -g 二进制文件,这样调试起来就更容易了。我有几个问题:如果核心文件是从我们在...

问题描述:

我们通过在客户的机器上运行我们的软件来获取核心文件。不幸的是,由于我们一直使用 -O2 进行编译而不使用调试符号,这导致我们无法弄清楚它崩溃的原因,我们修改了构建,现在它们一起生成 -g 和 -O2。然后我们建议客户运行 -g 二进制文件,这样调试起来就更容易了。

我有几个问题:

  1. 如果核心文件是从我们在 Dev 中运行的 Linux 发行版以外的发行版生成的,会发生什么情况?堆栈跟踪是否有意义?

  2. 有没有关于 Linux 或 Solaris 调试的好书?以示例为导向的书会很棒。我正在寻找现实生活中的例子来弄清楚程序崩溃的原因以及作者如何找到解决方案。一些更中级到高级水平的书会很好,因为我已经这样做了一段时间了。一些汇编也很好。

下面是一个崩溃示例,需要我们告诉客户获取二进制文件的 -g 版本:

Program terminated with signal 11, Segmentation fault.
#0  0xffffe410 in __kernel_vsyscall ()
(gdb) where
#0  0xffffe410 in __kernel_vsyscall ()
#1  0x00454ff1 in select () from /lib/libc.so.6
...
<omitted frames>

理想情况下,我想解决并找出应用程序崩溃的确切原因 - 我怀疑是内存损坏,但我不是 100%确定。

严格禁止远程调试。

谢谢


解决方案 1:

如果核心文件是从我们在 Dev 中运行的 Linux 发行版以外的发行版生成的,会发生什么情况?堆栈跟踪是否有意义?

如果可执行文件是动态链接的(就像您的一样),那么 GDB 生成的堆栈(很可能)将没有意义。

原因:GDB 知道您的可执行文件因libc.so.6在地址处调用某些内容而崩溃0x00454ff1,但它不知道该地址处的代码是什么。因此,它会查看您的副本libc.so.6并发现这是在中select,因此它会打印该内容。

但是,客户副本0x00454ff1中也包含该地址的可能性很小。最有可能的是,客户在该地址上执行了其他操作。libc.so.6`abort`

您可以使用disas select,并观察 是否0x00454ff1位于指令中间,或者前一个指令不是CALL。如果其中任何一个成立,您的堆栈跟踪就毫无意义。

不过,您可以自行解决:您只需从客户系统获取列出的所有库的副本即可(gdb) info shared。让客户使用例如

cd /
tar cvzf to-you.tar.gz lib/libc.so.6 lib/ld-linux.so.2 ...

然后,在您的系统上:

mkdir /tmp/from-customer
tar xzf to-you.tar.gz -C /tmp/from-customer
gdb /path/to/binary
(gdb) set solib-absolute-prefix /tmp/from-customer
(gdb) core core  # Note: very important to set solib-... before loading core
(gdb) where      # Get meaningful stack trace!

然后,我们建议客户运行 -g 二进制文件,以便更容易调试。

一个更好的方法是:

  • 建立-g -O2 -o myexe.dbg

  • strip -g myexe.dbg -o myexe

  • 分发给myexe顾客

  • 当客户收到时core,使用它myexe.dbg来调试它

您将拥有完整的符号信息(文件/行、局部变量),而无需向客户发送特殊的二进制文件,也不会透露太多有关您的来源的详细信息。

解决方案 2:

您确实可以从崩溃转储中获得有用的信息,即使是从优化编译中获得的信息(尽管从技术上讲,这被称为“非常麻烦”)。-g编译确实更好,是的,即使发生转储的机器是另一个发行版,您也可以这样做。基本上,有一个警告,所有重要信息都包含在可执行文件中,并最终出现在转储中。

当您将核心文件与可执行文件匹配时,调试器将能够告诉您崩溃发生的位置并向您显示堆栈。这本身应该会很有帮助。您还应该尽可能多地了解它发生的情况——他们能可靠地重现它吗?如果可以,你能重现它吗?

现在,这里有一个警告:“一切都在那里”的概念在共享对象文件、.so文件方面不成立。如果由于这些问题而失败,您将无法获得所需的符号表;您可能只能看到.so它发生在哪个库中。

关于调试的书籍有很多,但是我想不出一本可以推荐。

解决方案 3:

从我的问题中复制解决方案,该解决方案被认为是重复的。

set solib-absolute-prefix从接受的解决方案对我没有帮助。set sysroot绝对有必要让 gdb 加载本地提供的库。以下是我用来打开核心转储的命令列表:

# note: all the .so files obtained from user machine must be put into local directory.
#
# most importantly, the following files are necessary:
#   1. libthread_db.so.1 and libpthread.so.0: required for thread debugging.
#   2. other .so files are required if they occur in call stack.
#
# these files must also be renamed exactly as the symlinks
# i.e. libpthread-2.28.so should be renamed to libpthread.so.0

# load executable file
file ./thedarkmod.x64

# force gdb to forget about local system!
# load all .so files using local directory as root
set sysroot .

# drop dump-recorded paths to .so files
# i.e. load ./libpthread.so.0 instead of ./lib/x86_64-linux-gnu/libpthread.so.0
set solib-search-path .
# disable damn security protection
set auto-load safe-path /

# load core dump file
core core.6487

# print stacktrace
bt

解决方案 4:

据我所记得,您不需要要求客户使用带 -g 选项构建的二进制文件运行。您需要的是您应该有一个带 -g 选项的构建。这样您就可以加载核心文件,它将显示整个堆栈跟踪。我记得几周前,我创建了核心文件,有构建(-g)和没有构建(-g),核心的大小相同。

解决方案 5:

检查遍历堆栈时看到的局部变量的值?特别是在 select() 调用附近。在客户的机器上执行此操作,只需加载转储并遍历堆栈...

另外,检查 DEV 和 PROD 平台上 FD_SETSIZE 的值!

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   681  
  在项目管理领域,集成产品开发(IPD)流程以其高效、协同的特点,被众多企业视为提升产品竞争力的关键。IPD流程强调跨部门、跨职能的紧密合作,以确保产品从概念到市场各个环节的无缝衔接。然而,实现这一目标并非易事,它需要企业深刻理解并掌握IPD流程中的跨部门协作艺术。本文将深入探讨IPD流程中跨部门协作的三个关键点,旨在为...
IPD项目管理咨询   9  
  掌握IPD流程图:提升团队协作的关键路径在当今快速变化的商业环境中,团队协作的效率与效果直接关系到项目的成功与否。集成产品开发(Integrated Product Development,简称IPD)作为一种先进的研发管理理念,通过跨部门、跨领域的协同工作,能够显著提升产品开发的速度与质量。而IPD流程图,则是这一理...
IPD流程阶段   9  
  IPD流程概述:理解其核心价值与实施背景集成产品开发(Integrated Product Development,简称IPD)是一种先进的产品开发管理理念,它强调跨部门协作、市场导向和快速响应变化的能力。IPD流程不仅关注产品本身的技术创新,更注重将市场、研发、生产、销售等各个环节紧密集成,以实现产品从概念到市场的高...
华为IPD是什么   7  
  在项目管理领域,IPD(Integrated Product Development,集成产品开发)流程以其跨部门协作、高效决策和快速响应市场变化的特点,被众多企业视为提升竞争力的关键。然而,实践IPD流程并非易事,项目管理中的种种错误往往阻碍了其效果的充分发挥。本文旨在深入探讨如何在实施IPD流程时避免这些常见错误,...
IPD框架   7  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用