GDB调试学习(一):单步执行和跟踪函数调用

简介: GDB调试学习(一):单步执行和跟踪函数调用

前言

程序中除了一目了然的Bug之外都需要一定的调试手段来分析到底错在哪。到目前为止我们的调试手段只有一种:根据程序执行时的出错现象假设错误原因,然后在代码中适当的位置插入printf,执行程序并分析打印结果,如果结果和预期的一样,基本上证明了自己假设的错误原因,就可以动手修正Bug了,如果结果和预期的不一样,就根据结果做进一步的假设和分析。

本文我们介绍一种很强大的调试工具gdb,可以完全操控程序的运行,使得程序就像你手里的玩具一样,叫它走就走,叫它停就停,并且随时可以查看程序中所有的内部状态,比如各变量的值、传给函数的参数、当前执行的代码行等。掌握了gdb的用法之后,调试手段就更加丰富了。

但要注意,即使调试手段丰富了,**调试的基本思想仍然是“分析现象→假设错误原因→产生新的现象去验证假设”这样一个循环,根据现象如何假设错误原因,**以及如何设计新的现象去验证假设,这都需要非常严密的分析和思考,如果因为手里有了强大的工具就滥用而忽略了分析过程,往往会治标不治本地修正Bug,导致一个错误现象消失了但Bug仍然存在,甚至是把程序越改越错。

本文通过初学者易犯的几个错误实例来讲解如何使用gdb调试程序,在每个实例后面总结一部分常用的gdb命令。

1 单步执行和跟踪函数调用

#include <stdio.h>
      int add_range(int low, int high)
      {
              int i, sum;
              for (i = low; i <= high; i++)
                    sum = sum + i;
              return sum;
      }
      int main(void)
      {
              int result[1000];
              result[0] = add_range(1, 10);
              result[1] = add_range(1, 100);
              printf("result[0]=%d\nresult[1]=%d\n", result[0],
              result[1]);
              return 0;
      }

add_range函数从low加到high,在main函数中首先从1加到10,把结果保存下来,然后从1加到100,再把结果保存下来,最后打印的两个结果是:

result[0]=55
      result[1]=5105

第一个结果正确,第二个结果显然不正确[插图],在小学我们就听说过高斯小时候的故事,从1加到100应该是5050。

一段代码,第一次运行结果是对的,第二次运行却不对,这是很常见的一类错误现象,这种情况一方面要怀疑代码,另一方面更要怀疑数据:第一次和第二次运行的都是同一段代码,如果代码是错的,那第一次的结果为什么能对呢?

很可能是第二次运行时相关的状态数据错了,错误的数据导致了错误的结果。在动手调试之前,读者先试试只看代码能不能看出错误原因,只要前面几章学得扎实就应该能看出来。

在编译时要加上-g选项,生成的可执行文件才能用gdb进行源码级调试:

$ gcc -g main.c -o main
      $ gdb main
      GNU gdb (GDB) 7.1-ubuntu
      Copyright (C) 2010 Free Software Foundation, Inc.
      License GPLv3+:GNU GPL version 3 or later<http://gnu.org/licenses/gpl.html>
      This is free software: you are free to change and redistribute it.
      There is NO WARRANTY, to the extent permitted by law.  Type "show copying"
      and "show warranty" for details.
      This GDB was configured as "i486-linux-gnu".
      For bug reporting instructions, please see:
      <http://www.gnu.org/software/gdb/bugs/>...
      Reading symbols from /home/akaedu/main...done.
      (gdb)

-g选项的作用是在可执行文件中加入源代码的信息,比如可执行文件中第几条机器指令对应源代码的第几行,但并不是把整个源文件嵌入到可执行文件中,所以在调试时必须保证gdb能找到源文件。

gdb提供一个类似Shell的命令行环境,上面的(gdb)就是提示符,在这个提示符下输入help可以查看命令的类别:

(gdb) help
      List of classes of commands:
      aliases -- Aliases of other commands
      breakpoints -- Making program stop at certain points
      data -- Examining data
      files -- Specifying and examining files
      internals -- Maintenance commands
      obscure -- Obscure features
      running -- Running the program
      stack -- Examining the stack
      status -- Status inquiries
      support -- Support facilities
      tracepoints -- Tracing of program execution without stopping the program
      user-defined -- User-defined commands
      Type "help" followed by a class name for a list of commands in that class.
      Type "help all" for the list of all commands.
      Type "help" followed by command name for full documentation.
      Type "apropos word" to search for commands related to "word".
      Command name abbreviations are allowed if unambiguous.

也可以进一步查看某一类别中有哪些命令,例如查看files类别下有哪些命令可用:

(gdb) help files
      Specifying and examining files.
      List of commands:
      add-symbol-file -- Load symbols from FILE
      add-symbol-file-from-memory -- Load the symbols out of memory from a dynamically loaded object file
      cd -- Set working directory to DIR for debugger and program being debugged
      core-file--Use FILE as core dump for examining memory and registers
      directory--Add directory DIR to beginning of search path for source files
      edit -- Edit specified file or function
      exec-file -- Use FILE as program for getting contents of pure memory
      file -- Use FILE as program to be debugged
      forward-search -- Search for regular expression (see regex(3)) from last line listed
      generate-core-file -- Save a core file with the current state of the debugged process
      list -- List specified function or line
      ...

现在试试用list命令从第一行开始列出源代码:

(gdb) list 1
      1      #include <stdio.h>
      2
      3      int add_range(int low, int high)
      4      {
      5                int i, sum;
      6                for (i = low; i <= high; i++)
      7                       sum = sum + i;
      8                return sum;
      9      }
      10

一次只列10行,如果要从第11行开始继续列源代码可以再输入一次

(gdb) list

也可以什么都不输直接敲回车,gdb提供了一个很方便的功能,在提示符下直接敲回车表示重复上一条命令。

(gdb)(直接回车)
      11     int main(void)
      12     {
      13             int result[1000];
      14             result[0] = add_range(1, 10);
      15             result[1] = add_range(1, 100);
      16             printf("result[0]=%d\nresult[1]=%d\n", result[0],
                    result[1]);
      17             return 0;
      18     }

gdb的很多常用命令有简写形式,例如list命令可以写成l,要列一个函数的源代码也可以用函数名做参数:

(gdb) l add_range
      1       #include <stdio.h>
      2
      3       int add_range(int low, int high)
      4   {
      5                int i, sum;
      6                for (i = low; i <= high; i++)
      7                       sum = sum + i;
      8                return sum;
      9       }
      10

现在退出gdb的环境:

(gdb) quit

我们做一个实验,把源代码改名或移到别处再用gdb调试,这样就列不出源代码了:

$ mv main.c mian.c
      $ gdb main
      ...
      (gdb) l
      5      main.c: No such file or directory.
            in main.c

可见gcc的-g选项并不是把源代码嵌入到可执行文件中,在调试时也需要源文件。现在把源代码恢复原样,我们继续调试。首先用start命令开始执行程序:

$ gdb main
      ...
      (gdb) start
      Temporary breakpoint 1 at 0x8048415: file main.c, line 14.
      Starting program: /home/akaedu/main
      Temporary breakpoint 1, main () at main.c:14
      14              result[0] = add_range(1, 10);
      (gdb)

gdb停在main函数中变量定义之后的第一条语句处等待我们发命令,gdb列出的这条语句是即将执行的下一条语句。我们可以用next命令(简写为n)控制这些语句一条一条地执行:

(gdb) n
      15              result[1] = add_range(1, 100);
      (gdb)(直接回车)
      16              printf("result[0]=%d\nresult[1]=%d\n",result[0],
                      result[1]);
      (gdb)(直接回车)
      result[0]=55
      result[1]=5105
      17              return 0;

用n命令依次执行两行赋值语句和一行打印语句,在执行打印语句时结果立刻打出来了,然后停在return语句之前等待我们发命令。虽

然我们完全控制了程序的执行,但仍然看不出哪里错了,因为错误不在main函数中而在add_range函数中,现在用start命令重新来过,这次用step命令(简写为s)钻进add_range函数中去跟踪执行:

(gdb) start
      The program being debugged has been started already.
      Start it from the beginning? (y or n) y
      Temporary breakpoint 2 at 0x8048415: file main.c, line 14.
      Starting program: /home/akaedu/main
      Temporary breakpoint 2, main () at main.c:14
      14              result[0] = add_range(1, 10);
      (gdb) s
      add_range (low=1, high=10) at main.c:6
      6               for (i = low; i <= high; i++)

这次停在了add_range函数中变量定义之后的第一条语句处。

在函数中有几种查看状态的办法,backtrace命令(简写为bt)可以查看函数调用的栈帧:

(gdb) bt
      #0  add_range (low=1, high=10) at main.c:6
      #1  0x08048429 in main () at main.c:14

可见当前的add_range函数是被main函数调用的,main传进来的参数是low=1,high=10。

main函数的栈帧编号为1,add_range的栈帧编号为0。现在可以用info命令(简写为i)查看add_range函数局部变量的值:

(gdb) i locals
      i = 0
      sum = 0

如果想查看main函数当前局部变量的值也可以做到,先用frame命令(简写为f)选择1号栈帧然后再查看局部变量:

(gdb) f 1
      #1  0x08048429 in main () at main.c:14
      14      result[0] = add_range(1, 10);
      (gdb) i locals
      result={0<repeats 517 times>,1180510,0,0,0,0,0,0,-1207961512,-1073746824, 1228788, -1073746376,
      ...

注意到result数组中很多元素具有杂乱无章的值,我们知道未经初始化的局部变量具有不确定的值。

到目前为止一切正常。用s或n往下走几步,然后用print命令(简写为p)打印出变量sum的值:

(gdb) s
      7                       sum = sum + i;
      (gdb)(直接回车)
      6               for (i = low; i <= high; i++)
      (gdb)(直接回车)
      7                       sum = sum + i;
      (gdb)(直接回车)
      6               for (i = low; i <= high; i++)
      (gdb) p sum
      $1 = 3

第一次循环i是1,第二次循环i是2,加起来是3,没错。

这里的1 表示 g d b 保存着这些中间结果, 1表示gdb保存着这些中间结果,1表示gdb保存着这些中间结果,后面的编号会自动增长,在命令中可以用$1、$2、$3等编号代替相应的值。

由于我们本来就知道第一次调用的结果是正确的,再往下跟也没意义了,可以用finish命令让程序一直运行到从当前函数返回为止:

(gdb) finish
      Run till exit from #0  add_range (low=1, high=10) at main.c:6
      0x08048429 in main () at main.c:14
      14              result[0] = add_range(1, 10);
      Value returned is $2 = 55

返回值是55,当前正准备执行赋值操作,用s命令赋值,然后查看result数组:

(gdb) s
      15              result[1] = add_range(1, 100);
      (gdb) p result
      $3={55,0<repeats 516 times>,1180510,0,0,0,0,0,0,-1207961512,
      -1073746824, 1228788, -1073746376,
      ...

第一个值55确实赋给了result数组的第0个元素。下面用s命令进入第二次add_range调用,进入之后首先查看参数和局部变量:

(gdb) s
      add_range (low=1, high=100) at main.c:6
      6       for (i = low; i <= high; i++)
      (gdb) bt
      #0  add_range (low=1, high=100) at main.c:6
      #1  0x08048441 in main () at main.c:15
      (gdb) i locals
      i = 11
      sum = 55

由于局部变量i和sum没初始化,所以具有不确定的值,又由于两次调用是挨着的,i和sum正好取了上次调用时的值。

只不过我这次举的例子设法让局部变量sum在第一次调用时初值为0而第二次调用时初值不为0。i的初值不确定没关系,在for循环中首先会把i赋值为low,但sum如果初值不是0,累加得到的结果就错了。

好了,我们已经找到错误原因,可以退出gdb修改源代码了。如果我们不想浪费这次调试机会,可以在gdb中马上把sum的初值改为0继续运行,看看这一处改了之后还有没有别的Bug:

(gdb) set var sum=0
      (gdb) finish
      Run till exit from #0  add_range (low=1, high=100) at main.c:6
      0x08048441 in main () at main.c:15
      15              result[1] = add_range(1, 100);
      Value returned is $4 = 5050
      (gdb) n
      16              printf("result[0]=%d\nresult[1]=%d\n",result[0],
                      result[1]);
      (gdb)(直接回车)
      result[0]=55
      result[1]=5050
      17              return 0;

这样结果就对了。

修改变量的值除了用set命令之外也可以用print命令,因为print命令后面跟的是表达式,而我们知道赋值和函数调用也都是表达式,所以也可以用print命令修改变量的值或者调用函数:

(gdb) p result[2]=33
      $5 = 33
      (gdb) p printf("result[2]=%d\n", result[2])
      result[2]=33
      $6 = 13

我们讲过,printf的返回值表示实际打印的字符数,所以$6的结果是13。总结一下本节用到的gdb命令,如表所示。

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
目录
相关文章
|
8月前
|
NoSQL 搜索推荐 openCL
【C/C++ 调试 GDB指南 】gdb调试基本操作
【C/C++ 调试 GDB指南 】gdb调试基本操作
431 2
|
8月前
|
NoSQL Linux 开发工具
【深入解析git和gdb:版本控制与调试利器的终极指南】(下)
【深入解析git和gdb:版本控制与调试利器的终极指南】
108 0
|
2月前
|
NoSQL 编译器 C语言
C语言调试是开发中的重要技能,涵盖基本技巧如打印输出、断点调试和单步执行,以及使用GCC、GDB、Visual Studio和Eclipse CDT等工具。
C语言调试是开发中的重要技能,涵盖基本技巧如打印输出、断点调试和单步执行,以及使用GCC、GDB、Visual Studio和Eclipse CDT等工具。高级技巧包括内存检查、性能分析和符号调试。通过实践案例学习如何有效定位和解决问题,同时注意保持耐心、合理利用工具、记录过程并避免过度调试,以提高编程能力和开发效率。
53 1
|
5月前
|
NoSQL Linux C语言
Linux GDB 调试
Linux GDB 调试
73 10
|
5月前
|
NoSQL Linux C语言
嵌入式GDB调试Linux C程序或交叉编译(开发板)
【8月更文挑战第24天】本文档介绍了如何在嵌入式环境下使用GDB调试Linux C程序及进行交叉编译。调试步骤包括:编译程序时加入`-g`选项以生成调试信息;启动GDB并加载程序;设置断点;运行程序至断点;单步执行代码;查看变量值;继续执行或退出GDB。对于交叉编译,需安装对应架构的交叉编译工具链,配置编译环境,使用工具链编译程序,并将程序传输到开发板进行调试。过程中可能遇到工具链不匹配等问题,需针对性解决。
181 3
|
5月前
|
NoSQL
技术分享:如何使用GDB调试不带调试信息的可执行程序
【8月更文挑战第27天】在软件开发和调试过程中,我们有时会遇到需要调试没有调试信息的可执行程序的情况。这可能是由于程序在编译时没有加入调试信息,或者调试信息被剥离了。然而,即使面对这样的挑战,GDB(GNU Debugger)仍然提供了一些方法和技术来帮助我们进行调试。以下将详细介绍如何使用GDB调试不带调试信息的可执行程序。
152 0
|
7月前
|
NoSQL Linux C语言
Linux gdb调试的时候没有对应的c调试信息库怎么办?
Linux gdb调试的时候没有对应的c调试信息库怎么办?
57 1
|
7月前
|
NoSQL Linux C语言
Linux gdb调试的时候没有对应的c调试信息库怎么办?
Linux gdb调试的时候没有对应的c调试信息库怎么办?
40 0
|
7月前
|
NoSQL Linux C++
Linux C/C++ gdb调试正在运行的程序
Linux C/C++ gdb调试正在运行的程序
|
7月前
|
NoSQL Linux C++
Linux C/C++ gdb调试core文件
Linux C/C++ gdb调试core文件