Next Previous Contents

5. 除错与监管

5.1 预防重于治疗(lint)

lint对Linux而言并没有很广泛的用途,主要是因为大部份的人都能满足于gcc所提供的警告信息。可能最有用的就是-Wall参数了---这个参数的用途是要求gcc将所有的警告信息显现出来;but probably has more mnemonic value if thought of as the thing you bang your head against.

网路上有一个实用的public domain lint,位于 ftp://larch.lcs.mit.edu/pub/Larch/lclint。我并不知道这个站到底有多好就是了。

5.2 除错

我要怎样做才能将除错信息放到一支程序里头?

你需要添加-g的参数来编译与连结程序,而且不可以用-fomit-frame-pointer参数。事实上,你不需要重新编译所有的程序,只需重新编译目前你正在除错的部份即可。

就a.out的组态而言,共享程序库是以-fomit-frame-pointer编译而成,这个时候,gdb就变得英雄无用武之地了。连结时给定-g的选项,应该就隐含著静态连结的意义了;这就是为什么要加-g的原因了。

如果连结器连结失败,告诉你找不到libg.a,那就是在/usr/lib/的目录底下,少了libg.a。libg.a是一个C语言很特别的侦错程序库。一般在libc的套件内就会提供libg.a;不然的话(新版是这样的),你可能需要拿libc的原始码自己设置了,不过,实际上你应该不需要才对。不管是什么目的,大部份的情况下,只需将libg.a连结到/usr/lib/libc.a,你就能得到足够的信息了。

那,能不能把除错信息给拿掉?

很多的GNU软件在编译连结时,都会设定-g的选项;这样做会造成执行档过大的问题(通常是静态的连结)。实际上,这并不是一个很热门的想法。

如果程序本身有autoconf,产生了configure命令稿,通常你就可以用./configure CFLAGS=或是./configure CFLAGS=-O2来关掉除错信息。不然的话,你得检查检查Makefile了。当然啦,假如你用的是ELF,程序便会以动态的方式来连结,不论是否有-g的设定;因此你可以平常心把-g拿掉

实用的软件

据瞭解,大部份的人都是用gdb来除错。你可以从 GNU archive sites拿到原始程序;或者是到 tsx-11拿可执行档。xxgdb是一个X界面的除错程序,植基于gdb(也就是说你得先安装好gdb,才能再装xxgdb)。xxgdb的原始码可以在 ftp://ftp.x.org/contrib/xxgdb-1.08.tar.gz找到。

另外,UPS除错程序已由Rick Sladkey移植成功。UPS可以在X底下活得很好,不像xxgdb那样---仅仅是gdb的X前端界面(X front end)。这支除错程序有一大堆优良的特点,而且如果你得花时间去除一支破烂的程序,建议你考虑考虑xxgdb。事先编译好的Linux版与修正版的原始码可以在 ftp://sunsite.unc.edu/pub/Linux/devel/debuggers/找到。而最初的原始程序则放在 ftp://ftp.x.org/contrib/ups-2.45.2.tar.Z

你可能会发现另一个用来除错的工具strace,也是相当的有用。它可以显示出由程序所产生的系统呼叫,而且还拥有其它众多繁复的功能,像是如果你手边没有原始码的话,strace可以帮你找出有哪些路径名称(path-names)已编译进执行档内; exacerbating race conditions in programs that you suspect contain them;还有,strace可拿来学习程序是怎么在电脑中执行的。最新的版本(目前是3.0.8)可在找到 ftp://ftp.std.com/pub/jrs/

背景程序(常驻程序)

早期典型的常驻程序(daemon programs)是执行fork(),然后终止父程序。这样的做法使得除错的时间减短了。

瞭解这点的最简单的方法就是替fork()设一个中断点(breakpoint)。当程序停止时,强迫fork()传回0。

(gdb) list 
1       #include <stdio.h>
2
3       main()
4       {
5         if(fork()==0) printf("child\n");
6         else printf("parent\n");
7       }
(gdb) break fork
Breakpoint 1 at 0x80003b8
(gdb) run
Starting program: /home/dan/src/hello/./fork 
Breakpoint 1 at 0x400177c4

Breakpoint 1, 0x400177c4 in fork ()
(gdb) return 0
Make selected stack frame return now? (y or n) y
#0  0x80004a8 in main ()
    at fork.c:5
5         if(fork()==0) printf("child\n");
(gdb) next
Single stepping until exit from function fork, 
which has no line number information.
child
7       }

核心文档

当Linux开机时,通常组态会设定成不要产生核心文档。要是你那么喜欢它们的话,可以用shell的builtin命令使其重新生效:就C-shell兼容的shell(如tcsh)而言,会是下面这样:

% limit core unlimited
而类似Bourne shell的shell(sh, bash, zsh, pdksh)则使用下面的语法:
$ ulimit -c unlimited

如果你想要有个多才多艺的核心档命名(core file naming)(for example, if you're trying to conduct a post-mortem using a debugger that's buggy itself),那么你可以对你的核心程序做一点小小的更动。找一找fs/binfmt_aout.cfs/binfmt_elf.c档中与下列相符的程序片段(in newer kernels, you'll have to grep around a little in older ones):

        memcpy(corefile,"core.",5);
#if 0
        memcpy(corefile+5,current->comm,sizeof(current->comm));
#else
        corefile[4] = '\0';
#endif

0换成1.

5.3 监管

监管(Profiling)是用来检核一支程序中哪些部份是最常呼叫或是执行的时间最久的方法。这对程序的最佳化与找出何时时间是浪费掉的而言,是相当好的方式。你必须就你所要的时程信息(timing information)的目的档加上-p来编译,而且如果要让输出的文档有意义,你也会需要gprof(来自binutils套件的命令)。参阅gprof的manual page,可得知其细节。

11/18/97译


Next Previous Contents