Next Previous Contents

4. 移植程序与编译程序

4.1 gcc自行定义的符号

只要执行gcc时,附加 -v这个参数,就能找出你所用的这版gcc,自动帮你定义了什么符号。例如,我的机器看起来会像这样:

$ echo 'main(){printf("hello world\n");}' | gcc -E -v -
Reading specs from /usr/lib/gcc-lib/i486-box-linux/2.7.2/specs
gcc version 2.7.2
 /usr/lib/gcc-lib/i486-box-linux/2.7.2/cpp -lang-c -v -undef
-D__GNUC__=2 -D__GNUC_MINOR__=7 -D__ELF__ -Dunix -Di386 -Dlinux
-D__ELF__ -D__unix__ -D__i386__ -D__linux__ -D__unix -D__i386
-D__linux -Asystem(unix) -Asystem(posix) -Acpu(i386)
-Amachine(i386) -D__i486__ -

假若你正在写的程序码会用到一些Linux独有的特性,那么把哪些无法移植的程序码,以条件式编译的前置命令封括起来,可是个不错的主意呢!如下所示︰

#ifdef __linux__
/* ... funky stuff ... */
#endif /* linux */

__linux__就可以达成目的;看仔细一点,不是linux喔。尽管linux也有定义,毕竟,这个仍然不是POSIX的标准。

4.2 线上求助说明

gcc编译器参数的说明文件是gcc info page(在Emacs内,按下C-h i,然后选?gcc'的选项)。要是弄不出来,不是卖你CD-ROM的人没把这个东东压给你,不然就是你现在用的是旧版的。遇到这种情况,最好的方法是移动尊臀到archive ftp://prep.ai.mit.edu/pub/gnu或是它的mirrors站台,去把gcc的原始文档抓回家,重新烹饪一番。

gcc manual page(gcc.1) 可以说是已经过时了,要是你吃饱了撑著没事干硬是想看,它就会告诉你说别无聊了。

旗正飘飘 

在命令列上执行gcc时,只要在它的屁股后面加上-On的选项,就能让gcc乖乖的替你生出最佳编码的机器码。这里的n是一个可有可无的小整数,不同版本的gcc,n的意义与其正确的功效都不一样,不过,典型的范围是从0(不要鸡婆,我不要最佳编码。)变化到2(最佳编码要多一点。),再升级到3(最佳编码要再多一点,多一点)。

gcc在其内部会将这些数字转译成一系列的-f-m的选项。执行gcc时带上旗号-v-Q,你就能很清楚的看出每一种等级的-O是对应到哪些选项。好比说,就-O2来讲,我的gcc告诉会我说:

enabled: -fdefer-pop -fcse-follow-jumps -fcse-skip-blocks
-fexpensive-optimizations
         -fthread-jumps -fpeephole -fforce-mem -ffunction-cse -finline
         -fcaller-saves -fpcc-struct-return -frerun-cse-after-loop
         -fcommon -fgnu-linker -m80387 -mhard-float -mno-soft-float
         -mno-386 -m486 -mieee-fp -mfp-ret-in-387

要是你用的最佳编码等级高于你的编译器所能支持的(e.g. -O6),那么它的效果就跟你用你的编译器所能提供的最高等级的效果是一样的。说实在的,发行出去的gcc程序码,用在编译时竟是如此处理这等问题,真的不是什么好的构想。日后若是有更进步的最佳编码方法具体整合到新的版本里,而你(或是你的users)还是试著这样做的话,可能就会发现gcc会中断你的程序了。

从gcc 2.7.0升级到2.7.2的users应该注意一点,使用-O2时会有一个bug。更糟糕的是,强度折减参数(strength reduction)居然没有用!要是你喜欢重新编译gcc的话,是有那么一个修正的版本可以更正这项错误;不然的话,一定要确定每次编译时都有加上-fno-strength-reduce喔!

11/12/97译

有个性的微处理器

有一些-m的旗号十分有用处,但是却无法藉由各种等级的-O打开来使用。这之中最重要的有是-m386-m486这两种,用来告诉gcc该把正在编译的程序码视作专为386或是486机器所写的。不论是用哪一种-m来编译程序码,都可以在彼此的机器上执行,-m486编译出来的码会比较大,不过拿来在386的机器上跑也不会比较慢就是了。

目前尚无-mpentium或是-m586的旗号。Linus建议我们可以用-m486 -malign-loops=2 -malign-jumps=2 -malign-functions=2来得到最佳编码的486程序码,这样做正好就可以避免alignment(Pentium并不需要)有过大的gaps发生。Michael Meissner说:

我的第六感告诉我,-mno-strength-reduce(嘿!要晓得我可不是在谈强度折减参数的bug呀,那已经是另外一个争论的战场了。)一样也可以在x86的机器上产生较快的程序码,这是因为x86的机器对暂存器有著不可磨灭的饥渴在,而且GCC's method of grouping registers into spill registers vs. other registers doesn't help either。传统上,强度折减的结果会使得编译器去利用加法暂存器以加法运算来取代乘法运算。事实上,我在怀疑-fcaller-saves可能也只是个漏洞也说不定。
而我的第七感则再度的告诉我说,-fomit-frame-pointer可能会也可能不会有任何的赚头。从这点来看,就是意谓著有另一个暂存器可以用来处理内存分配的问题。另方面,若纯粹从x86的机器在转换它的指令集成为机器码的方法上来看,便意谓著堆叠所用到的内存空间要比frame所用到的还要来得多;换句话说,Icache对程序码而言并没有实质上的帮助,若是阁下用了-fomit-frame-pointer的话,同时也是告诉编译器在每次呼叫函数之后,就必须修正堆叠的指标;然而,就frame来讲,若呼叫的次数不多的话,则允许堆叠暂时堆积起来。

有关这方面主题的最后一段话仍是来自于Linus:

要注意的是,如果你想要得到最佳状况的执行效率,可千万别相信我的话。无论如何,一定要进行测试。gcc编译器还有许多的参数可用,其中可能就有一种最特别的组合,可以给你最佳编码的结果。

11/14/97译 5/15/98修正

Internal compiler error: cc1 got fatal signal 11

Signal 11是指 SIGSEGV,或者 ?segmentation violation'。通常这是指 说gcc对自己所用的指标感到困惑,而且还尝试著把资料写入不属于它的内存里。所以,这可能是一个gcc的bug。 然而,大体而言,gcc是一支经过严密测试且可靠度良好的软件佳作。它也用了大量复杂的资料结构与惊人的指标数量。简言之,若是要评选本世纪最挑惕与最一丝不?的RAM测试程序,gcc绝对可以一摘后冠。假如你无法重新复制这只bug---当你重新开始编译时,错误的信息并没有一直出现在同一个地方---那几乎可以确定,是你的硬件本身有问题(CPU,内存,主机板或是快取内存).千万不要因为你的电脑可以通过开机程序的测试、或是Windows可以跑得很顺、或者其它什么的,就回过头来大肆宣传说这是gcc的一个bug;你所做的这些测试动作,通常没有什么实际上的价值,这是很合理的结论。另外,也不要因为编译核心时,总是停留在?make zImage'的阶段,就要大骂这是gcc的bug---当然它会停在那儿啊!做?make zImage'时,需要编译的文档可能就超过200文档;我们正在研拟一个替代的方案。

如果你可以重覆产生这个bug,而且(最好是这样啦!)可以写一个短小的程序来展示这只bug的话,你就可以把它做成bug报告,然后email给FSF,或者是linux-gcc通信论坛。你可以去参考gcc的说明文件,看看有什么详细的信息,是他们所需要的。

4.3 移植能力

据报,近日来许多正面的消息指出,若是有某件东东到现在都还没移植到Linux上去,那么可以肯定的是,它一定一点价值也没有。:-)

嗯!正经一点。一般而言,原始码只需要做一些局部的修改,就可以克服Linux 100%与POSIX兼容的特质。如果你做了任何的修改,而将此部份传回给原作者,会是很有建设性的举动。这样日后就只需要用到?make',就能得到一个可执行的文档了。

BSD教徒 (有 bsd_ioctldaemon<sgtty.h>)

编译程序时,可以配合-I/usr/include/bsd与连结-lbsd的程序库。(例如:在你的Makefile档内,把-I/usr/include/bsd加到CFLAGS那一行;把-lbsd加到LDFLAGS那一行)。如果你真的那么想要BSD型态的信号行为,也需要再加上-D__USE_BSD_SIGNAL了。那是因为当你用了-I/usr/include/bsd与含括了标头档<signal.h>之后,make时就会自动加入了。

失落的封印(SIGBUS, SIGEMT, SIGIOT, SIGTRAP, SIGSYS etc)

Linux与POSIX是完全兼容的。不过,有些信号并不是POSIX定义的---ISO/IEC 9945-1:1990 (IEEE Std 1003.1-1990), paragraph B.3.3.1.1 sez:

“在POSIX.1中省略了SIGBUS、SIGEMT、SIGIOT、SIGTRAP与SIGSYS信号,那是因为它们的行为与实作的方式息息相关,而且也无法进行适当的分类。确认实作方式后,便可以发送这些信号,可是必须以文件说明它们是在什么样的环境底下发送出来的,以及指出任何与它们的发展相关的限制。”

想要修正这个问题,最简单也是最笨的方法就是用SIGUNUSED重新定义这些信号。正确的方法应该是以条件式的编译#ifdef来处理这些问题才对:

#ifdef SIGSYS
/* ... non-posix SIGSYS code here .... */
#endif

11/15/97译 5/22/98修正

K & R

gcc是一个与ANSI兼容的编译器;奇怪的是,目前大多数的程序码都不符合ANSI所定的标准。如果你热爱ANSI,喜欢用ANSI提供的标准来撰写C程序,似乎除了加上-traditional的旗号之外,就没有其它什么可以多谈的了。There is a certain amount of finer-grained control over which varieties of brain damage to emulate;请自行查阅gcc info page。

要注意的是,尽管你用了-traditional来改变语言的特性,它的效果也仅局限于gcc所能够接受的范围。例如, -traditional会打开-fwritable-strings,使得字串常数移至资料内存空间内(从程序码内存空间移出来,这个地方是不能任意写入的)。这样做会让程序码的内存空间无形中增加的。

前置处理器的符号卯上函数原型宣告

最常见的问题是,如众所皆知,Linux中有许多常用的函数都定义成巨集存放在标头档内,此时若有相似的函数原型宣告出现在程序码内,前置处理器会拒绝进行语法分析的前置作业。常见的有atoi()atol()

sprintf()

在大部份的Unix系统上,sprintf(string, fmt, ...)传回的是string的指标,然而,这方面Linux(遵循ANSI)传回的却是放入string内的字元数目.进行移植时,尤其是针对SunOS,需有警觉的心。

fcntl 与相关的函数;FD_*家族的定义到底摆在哪里?

就在<sys/time.h>里头。 为了真正的原型宣告,当你用了fcntl,可能你也想含括标头档<unistd.h>进来。

一般而言,函数的manual page会在SYNOPSIS章节内列出需要的标头档

select()的计时---程序执行时会处于忙碌-等待的状态

很久很久以前,,select()的计时参数只有唯读的性而已。即使到了最近,manual pages仍然有下面这段的警告:

select()应该是藉由修正时间的数值(如果有的话),再传回自原始计时开始后所剩余的时间。未来的版本可能会使这项功能实现。因此,就目前而言,若以为呼叫select()之后,计时指标仍然不会被修正过,可是一种非常不明智的想法喔!

未来就在我们的眼前了!至少,在这儿你绝对可以看到。函数select()传回的,是扣除等待尚未到达的资料所耗费的时间后,其剩余的时间数值。如果在计时结束时,都没有资料传送进来,计时引数便会设为0;如果接著还有任何的select(),以同样的计时structure来呼叫,那么select()便会立刻结束。

若要修正这项问题,只要每次呼叫select()前,都把计时数值放到计时 structure内,就没有问题了。把下面的程序码,

      struct timeval timeout;
      timeout.tv_sec = 1; timeout.tv_usec = 0;
      while (some_condition)
            select(n,readfds,writefds,exceptfds,&timeout); 
改成,
      struct timeval timeout;
      while (some_condition) {
            timeout.tv_sec = 1; timeout.tv_usec = 0;
            select(n,readfds,writefds,exceptfds,&timeout);
      }

这个问题,在有些版本的Mosaic里是相当著名的,只要一次的等待,Mosaic就挂在那里了。Mosaic的萤幕右上角,是不是有个圆圆的、会旋转的地球动画。那颗球转得愈快,就表示资料从网路上传送过来的速率愈慢!

产生中断的系统呼叫

特徵:

当一支程序以Ctrl-Z中止、然后再重新执行时 或者是其它可以产生Ctrl-C中断信号的情况,如子程序的终结等 系统就会抱怨说"interrupted system call"或是"write: unknown error",或者诸如此类的信息。

问题点:

POSIX的系统检查信号的次数,比起一些旧版的Unix是要多那么一点。如果是Linux,可能就会执行signal handlers了 

就其它的作业系统而言,你需要的可能就是下面这些系统呼叫了: creat(), close(), getmsg(), putmsg(), msgrcv(), msgsnd(), recv(), send(), wait(), waitpid(), wait3(), tcdrain(), sigpause(), semop() to this list.

在系统呼叫期间,若有一信号(那支程序本身应准备好handler因应了)产生,handler就会被呼叫。当handler将控制权转移回系统呼叫时,它会侦测出它已经产生中断,而且传回值会立刻设定成-1,而errno设定成EINTR。程序并没有想到会发生这种事,所以就挂了。

有两种修正的方法可以选择:

(1) 对每个你自行安装的signal handler,都须在sigaction的旗号加上SA_RESTART。例如,把下列的程序,

  signal (sig_nr, my_signal_handler);
改成,
  signal (sig_nr, my_signal_handler);
  { struct sigaction sa;
    sigaction (sig_nr, (struct sigaction *)0, &sa);
#ifdef SA_RESTART
    sa.sa_flags |= SA_RESTART;
#endif
#ifdef SA_INTERRUPT
    sa.sa_flags &= ~ SA_INTERRUPT;
#endif
    sigaction (sig_nr, &sa, (struct sigaction *)0);
  }

要注意的是,当这部份的变更大量应用到系统呼叫之后,呼叫read()write()ioctl()select()pause()connect()时,你仍然得自行检查EINTR。如下所示:

(2) 你自己得很明确地检查EINTR

这里有两个针对read()ioctl()的例子。

原始的程序片段,使用read()

int result;
while (len > 0) { 
  result = read(fd,buffer,len);
  if (result < 0) break;
  buffer += result; len -= result;
}
修改成,
int result;
while (len > 0) { 
  result = read(fd,buffer,len);
  if (result < 0) { if (errno != EINTR) break; }
  else { buffer += result; len -= result; }
}
原始的程序片段,使用ioctl()

int result;
result = ioctl(fd,cmd,addr);
修改成,
int result;
do { result = ioctl(fd,cmd,addr); }
while ((result == -1) && (errno == EINTR));

注意一点,有些版本的BSD Unix,其内定的行为是重新执行系统呼叫。若要让系统呼叫中断,得使用 SV_INTERRUPTSA_INTERRUPT旗号。

可以写入的字串

gcc对其users总怀抱著乐观的想法,相信当他们打算让某个字串当作常数来用时---那它就真的只是字串常数而已。因此,这种字串常数会储存在程序码的内存区段内。这块区域可以page到磁盘机的image上,避免耗掉swap的内存空间,而且任何尝试写入的举动都会造成分页的错误(segmentation fault)。这可是一种特色呢!

对老旧一点的程序而言,这可能会产生一个问题。例如,呼叫mktemp(),传递的引数(arguments)是字串常数。 mktemp()会尝试著在*适当的位置*重新写入它的引数。

修正的方法不外乎(a)以-fwritable-strings编译,迫使gcc将此常数置放在资料内存空间内;或者(b)将侵犯地权的部份重新改写,配置一个不为常数的字串,在呼叫前,先以strcpy()将资料拷贝进去。

为什么呼叫execl()会失败?

那是因为你呼叫的方式不对。execl的第一个引数是你想要执行的程序名.第二个与接续的引数会变成你所呼叫的程序的argv阵列。记住:传统上,argv[0]是只有当程序没有带著引数执行时,才会有设定值。所以啰,你应该这样写:

execl("/bin/ls","ls",NULL);
而不是只有,
execl("/bin/ls", NULL);

执行程序而不带任何引数,可解释成是一种邀请函,目的是把此程序的动态程序库独立的特性印出来。至少,a.out是这样的。就ELF而言。事情就不是这样了.

(如果你想得知此程序库的信息,有一些更简单的界面可用;参考动态载入那一章节,或是ldd的manual page。)

11/16/97译 6/2/98修正


Next Previous Contents