exec 是 Bash 内部命令。内部命令是由特殊的文件格式(.def)所实现,如 cd, history, exec 等。

1 fork 的概念

说明 execsource 的区别之前,先说明一下 fork 的概念。

fork 是 linux 的系统调用,用来创建子进程(child process)。子进程是父进程(parent process)的一个副本,从父进程那里获得一定的资源分配以及继承父进程的环境。子进程与父进程唯一不同的地方在于 pid(process id)。

环境变量(传给子进程的变量,遗传性是本地变量和环境变量的根本区别)只能单向从父进程传给子进程。不管子进程的环境变量如何变化,都不会影响父进程的环境变量。

1.1 shell 脚本

有两种方法执行 shell scripts,一种是新产生一个 shell,然后执行相应的 shell scripts;一种是在当前 shell 下执行,不再启用其他 shell。

新产生一个 shell 然后再执行 scripts 的方法是在 scripts 文件开头加入以下语句:#!/bin/sh

一般的 script 文件(.sh)即是这种用法。这种方法先启用新的 sub-shell(新的子进程),然后在其下执行命令。

另外一种方法就是上面说过的 source 命令,不再产生新的 shell,而在当前 shell 下执行一切命令。

1.2 source

source 命令即点(.)命令。

在 bash 下输入 man source,找到 source 命令解释处,可以看到解释”Read and execute commands from filename in the current shell environment and ……”。从中可以知道,source 命令是在当前进程中执行参数文件中的各个命令,而不是另起子进程(或 sub-shell)。

1.3 exec

在 bash 下输入 man exec,找到 exec 命令解释处,可以看到有”No new process is created.”这样的解释,这就是说 exec 命令不产生新的子进程。那么 exec 与 source 的区别是什么呢?

exec 命令在执行时会把当前的 shell process 关闭,然后换到后面的命令继续执行。

系统调用 exec 是以新的进程去代替原来的进程,但进程的 PID 保持不变。因此,可以这样认为,exec 系统调用并没有创建新的进程,只是替换了原来进程上下文的内容。原进程的代码段,数据段,堆栈段被新的进程所代替。

一个进程主要包括以下几个方面的内容:

  1. 一个可以执行的程序
  2. 与进程相关联的全部数据(包括变量,内存,缓冲区)
  3. 程序上下文(程序计数器 PC,保存程序执行的位置)

exec 是一个函数簇,由 6 个函数组成,分别是以 exclexecv 打头的。

执行 exec 系统调用,一般都是这样,用 fork() 函数新建立一个进程,然后让进程去执行 exec 调用。我们知道,在 fork()建立新进程之后,父进程与各子进程共享代码段,但数据空间是分开的,但父进程会把自己数据空间的内容 copy 到子进程中去,还有上下文也会 copy 到子进程中去。而为了提高效率,采用一种写时 copy 的策略,即创建子进程的时候,并不 copy 父进程的地址空间,父子进程拥有共同的地址空间,只有当子进程需要写入数据时(如向缓冲区写入数据),这时候会复制地址空间,复制缓冲区到子进程中去。从而父子进程拥有独立的地址空间。而对于 fork() 之后执行 exec 后,这种策略能够很好的提高效率,如果一开始就 copy,那么 exec 之后,子进程的数据会被放弃,被新的进程所代替。

1.4 exec 与 system 的区别

exec 是直接用新的进程去代替原来的程序运行,运行完毕之后不回到原先的程序中去。

system 是调用 shell 执行你的命令,system=fork+exec+waitpid,执行完毕之后,回到原先的程序中去。继续执行下面的部分。

总之,如果你用 exec 调用,首先应该 fork 一个新的进程,然后 exec. 而 system 不需要你 fork 新进程,已经封装好了。

2 详解及应用实例

2.1 基本概念

(这是理解后面的知识的前提,请务必理解)

  • I/O 重定向通常与 FD 有关,shell 的 FD 通常为 10 个,即 0~9;
  • 三个常用 FD(默认与 keyboard、monitor、monitor 有关):
FD 说明
0 stdin, 标准输入
1 stdout, 标准输出
2 stderr, 标准错误输出

FD 用来改变送出的数据信道(stdout, stderr),使之输出到指定的档案;0 是 与 1> 是一样的;

在 IO 重定向中,stdout 与 stderr 的管道会先准备好,才会从 stdin 读进资料;

管道 | (pipe line): 上一个命令的 stdout 接到下一个命令的 stdin;

tee 命令是在不影响原本 I/O 的情况下,将 stdout 复制一份到档案去;

bash(ksh)执行命令的过程:分析命令-变量求值-命令替代(``和$( ))-重定向-通配符展开-确定路径-执行命令;

( )将 command group 置于 sub-shell 去执行,也称 nested sub-shell,它有一点非常重要的特性是:继承父 shell 的 Standard input, output, and error plus any other open file descriptors。

exec 命令:常用来替代当前 shell 并重新启动一个 shell,换句话说,并没有启动子 shell。使用这一命令时任何现有环境都将会被清除。 exec 在对文件描述符进行操作的时候,也只有在这时,exec 不会覆盖你当前的 shell 环境。

2.2 常用重定向

cmd &n 使用系统调用 dup (2) 复制文件描述符 n 并把结果用作标准输出

  • & 关闭标准输出
  • n& 表示将 n 号输出关闭

上述所有形式都可以前导一个数字,此时建立的文件描述符由这个数字指定而不是缺省的 0 或 1。如:

  • ... 2>file 运行一个命令并把错误输出(文件描述符 2)定向到 file。
  • ... 2>&1 运行一个命令并把它的标准输出和输出合并。(严格的说是通过复制文件描述符 1 来建立文件描述符 2 ,但效果通常是合并了两个流。)

我们对 2>&1详细说明一下:2>&1 也就是 FD2=FD1 ,这里并不是说 FD2 的值等于 FD1 的值,因为 > 是改变送出的数据信道,也就是说把 FD2 的 “数据输出通道” 改为 FD1 的 “数据输出通道”。

如果仅仅这样,这个改变好像没有什么作用,因为 FD2 的默认输出和 FD1 的默认输出本来都是 monitor,一样的!但是,当 FD1 是其他文件,甚至是其他 FD 时,这个就具有特殊的用途了。请大家务必理解这一点。

2.3 重定向恢复

如果 stdin, stdout, stderr 进行了重定向或关闭, 但没有保存原来的 FD, 可以将其恢复到 default 状态吗?

如果关闭了 stdin,因为会导致退出,那肯定不能恢复。

如果重定向或关闭 stdout 和 stderr 其中之一,可以恢复,因为他们默认均是送往 monitor(但不知会否有其他影响)。

如恢复重定向或关闭的 stdout: exec 1>&2 ,恢复重定向或关闭的 stderr:exec 2>&1。

如果 stdout 和 stderr 全部都关闭了,又没有保存原来的 FD,可以用:exec 1>/dev/tty 恢复。

cmd >a 2>a 和 cmd >a 2>&1 为什么不同? cmd >a 2>a :stdout 和 stderr 都直接送往文件 a ,a 文件会被打开两遍,由此导致 stdout 和 stderr 互相覆盖。

cmd >a 2>&1 :stdout 直接送往文件 a ,stderr 是继承了 FD1 的管道之后,再被送往文件 a 。a 文件只被打开一遍,就是 FD1 将其打开。

我想:他们的不同点在于:

cmd >a 2>a 相当于使用了两个互相竞争使用文件 a 的管道;

而 cmd >a 2>&1 只使用了一个管道,但在其源头已经包括了 stdout 和 stderr。

从 IO 效率上来讲,cmd >a 2>&1 的效率应该更高!