6. exec跟source差在哪?


这次让我们从CU shell版的一个实例帖子来谈起吧: (论坛改版后,原链接已经失效)

例中的提问原文如下:

帖子提问:

cd /etc/aa/bb/cc可以执行 但是把这条命令放入shell脚本后,shell脚本不执行! 这是什么原因?

意思是:运行shell脚本,并没有移动到/etc/aa/bb/cc目录。

我当时如何回答暂时别去深究,先让我们了解一下进程 (process)的概念好了。

首先,我们所执行的任何程序,都是父进程(parent process)产生的一个 子进程(child process),子进程在结束后,将返回到父进程去。 此现象在Linux中被称为fork

(为何要称为fork呢? 嗯,画一下图或许比较好理解…^_^)

当子进程被产生的时候,将会从父进程那里获得一定的资源分配、及 (更重要的是)继承父进程的环境。

让我们回到上一章所谈到的”环境变量”吧: 所谓环境变量其实就是那些会传给子进程的变量。 简单而言, “遗传性”就是区分本地变量与环境变量的决定性指标。 然而,从遗传的角度来看,我们不难发现环境变量的另一个重要特征: 环境变量只能从父进程到子进程单向传递。 换句话说:在子进程中环境如何变更,均不会影响父进程的环境。

接下来,在让我们了解一下shell脚本(shell script)的概念. 所谓shell script 讲起来很简单,就是将你平时在shell prompt输入的多行 command line, 依序输入到一个文件文件而已。

再结合以上两个概念(process + script),那应该不难理解如下的这句话的意思了: 正常来说,当我们执行一个shell script时,其实是先产生一个sub-shell的子进程, 然后sub-shell再去产生命令行的子进程。 然则,那让我们回到本章开始时,所提到的例子在重新思考:

帖子提问:

cd /etc/aa/bb/cc可以执行 但是把这条命令放入shell脚本后,shell脚本不执行! 这是什么原因?

意思是:运行shell脚本,并没有移动到/etc/aa/bb/cc目录。

我当时的答案是这样的:

因为,我们一般跑的shell script是用sub-shell去执行的。 从process的概念来看,是 parent process产生一个child process去执行, 当child结束后,返回parent, 但parent的环境是不会因child的改变而改变的。 所谓的环境变量元数很多,如effective id(euid),variable, working dir等等… 其中的working dir($PWD) 正是楼主的疑问所在: 当用sub-shell来跑script的话,sub-shell的$pwd会因为cd而变更, 但返回primary shell时,$PWD是不会变更的。

能够了解问题的原因及其原理是很好的,但是? 如何解决问题,恐怕是我们更应该感兴趣的是吧?

那好,接下来,再让我们了解一下source命令好了。 当你有了fork的概念之后,要理解soruce就不难:

所谓source,就是让script在当前shell内执行、 而不是产生一个sub-shell来执行。 由于所有执行结果均在当前shell内执行、而不是产生一个sub-shell来执行。

因此, 只要我们原本单独输入的script命令行,变成source命令的参数, 就可轻而易举地解决前面提到的问题了。

比方说,原本我们是如此执行script的:

  1. $ ./my_script.sh

现在改成这样既可:

  1. $ source ./my_script.sh

或者:

  1. $ . ./my_script.sh

说到这里,我想,各位有兴趣看看/etc底下的众多设定的文件, 应该不难理解它们被定义后,如何让其他script读取并继承了吧?

若然,日后,你有机会写自己的script, 应也不难专门指定一个设定的文件以供不同的script一起”共用”了… ^_^

okay,到这里,若你搞懂forksource的不同, 那接下来再接受一个挑战:

exec又与source/fork有何不同呢?

哦…要了解exec或许较为复杂,尤其是扯上File Decscriptor的话… 不过,简单来说:

exec 也是让script在同一个进程上执行,但是原有进程则被结束了。 简言之,原有进程能否终止,就是execsource/fork的最大差异了。

嗯,光是从理论去理解,或许没那么好消化, 不如动手”实践+思考”来得印象深刻哦。

下面让我们为两个简单的script,分别命名为1.sh以及2.sh

1.sh

  1. #!/bin/bash
  2. A=B
  3. echo "PID for 1.sh before exec/source/fork:$$"
  4. export A
  5. echo "1.sh: \$A is $A"
  6. case $1 in
  7. exec)
  8. echo "using exec..."
  9. exec ./2.sh ;;
  10. source)
  11. echo "using source..."
  12. . ./2.sh ;;
  13. *)
  14. echo "using fork by default..."
  15. ./2.sh ;;
  16. esac
  17. echo "PID for 1.sh after exec/source/fork:$$"
  18. echo "1.sh: \$A is $A"

2.sh

  1. #!/bin/bash
  2. echo "PID for 2.sh: $$"
  3. echo "2.sh get \$A=$A from 1.sh"
  4. A=C
  5. export A
  6. echo "2.sh: \$A is $A"

然后分别跑如下参数来观察结果:

  1. $ ./1.sh fork
  2. $ ./1.sh source
  3. $ ./1.sh exec

好了,别忘了仔细比较输出结果的不同及背后的原因哦… 若有疑问,欢迎提出来一起讨论讨论~~~~

happy scripting! ^_^