Wu Yudong's Blog

今天看完APUE的exec函数部分，想整理记录并实践一下。

fork()函数通过系统调用创建一个与原来进程(父进程)几乎完全相同的进程(子进程是父进程的副本，它将获得父进程数据空间、堆、栈等资源的副本。注意，子进程持有的是上述存储空间的“副本”，这意味着父子进程间不共享这些存储空间。linux将复制父进程的地址空间内容给子进程，因此，子进程有了独立的地址空间)，也就是这两个进程做完全相同的事。

本文地址：http://wuyudong.com/2016/11/18/3057.html，转载请注明出处。

而有时我们希望子进程去执行另外的程序，exec函数族就提供了一个在进程中启动另一个程序执行的方法。它可以根据指定的文件名或目录名找到可执行文件，并用它来取代原调用进程的数据段、代码段和堆栈段，在执行完之后，原调用进程的内容除了进程号外，其他全部被新程序的内容替换了。另外，这里的可执行文件既可以是二进制文件，也可以是Linux下任何可执行脚本文件。

exec函数族：

#include <unistd.h>
int execl(const char *path, const char *arg, ...);
int execv(const char *path, char *const argv[]);
int execle(const char *path, const char *arg, ..., char * const envp[]);
int execve(const char *file, char *const argv[], char *const envp[]);
int execlp(const char *file, const char *arg, ...);
int execvp(const char *file, char *const argv[]);

要记住这六个函数之间的区别，就要搞清楚 “l” 、“v”、“p”、“e”代表的含义：

“l”表示参数以列表的形式表示，与v互斥；

“v”表示参数以数组argv[]的形式表示；

“p”表示在PATH中搜索执行文件；

“e”表示取envp[]数组而不使用当前环境

execlp、execvp这两个函数第一个形参是名为file表示可以只列出文件名就可以了，不用指出它的路径。

这6 个函数在函数名和使用语法的规则上都有细微的区别，下面就可执行文件查找方式、参数表传递方式及环境变量这几个方面进行比较说明:

① 查找方式：上表其中前4个函数的查找方式都是完整的文件目录路径，而最后2个函数（也就是以p结尾的两个函数）可以只给出文件名，系统就会自动从环境变量“$PATH”所指出的路径中进行查找。

② 参数传递方式：exec函数族的参数传递有两种方式，一种是逐个列举的方式，而另一种则是将所有参数整体构造成指针数组进行传递。

在这里参数传递方式是以函数名的第5位字母来区分的，字母为“l”（list）的表示逐个列举的方式，字母为“v”（vertor）的表示将所有参数整体构造成指针数组传递，然后将该数组的首地址当做参数传给它，数组中的最后一个指针要求是NULL。读者可以观察execl、execle、execlp的语法与execv、execve、execvp的区别。

③ 环境变量：exec函数族使用了系统默认的环境变量，也可以传入指定的环境变量。这里以“e”（environment）结尾的两个函数execle、execve就可以在envp[]中指定当前进程所使用的环境变量替换掉该进程继承的所以环境变量。

PATH环境变量说明

PATH环境变量包含了一张目录表，系统通过PATH环境变量定义的路径搜索执行码，PATH环境变量定义时目录之间需用用“:”分隔，以“.”号表示结束。PATH环境变量定义在用户的.profile或.bash_profile中，下面是PATH环境变量定义的样例，此PATH变量指定在“/bin”、“/usr/bin”和当前目录三个目录进行搜索执行码。

PATH=/bin:/usr/bin:.

export $PATH

进程中的环境变量说明

在Linux中，Shell进程是所有执行码的父进程。当一个执行码执行时，Shell进程会fork子进程然后调用exec函数去执行执行码。Shell进程堆栈中存放着该用户下的所有环境变量，使用execl、execv、execlp、execvp函数使执行码重生时，Shell进程会将所有环境变量复制给生成的新进程；而使用execle、execve时新进程不继承任何Shell进程的环境变量，而由envp[]数组自行设置环境变量。

exec函数族关系

前4位字符	统一为：exec
第5位字符	l：参数传递为逐个列举方式	execl、execle、execlp
第5位字符	v：参数传递为构造指针数组方式	execv、execve、execvp
第6位字符	e：可传递新进程环境变量	execle、execve
第6位字符	p：可执行文件查找方式为文件名	execlp、execvp

事实上，这6个函数中真正的系统调用只有execve，其他5个都是库函数，它们最终都会调用execve这个系统调用

exec调用举例如下：

char *const ps_argv[] ={"ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL};
char *const ps_envp[] ={"PATH=/bin:/usr/bin", "TERM=console", NULL};
execl("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL);
execv("/bin/ps", ps_argv);
execle("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL, ps_envp);
execve("/bin/ps", ps_argv, ps_envp);
execlp("ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL);
execvp("ps", ps_argv);

请注意exec函数族形参展开时的前两个参数，第一个参数是带路径的执行码（execlp、execvp函数第一个参数是无路径的，系统会根据PATH自动查找然后合成带路径的执行码），第二个是不带路径的执行码，执行码可以是二进制执行码和Shell脚本。

exec函数族使用注意点

在使用exec函数族时，一定要加上错误判断语句。因为exec很容易执行失败，其中最常见的原因有：

① 找不到文件或路径，此时errno被设置为ENOENT。

② 数组argv和envp忘记用NULL结束，此时errno被设置为EFAULT。

③ 没有对应可执行文件的运行权限，此时errno被设置为EACCES。

execlp函数举例：

#include <stdio.h>
#include <unistd.h>

int main()
{
    if(fork() == 0){
        if(execlp("/usr/bin/env","env",NULL) < 0)
        {
            perror("execlp error!");
            return -1 ;
        }
    }
    return 0 ;
}

编译运行：

wu@ubuntu:~/linuxc$ gcc execlp.c -o execlp
wu@ubuntu:~/linuxc$
wu@ubuntu:~/linuxc$ ./execlp
wu@ubuntu:~/linuxc$ XDG_VTNR=7
XDG_SESSION_ID=c2
XDG_GREETER_DATA_DIR=/var/lib/lightdm-data/wu
SELINUX_INIT=YES
CLUTTER_IM_MODULE=xim
……

execlp函数使执行码重生时继承了Shell进程的所有环境变量，其他三个不以e结尾的函数同理。

execle函数举例：

#include <unistd.h>
#include <stdio.h>

int main()
{
    /*命令参数列表，必须以 NULL 结尾*/
    char *envp[] = {"PATH=/tmp", "USER=sun", NULL};

    if(fork() == 0) {

        /*调用 execle 函数，注意这里也要指出 env 的完整路径*/
        if(execle("/usr/bin/env", "env", NULL, envp) < 0) {
            perror("execle error!");
            return -1 ;
        }
    }
    return 0 ;
}

编译执行：

wu@ubuntu:~/linuxc$ gcc execle.c -o execle
wu@ubuntu:~/linuxc$ ./execle
wu@ubuntu:~/linuxc$ PATH=/tmp
USER=sun

可见，使用execle和execve可以自己向执行进程传递环境变量，但不会继承Shell进程的环境变量，而其他四个exec函数则继承Shell进程的所有环境变量。

接下来综合实战一下：

#include <stdio.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <unistd.h>

char    *env_init[] = { "USER=unknown", "PATH=/tmp", NULL };

int
main(void)
{
    pid_t    pid;

    if ((pid = fork()) < 0) {
        printf("fork error\n");
    } else if (pid == 0) {    /* specify pathname, specify environment */
        if (execle("/home/wu/linuxc/echoall", "echoall", "myarg1",
                "MY ARG2", (char *)0, env_init) < 0)
            printf("execle error\n");
    }

    if (waitpid(pid, NULL, 0) < 0)
        printf("wait error\n");

    if ((pid = fork()) < 0) {
        printf("fork error\n");
    } else if (pid == 0) {    /* specify filename, inherit environment */
        if (execlp("echoall", "echoall", "only 1 arg", (char *)0) < 0)
            printf("execlp error\n");
    }

    exit(0);
}

其中的echoall.c代码如下：

#include <stdio.h>
#include <stdlib.h>

int
main(int argc, char *argv[])
{
    int            i;
    char        **ptr;
    extern char    **environ;

    for (i = 0; i < argc; i++)        /* 输出所有的命令行参数 */
        printf("argv[%d]: %s\n", i, argv[i]);

    for (ptr = environ; *ptr != 0; ptr++)    /* 和所有的环境变量字符串 */
        printf("%s\n", *ptr);

    exit(0);
}

运行结果如下：

wu@ubuntu:~/linuxc$ gcc echoall.c -o echoall
wu@ubuntu:~/linuxc$ gcc exec1.c -o exec1
wu@ubuntu:~/linuxc$ ./exec1
argv[0]: echoall
argv[1]: myarg1
argv[2]: MY ARG2
USER=unknown
PATH=/tmp
wu@ubuntu:~/linuxc$ argv[0]: echoall
argv[1]: only 1 arg
XDG_VTNR=7
XDG_SESSION_ID=c2
XDG_GREETER_DATA_DIR=/var/lib/lightdm-data/wu
……

解释一下上面的程序，该程序第一个fork执行后，子进程调用execle，它要求一个路径名”/home/wu/bin/echoall”和一个特定的环境env_init；下一个fork的子进程调用的是execlp，它用一个文件名”echoall”，并将调用者的环境传送给新程序

参考资料

http://blog.csdn.net/guoping16/article/details/6583383
http://blog.csdn.net/wenchao126/article/details/7956168
http://www.cnblogs.com/blankqdb/archive/2012/08/23/2652386.html

exec函数族深入剖析

Comments