Overview

如下图所示是一个计算机系统，最底层有有一些硬件资源，比如: CPU, 内存，磁盘，网卡。

在上层运行一些应用程序，比如一个文本编辑器（VI），一个C编译器(CC), 一个Shell。这些程序都运行在一个空间中：用户空间(user space)。

除了用户空间还存在一个内核空间(kernel space)。kernel对底层管理硬件资源，为上层程序提供了大量的服务。他对用户空间程序(进程)，对内存进行分配，进行访问控制…。kernel程序总是第一个被启动的，他也是独一无二的存在。

用户空间又如何与内核空间进行交互呢？这是通过一系列的接口来实现的。通常这通过系统调用 (system call)来实现。

如下图所示，在用户空间中有一个shell程序在运行。如果这个时候得到一条读取文件的命令，shell invoke read 这个system call，跳转到内核空间，执行该命令，然后将结果返回用户空间。 [这里是这么实现的呢]

一些系统调用

`fork`

System Call	Description
`int fork()`	Create a process, return child’s PID

fork 的作用是克隆进程，也就是将原先的一个进程再克隆出一个来，克隆出的这个进程就是原进程的子进程，这个子进程和其他的进程没有什么区别，同样拥有自己的独立的地址空间。不同的是子进程是在fork返回之后才开始执行的。

在XV6中，父子进程除了fork的返回值，其他都是一样的。除了内存是一样的以外，文件描述符的表单也从父进程拷贝到子进程。所以如果父进程打开了一个文件，子进程可以看到同一个文件描述符，尽管子进程看到的是一个文件描述符的表单的拷贝。

fork函数有三个返回值

该进程为父进程时，返回子进程的pid
该进程为子进程时，返回0
fork执行失败，返回-1

#include<stdio.h>
#include<unistd.h> 	//for fork
#include<sys/wait.h>//for wait

int main() {
  int pid = fork();
  if(pid > 0) {
    printf("parent: child = %d\n", pid);
    pid = wait(0);
    printf("child %d is done\n", pid);
  } else if(pid == 0) {
    printf("child: exiting\n");
  } else {
    printf("fork error\n");
  }
}

输出

$./a.out
parent: child = 24482
child: exiting
child 24482 is done

`exec`

System call	Description
`int exec(char* file, char* argv[])`	Load a file and execute it with arguments; only returns if error

把当前进程的内存替换为文件里保存的内存镜像并执行之。exec有两个参数，第一个是要执行的程序，第二个这个程序的参数(以字符串数组的形式出现)。

exec系统调用会保留当前的文件描述符表单。所以任何在exec系统调用之前的文件描述符，例如0，1，2等。它们在新的程序中表示相同的东西。
通常来说exec系统调用不会返回，因为exec会完全替换当前进程的内存，相当于当前进程不复存在了，所以exec系统调用已经没有地方能返回了。

#include<stdio.h>
#include <unistd.h>

int main() {
  char* argv[] = {"echo", "this", "is", "echo", 0};
  execv("/bin/echo", argv);

  printf("exec failed\n");
}

输出

$ ./a.out  
this is echo

shell是怎么工作的

首先看 main 函数，main loop通过 getcmd读取一行输入

然后调用 fork函数，创建一个shell process的copy。子进程通过runcmd执行命令，父进程等待。

int
main(void)
{
  	static char buf[100];
	..

      // Read and run input commands.
    while(getcmd(buf, sizeof(buf)) >= 0){
    	...
        if(fork1() == 0)
          runcmd(parsecmd(buf));
        wait(0);
    }
    exit(0);
}

比如用户在shell中输入了 echo hello, getcmd获取了这条命令，通过fork创建了子进程，子进程调用 runcmd函数，runcmd将echo hello作为其参数。在runcmd中，他调用 exec函数执行echo。在某个时刻, echo调用 exit函数，这使父进程return from wait

`fork()` & `exec()` OR `forkexec()`

如上面所说，fork了之后再需要调用exec将替换子进程的内存，为什么不直接将fork和exec合并成一个system call呢?

将fork与exec分成两个系统调用，方便了I/O redirection的实现

如下所示, 我们希望将echo hello的输出结果重定向到newfile.txt。

$ echo hello > newfile.txt

shell实现的方法是: 在子进程创建后，调用 exec之前，shell关闭标准输出，并且打开文件newfile.txt, 这样结果就不会被输出到屏幕上，而是被输出到newfile.txt。

当然这个效果也依赖于操作系统对文件描述符的管理方式。文件描述符由kernel管理的对象，用一个比较小的整数来表示，把文件描述符指向的对象称为file，通过文件描述符可以对文件进行读写操作。通常，0为standard input, 1为standard output, 2为standard error。在分配文件描述符时，UNIX系统会从0开始寻找第一个可以使用的文件描述符。shell关闭了标准输出后，STDOUT_FILENO就是第一个可以使用的文件描述符。调用open函数打开文件后，这个文件就会被分配到这个文件描述符。

考虑，如果将fork, exec合并为一个系统调用forkexec，那怎么才能实现重定向呢？有几下几种思考