Linux并不把进程的树形结构导出给普通用户,然而在内核中,它却使用树形结构来管理进程。linux内核使用“子进程退出,父进程收尸,父进程退出,子进程被过继”这种方式来管理进程的死亡,然而却少了一种,那就是父进程不给子进程收尸的情况,这就是僵尸进程的原因。
	
	既然知道了僵尸进程为何产生,那么想干掉它们就简单了。记住:任何没有人为因素的纯技术问题都是可以解决的!如何操作呢?很简单,就三步:
	1.将僵尸进程从树形进程组织中摘除;
	2.将僵尸进程过继给一个特定的进程;
	3.该特定进程调用wait来回收掉它。
这三步岂不是很麻烦,直接干掉它的父进程不就得了,这样内核会自己将僵尸进程过继给别的进程或者init进程,然而有时我们不能这么做,如果它的父进程是个很重要的进程咋办,我们不能因为父辈抛弃了过早去世的孩子而责怪父亲,如果那样,linux内核的法律岂不是比我们还严重...既然父亲不要孩子了,那么建立一个收容所是必要的,使用上述三个步骤完成子进程空壳的过继和回收!这个收容所可以在内核空间也可以在用户空间,这不是最重要的。
	
	本文给出了一个预研例子:
1.首先给出一个用户态进程代码:
	#include <unistd.h>  
	int main() 
	{ 
	int pid = 0; 
	pid = fork(); 
	if (pid == 0) { //子进程将瞬间变成僵尸,因为:1.父进程不回收;2.父进程不忽略  
	} else { 
	while (1) { 
	//I'm VIP,though I am always sleeping!  
	sleep(1); 
	} 
	} 
	} 
	#include <unistd.h>  
	int main() 
	{ 
	int pid = 0; 
	pid = fork(); 
	if (pid == 0) { //子进程将瞬间变成僵尸,因为:1.父进程不回收;2.父进程不忽略  
	} else { 
	while (1) { 
	//I'm VIP,though I am always sleeping!  
	sleep(1); 
	} 
	} 
	}
	
	2.然后给出一个内核模块代码:
	unsigned long pid; //参数保存结束的僵尸进程的进程号  
	module_param(pid, long, S_IRUSR);  
	MODULE_PARM_DESC(pid, "pid");  
	struct task_struct *(*find)(struct pid *pid, enum pid_type type); 
	struct pid *(*get)(pid_t nr); 
	long (*wait1)(pid_t pid, void *v, int options, void *ru); 
	int __init rm_init(void){  
	find = 0xc1041aed;   //根据pid结构得到task_t函数的地址  
	get=0xc1041b81; //根据pid得到pid结构体函数的地址  
	wait1 = 0xc1032e02; 
	struct pid* spid = (*get)(pid); 
	struct task_struct *tsk = (*find)(spid, PIDTYPE_PID); 
	tsk->real_parent = current; 
	tsk->parent = current; 
	list_del(&tsk->sibling); 
	list_add_tail(&tsk->sibling, &tsk->real_parent->children); 
	(*wait1)(pid, NULL, 0, NULL); 
	return 0;  
	}  
	void __exit rm_exit(void){  
	}  
	module_init(rm_init);  
	module_exit(rm_exit);  
	MODULE_LICENSE("GPL"); 
	unsigned long pid; //参数保存结束的僵尸进程的进程号  
	module_param(pid, long, S_IRUSR);  
	MODULE_PARM_DESC(pid, "pid");  
	struct task_struct *(*find)(struct pid *pid, enum pid_type type); 
	struct pid *(*get)(pid_t nr); 
	long (*wait1)(pid_t pid, void *v, int options, void *ru); 
	int __init rm_init(void){  
	find = 0xc1041aed;   //根据pid结构得到task_t函数的地址  
	get=0xc1041b81; //根据pid得到pid结构体函数的地址  
	wait1 = 0xc1032e02; 
	struct pid* spid = (*get)(pid); 
	struct task_struct *tsk = (*find)(spid, PIDTYPE_PID); 
	tsk->real_parent = current; 
	tsk->parent = current; 
	list_del(&tsk->sibling); 
	list_add_tail(&tsk->sibling, &tsk->real_parent->children); 
	(*wait1)(pid, NULL, 0, NULL); 
	return 0;  
	}  
	void __exit rm_exit(void){  
	}  
	module_init(rm_init);  
	module_exit(rm_exit);  
	MODULE_LICENSE("GPL");
	
	上述的模块实现了僵尸进程的回收,虽然还不是很完美,然而起码证实了可行性,我们一些函数的地址还是通过procfs得到的。具体在代码润色方面,我有四个建议,这四个方式无论哪一个都是可行的,而且花不了太多时间,这里代码就从略了,如果写一下的话,充其量也只能锻炼一下c语言编程能力:
	
	1.实现一个内核线程,专门实现模块init函数的逻辑,需要干掉的僵尸进程号通过procfs传入内核,然后在write例程中唤醒回收僵尸进程的内核线程;
2.实现一个用户态进程U,挂载一个信号A的处理函数,内部实现waitpid,通过procfs传入或者通过netlink传入内核的僵尸进程号代表的进程过继给用户态进程U,然后向U发送信号A;
3./dev/mem的机器码编程或者直接释放僵尸进程的task_t。
4.在/proc/<pid>/目录中加入kill-if-jiangshi文件,写入1如果该进程是僵尸,那么就调用上述模块的逻辑杀死它。

