作者:vamei
連結:http://www.cnblogs.com/vamei/archive/2012/09/20/2694466.html
計算機實際上可以做的事情實質上非常簡單,比如計算兩個數的和,再比如在記憶體中尋找到某個地址等等。這些最基礎的計算機動作被稱為指令(instruction)。所謂的程式(program),就是這樣一系列指令的所構成的集合。透過程式,我們可以讓計算機完成複雜的操作。程式大多數時候被儲存為可執行的檔案。這樣一個可執行檔案就像是一個菜譜,計算機可以按照菜譜作出可口的飯菜。
那麼,程式和行程(process)的區別又是什麼呢?
行程是程式的一個具體實現。只有食譜沒什麼用,我們總要按照食譜的指點真正一步步實行,才能做出菜餚。行程是執行程式的過程,類似於按照食譜,真正去做菜的過程。同一個程式可以執行多次,每次都可以在記憶體中開闢獨立的空間來裝載,從而產生多個行程。不同的行程還可以擁有各自獨立的IO介面。
作業系統的一個重要功能就是為行程提供方便,比如說為行程分配記憶體空間,管理行程的相關資訊等等,就好像是為我們準備好了一個精美的廚房。
看一眼行程
首先,我們可以使用$ps命令來查詢正在執行的行程,比如$ps -eo pid,comm,cmd,下圖為執行結果:
(-e表示列出全部行程,-o pid,comm,cmd表示我們需要PID,COMMAND,CMD資訊)
每一行代表了一個行程。每一行又分為三列。第一列PID(process IDentity)是一個整數,每一個行程都有一個唯一的PID來代表自己的身份,行程也可以根據PID來識別其他的行程。第二列COMMAND是這個行程的簡稱。第三列CMD是行程所對應的程式以及執行時所帶的引數。
(第三列有一些由中括號[]括起來的。它們是內核的一部分功能,被打扮成行程的樣子以方便作業系統管理。我們不必考慮它們。)
我們看第一行,PID為1,名字為init。這個行程是執行/bin/init這一檔案(程式)生成的。當Linux啟動的時候,init是系統建立的第一個行程,這一行程會一直存在,直到我們關閉計算機。這一行程有特殊的重要性,我們會不斷提到它。
如何建立一個行程
實際上,當計算機開機的時候,核心(kernel)只建立了一個init行程。Linux核心並不提供直接建立新行程的系統呼叫。剩下的所有行程都是init行程透過fork機制建立的。新的行程要透過老的行程複製自身得到,這就是fork。fork是一個系統呼叫。行程存活於記憶體中。每個行程都在記憶體中分配有屬於自己的一片空間 (address space)。當行程fork的時候,Linux在記憶體中開闢出一片新的記憶體空間給新的行程,並將老的行程空間中的內容複製到新的空間中,此後兩個行程同時執行。
老行程成為新行程的父行程(parent process),而相應的,新行程就是老的行程的子行程(child process)。一個行程除了有一個PID之外,還會有一個PPID(parent PID)來儲存的父行程PID。如果我們循著PPID不斷向上追溯的話,總會發現其源頭是init行程。所以說,所有的行程也構成一個以init為根的樹狀結構。
如下,我們查詢當前shell下的行程:
root@vamei:~# ps -o pid,ppid,cmd
PID PPID CMD
16935 3101 sudo -i
16939 16935 -bash
23774 16939 ps -o pid,ppid,cmd
我們可以看到,第二個行程bash是第一個行程sudo的子行程,而第三個行程ps是第二個行程的子行程。
還可以用$pstree命令來顯示整個行程樹:
init─┬─NetworkManager─┬─dhclient
│ └─2*[{NetworkManager}]
├─accounts-daemon───{accounts-daemon}
├─acpid
├─apache2─┬─apache2
│ └─2*[apache2───26*[{apache2}]]
├─at-spi-bus-laun───2*[{at-spi-bus-laun}]
├─atd
├─avahi-daemon───avahi-daemon
├─bluetoothd
├─colord───2*[{colord}]
├─console-kit-dae───64*[{console-kit-dae}]
├─cron
├─cupsd───2*[dbus]
├─2*[dbus-daemon]
├─dbus-launch
├─dconf-service───2*[{dconf-service}]
├─dropbox───15*[{dropbox}]
├─firefox───27*[{firefox}]
├─gconfd-2
├─geoclue-master
├─6*[getty]
├─gnome-keyring-d───7*[{gnome-keyring-d}]
├─gnome-terminal─┬─bash
│ ├─bash───pstree
│ ├─gnome-pty-helpe
│ ├─sh───R───{R}
│ └─3*[{gnome-terminal}]
fork通常作為一個函式被呼叫。這個函式會有兩次傳回,將子行程的PID傳回給父行程,0傳回給子行程。實際上,子行程總可以查詢自己的PPID來知道自己的父行程是誰,這樣,一對父行程和子行程就可以隨時查詢對方。
通常在呼叫fork函式之後,程式會設計一個if選擇結構。當PID等於0時,說明該行程為子行程,那麼讓它執行某些指令,比如說使用exec庫函式(library function)讀取另一個程式檔案,併在當前的行程空間執行 (這實際上是我們使用fork的一大目的: 為某一程式建立行程);而當PID為一個正整數時,說明為父行程,則執行另外一些指令。由此,就可以在子行程建立之後,讓它執行與父行程不同的功能。
子行程的終結(termination)
當子行程終結時,它會通知父行程,並清空自己所佔據的記憶體,併在核心裡留下自己的退出資訊(exit code,如果順利執行,為0;如果有錯誤或異常狀況,為>0的整數)。在這個資訊裡,會解釋該行程為什麼退出。父行程在得知子行程終結時,有責任對該子行程使用wait系統呼叫。這個wait函式能從核心中取出子行程的退出資訊,並清空該資訊在核心中所佔據的空間。但是,如果父行程早於子行程終結,子行程就會成為一個孤兒(orphand)行程。孤兒行程會被過繼給init行程,init行程也就成了該行程的父行程。init行程負責該子行程終結時呼叫wait函式。
當然,一個糟糕的程式也完全可能造成子行程的退出資訊滯留在核心中的狀況(父行程不對子行程呼叫wait函式),這樣的情況下,子行程成為僵屍(zombie)行程。當大量僵屍行程積累時,記憶體空間會被擠佔。
行程與執行緒(thread)
儘管在UNIX中,行程與執行緒是有聯絡但不同的兩個東西,但在Linux中,執行緒只是一種特殊的行程。多個執行緒之間可以共享記憶體空間和IO介面。所以,行程是Linux程式的唯一的實現方式。
總結
程式,行程,PID,記憶體空間
子行程,父行程,PPID,fork, wait
●編號596,輸入編號直達本文
●輸入m獲取文章目錄
運維
更多推薦《18個技術類微信公眾號》
涵蓋:程式人生、演演算法與資料結構、駭客技術與網路安全、大資料技術、前端開發、Java、Python、Web開發、安卓開發、iOS開發、C/C++、.NET、Linux、資料庫、運維等。