歡迎光臨
每天分享高質量文章

當你在 Linux 上啟動一個行程時會發生什麼? | Linux 中國

本文是關於 fork 和 exec 是如何在 Unix 上工作的。你或許已經知道,也有人還不知道。幾年前當我瞭解到這些時,我驚嘆不已。
— Julia Evans


本文導航
編譯自 | https://jvns.ca/blog/2016/10/04/exec-will-eat-your-brain/ 
 作者 | Julia Evans
 譯者 | jessie-pang

本文是關於 fork 和 exec 是如何在 Unix 上工作的。你或許已經知道,也有人還不知道。幾年前當我瞭解到這些時,我驚嘆不已。

我們要做的是啟動一個行程。我們已經在部落格上討論了很多關於系統呼叫的問題,每當你啟動一個行程或者開啟一個檔案,這都是一個系統呼叫。所以你可能會認為有這樣的系統呼叫:

  1. start_process(["ls", "-l", "my_cool_directory"])

這是一個合理的想法,顯然這是它在 DOS 或 Windows 中的工作原理。我想說的是,這並不是 Linux 上的工作原理。但是,我查閱了檔案,確實有一個 posix_spawn[1] 的系統呼叫基本上是這樣做的,不過這不在本文的討論範圍內。

fork 和 exec

Linux 上的 posix_spawn 是透過兩個系統呼叫實現的,分別是 fork 和 exec(實際上是 execve),這些都是人們常常使用的。儘管在 OS X 上,人們使用 posix_spawn,而 fork 和 exec 是不提倡的,但我們將討論的是 Linux。

Linux 中的每個行程都存在於“行程樹”中。你可以透過執行 pstree 命令檢視行程樹。樹的根是 init,行程號是 1。每個行程(init 除外)都有一個父行程,一個行程都可以有很多子行程。

所以,假設我要啟動一個名為 ls 的行程來列出一個目錄。我是不是隻要發起一個行程 ls就好了呢?不是的。

我要做的是,建立一個子行程,這個子行程是我(me)本身的一個克隆,然後這個子行程的“腦子”被吃掉了,變成 ls

開始是這樣的:

  1. my parent

  2.    |- me

然後執行 fork(),生成一個子行程,是我(me)自己的一份克隆:

  1. my parent

  2.    |- me

  3.       |-- clone of me

然後我讓該子行程執行 exec("ls"),變成這樣:

  1. my parent

  2.    |- me

  3.       |-- ls

當 ls 命令結束後,我幾乎又變回了我自己:

  1. my parent

  2.    |- me

  3.       |-- ls (zombie)

在這時 ls 其實是一個僵屍行程。這意味著它已經死了,但它還在等我,以防我需要檢查它的傳回值(使用 wait 系統呼叫)。一旦我獲得了它的傳回值,我將再次恢復獨自一人的狀態。

  1. my parent

  2.    |- me

fork 和 exec 的程式碼實現

如果你要編寫一個 shell,這是你必須做的一個練習(這是一個非常有趣和有啟發性的專案。Kamal 在 Github 上有一個很棒的研討會:https://github.com/kamalmarhubi/shell-workshop)。

事實證明,有了 C 或 Python 的技能,你可以在幾個小時內編寫一個非常簡單的 shell,像 bash 一樣。(至少如果你旁邊能有個人多少懂一點,如果沒有的話用時會久一點。)我已經完成啦,真的很棒。

這就是 fork 和 exec 在程式中的實現。我寫了一段 C 的偽程式碼。請記住,fork 也可能會失敗哦。[3]

  1. int pid = fork();

  2. // 我要分身啦

  3. // “我”是誰呢?可能是子行程也可能是父行程

  4. if (pid == 0) {

  5.    // 我現在是子行程

  6.    // “ls” 吃掉了我腦子,然後變成一個完全不一樣的行程

  7.    exec(["ls"])

  8. } else if (pid == -1) {

  9.    // 天啊,fork 失敗了,簡直是災難!

  10. } else {

  11.    // 我是父行程耶

  12.    // 繼續做一個酷酷的美男子吧

  13.    // 需要的話,我可以等待子行程結束

  14. }

上文提到的“腦子被吃掉”是什麼意思呢?

行程有很多屬性:

◈ 開啟的檔案(包括開啟的網路連線)
◈ 環境變數
◈ 訊號處理程式(在程式上執行 Ctrl + C 時會發生什麼?)
◈ 記憶體(你的“地址空間”)
◈ 暫存器
◈ 可執行檔案(/proc/$pid/exe
◈ cgroups 和名稱空間(與 Linux 容器相關)
◈ 當前的工作目錄
◈ 執行程式的使用者
◈ 其他我還沒想到的

當你執行 execve 並讓另一個程式吃掉你的腦子的時候,實際上幾乎所有東西都是相同的! 你們有相同的環境變數、訊號處理程式和開啟的檔案等等。

唯一改變的是,記憶體、暫存器以及正在執行的程式,這可是件大事。

為何 fork 並非那麼耗費資源(寫入時複製)

你可能會問:“如果我有一個使用了 2GB 記憶體的行程,這是否意味著每次我啟動一個子行程,所有 2 GB 的記憶體都要被覆制一次?這聽起來要耗費很多資源!”

事實上,Linux 為 fork() 呼叫實現了寫時複製copy on write,對於新行程的 2GB 記憶體來說,就像是“看看舊的行程就好了,是一樣的!”。然後,當如果任一行程試圖寫入記憶體,此時系統才真正地複製一個記憶體的副本給該行程。如果兩個行程的記憶體是相同的,就不需要複製了。

為什麼你需要知道這麼多

你可能會說,好吧,這些細節聽起來很厲害,但為什麼這麼重要?關於訊號處理程式或環境變數的細節會被繼承嗎?這對我的日常程式設計有什麼實際影響呢?

有可能哦!比如說,在 Kamal 的部落格上有一個很有意思的 bug[4]。它討論了 Python 如何使訊號處理程式忽略了 SIGPIPE。也就是說,如果你從 Python 裡執行一個程式,預設情況下它會忽略 SIGPIPE!這意味著,程式從 Python 指令碼和從 shell 啟動的表現會有所不同。在這種情況下,它會造成一個奇怪的問題。

所以,你的程式的環境(環境變數、訊號處理程式等)可能很重要,都是從父行程繼承來的。知道這些,在除錯時是很有用的。


via: https://jvns.ca/blog/2016/10/04/exec-will-eat-your-brain/

作者:Julia Evans[6] 譯者:jessie-pang 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出

LCTT 譯者

jessie-pang ? ?
共計翻譯:3 篇
貢獻時間:10 天


推薦文章

< 左右滑動檢視相關文章 >

點選圖片、輸入文章 ID 或識別二維碼直達

贊(0)

分享創造快樂