歡迎光臨
每天分享高質量文章

PPython:PHP 擁抱 Python 的利器 | Linux 中國

PPython,這是一種從根本上將 PHP 與 Python 有效結合的技術。

— 望星星降

 

作者:望星星降

介紹

Python 與 PHP 都是廣泛使用的語言,各有所長,讓人期待兩者結合可以實現更豐富的效果。

在 PHP 中呼叫 Python 實現某些處理,這種需求雖然比較小眾,還是實用的。目前網上可以查到很多資料仍在探討 exec()(也包括 system()shell_exec()passthru()等)執行外部的 Python 檔案,但這隻是一種通用的方式,呼叫成本比較高,在每次呼叫時,需要裝載整個 Python 解釋環境。

有此類需求的開發者非常適合看一下 PPython,這是一種從根本上將 PHP 與 Python 有效結合的技術。

PPython 最初見於 https://code.google.com/p/ppython,該作者將 lajp(一種 PHP 結合 Java 的技術)移植到了 Python 上。

該專案最初建立於 2012 年,而且似乎已經停止維護多年,不過目前來看其思路及效果還是值得肯定的,因此將此專案從停止運營的 Google Code 上遷移到了 GitHub,並遵循原 Apache 許可證重新釋出和維護。

日前筆者對此作了一番嘗試,對 PPython 的方便易用有所體會。

原理與架構

PHP 與 Python 通訊有兩種不同的套接字機制:TCP 套接字和 UNIX 套接字。UNIX 套接字是 Unix/Linux 本地套接字,相對於 TCP 套接字,具有以下特點:

◈ 只能在同一臺主機中通訊(IPC),不能跨主機;
◈ 傳輸速度大於 TCP 套接字;
◈ 服務端只向本機提供服務(沒有對外偵聽埠),相對安全,易於管理。

PHP 和 Python 各有其語言內部定義的資料型別,通常 PHP 行程與 Python 行程進行資料互動時,需要進行轉碼處理。此類轉換如由應用自行實現,從開發效率到執行效能都會增加不少額外負擔。

PPython 對 PHP 和 Python 間的通訊方式的處理支援 TCP 套接字和 UNIX 套接字兩種機制,兼顧通訊效率和分散式,轉碼由服務統一處理,Python 為 PHP 的資料型別提供格式相容,使 PHP 端開發無須為底層通訊擔心。

Python 因其語言 GIL 特性,同一行程內多執行緒效率不高。PPython 可根據專案需要部署服務,多行程執行 Python,提高應用綜合效能。

使用方法

PPython 的程式碼可從上述專案倉庫中下載。

下載得到的檔案中,以下三個是 PPython 的核心程式碼,作用如下:

◈ php_python.py,Python 行程主檔案,完成 Python 端監聽請求並執行傳回
◈ process.py,Python 端核心類,實現 Python 內部行程呼叫及 PHP 與 Python 資料結構轉化等關鍵處理
◈ php_python.php,PPython 客戶端,PHP 端取用此檔案,可直接使用 PPython 函式實現呼叫。

將以上檔案放置到任意目錄。先修改準備執行 PPython 的埠,監聽埠不限,只要 php_python.py 和 php_python.php 兩端修改一致。筆者統一改為 10240。

在當前目錄下執行 php_python.py,只要 Python 環境正常,便將執行起一個 PPython 的服務。

  1. -------------------------------------------
  2. - PPython Service
  3. - Time: 2019-05-13 22:24:09
  4. -------------------------------------------
  5. Listen port: 10240
  6. charset: utf-8
  7. Server startup...

PHP 端引入 php_python.php,就可以用 ppython 函式與之前啟動的 PPython 服務通訊,傳入請求由 PPython 服務呼叫 Python 處理後傳回結果,如 $res = ppython('test::go') 是呼叫test.py 中的 go 函式,也可加上更多引數,第二個引數起將為被調的函式傳遞更多引數。

php_python.py 是 PPython 啟動後直接執行的全域性程式碼,有全域性配置或行程啟動後的通用處理都寫在這裡,如原生程式碼中建立了資料庫連線等,專案中應視情況作最佳化。

但 Python 令人感興趣的主要方面不只是像 PHP 那樣描述業務功能,它可以在人工智慧等領域所需要的計算型任務提供對更複雜的資料結構的處理,因此二者的結合可以給 PHP 帶來更多應用場景。

改進

此外,原生的 php_python.py 還有些不足。筆者用 ppython 呼叫自定義程式碼中遇到了三個問題,並相應做瞭解決:

1. 不支援 complex(複數類),複數是數學上的一種資料型別,主要包括 real(實部)和 imag(虛部)資料,雖然日常生活中遇到較少,但 AI 和各種專業研究領域或並不罕見。Python 裡有 complex 類,對複數可以直接進行各種計算,但 PPython 序列化和反序列化對 complex 沒有處理。為了能讓 complex 包括的資料能正常傳回,只要在 process.py 的 z_encode() 方法中加上符合 PHP 要求的序列化處理,程式碼如下:

  1. elif isinstance(p, numpy.complex128):
  2. t1 = str(p.real)
  3. t2 = str(p.imag)
  4. return 'O:7:"complex":2:{s:4:"real";d:%s;s:4:"imag";d:%s;}' % (t1,t2)
2. 不支援 ndarray(多維陣列)。相比 complexndarray 要普通得多,相信凡使用到 Python 的各種計算功能,ndarray 是無法迴避的,甚至 ndarray 在一定程度上成就了 Python。但原 php_python.py 不能識別 ndarray。不過解決起來並不難,在 process.py 裡找到z_encode() 方法,加上下麵這段,可以直接將 ndarray 轉化為符合 PHP 要求的陣列(數字索引)。 

  1. elif isinstance(p, numpy.ndarray):
  2. s = ''
  3. i = 0
  4. for d in p:
  5. s += 'i:%d;%s' % (i,z_encode(d))
  6. i += 1
  7. return "a:%d:{%s}" % (len(p),s)
3. 原始碼不太穩健,如資料為 ndarray 型別,if p == None:報錯ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all(),因為p == None的結果也是ndarray,不傳回false ,將判斷方法改為if p is None:可避免出錯。

相應地 PHP 端也要註意一下序列化和反序列化的處理。

處理回覆中類似 complex 這樣的物件資料時,如系統中沒有定義相應的類,PHP 是可以反序列化的,但將顯示為 “incomplete object”,vardump 看得到 real 和 imag 資料,但不能直接操作,自行定義 complex 類後,則按指定的類進行解析,與 PHP 內的一般物件無異,可以輕鬆進行所有操作。

至此,PHP 與 Python 的功能調訊已無問題。

補充:註冊為服務

命令列下啟動 php_python.py 主要是方便除錯,可以看到觀察反饋資訊等,生產環境中手工啟動 PPython 畢竟不太方便。可以將 PPython 配置成服務,修改埠也可以為不同的應用配置不同的 PPython 端。

Linux 下將一個行程註冊為服務很簡單,只要建立 /usr/lib/systemd/system/ppython.service,內容如下:

  1. [Unit]
  2. Description=PHP-Python Service
  3. After=network.target remote-fs.target nss-lookup.target
  4. [Service]
  5. ExecStart={PPYTHON_PATH}/php_python.py
  6. [Install]
  7. WantedBy=multi-user.target

其中 {PPYTHON_PATH} 要改成實際路徑。

總結

有了 PPython,可以摒棄 exec() 這種 shell 呼叫,使開發回歸到邏輯本身。

個人認為該方案值得所有對 PHP 和 Python 都感興趣的開發人員瞭解,也歡迎大家參與和貢獻這個專案。

贊(0)

分享創造快樂