開源最前線(ID:OpenSourceTop) 猿妹 編譯
連結:https://opensource.com/article/18/9/python-libraries-side-projects
在Python / Django世界中有一句話:我們為語言而來,為社群而留。對我們大多數人來說,這是事實,但讓我們置身於Python世界的另一個原因是,我們很容易就有了一個想法,並且可以幾個小時內讓這個想法快速實現。
本文我們將深入研究我們喜歡使用的Python庫:
1、要動態儲存資料庫中的資料:Dataset
python中非常好用的資料庫管理工具dataset,當我們想要快速地收集資料並將其儲存到資料庫中,而不知道最終的資料庫表是什麼樣子時,Dataset就是我們的首選庫。Dataset有一個簡單而強大的API,可以輕鬆地將資料放入其中,併在稍後對其進行排序。
Dataset構建在SQLAlchemy之上,因此擴充套件它不會讓你感覺到陌生。使用Django的內建inspectdb管理命令將底層資料庫模型輕鬆匯入Django。這使得使用現有資料庫變得非常輕鬆。(官方檔案:http://dataset.readthedocs.io/en/latest/)
2、從網頁中提取資料:Beautiful Soup
Beautiful Soup使從HTML頁面中提取資訊變得很容易。當我們需要將非結構化或鬆散結構的HTML轉換為結構化資料時,它就是是我們的首選。它還非常適合處理XML資料,否則這些資料可能無法讀取。(專案地址:https://github.com/icodeu/BeautifulSoup)
3、處理HTTP內容:Requests
Requests是一個 Python 的 HTTP 客戶端庫,可以說是處理HTTP內容的黃金標準庫之一。每當我們需要使用HTML頁面甚至API時,Requests就會出現。它也有很好的記錄。(專案地址:https://github.com/requests/requests)
4、編寫命令列:Click
Python中強大的命令列庫,在我們需要編寫本機Python指令碼時,Click是我們最喜歡的用於編寫命令列實用程式的庫。這個API很簡單,只需要記住一些樣式就行,檔案很好用,它使得查詢高階特性變得很容易。(官網映象地址:http://click.uoota.com/6/)
5、Python Slugify
眾所周知,給事物命名是很困難的。Python Slugify是一個很有用的庫,可以將標題或描述轉換為唯一的(ish)識別符號。如果你正在處理一個web專案,並且希望使用seo友好的url, Python Slugify將會給你極大的幫助。(專案地址:https://github.com/un33k/python-slugify)
6、Pluggy
Pluggy相對較新,但它也是向現有應用程式新增外掛系統中最好和最簡單的方法之一。(專案地址:https://github.com/pytest-dev/pluggy)
7、要將CSV檔案轉換為API:Datasette
Datasette是一個神奇的工具,可以輕鬆地將CSV檔案轉換為功能齊全的只讀REST JSON api。Datasette有很多功能,包括圖表和地理位置(用於建立互動式地圖),透過容器或第三方web主機很容易部署。(專案地址:https://github.com/simonw/datasette)
8、處理環境變數:Envparse
如果因為不想在原始碼中儲存API鍵、資料庫憑證或其他敏感資訊而需要解析環境變數,那麼envparse就是最好的選擇之一。Envparse處理環境變數、ENV檔案、變數型別,甚至前處理器和後處理器(例如你希望確保變數總是大寫或小寫)。(專案地址:https://github.com/rconradharris/envparse)
你最喜歡的庫有在這個串列裡面麼?留言分享給大家。
●編號512,輸入編號直達本文
●輸入m獲取文章目錄