來自公眾號:Python程式設計與實戰
工作中經常要處理各種各樣的資料,遇到專案趕進度的時候自己寫函式容易浪費時間。
Python 中有很多內建函式幫你提高工作效率!
一:根據條件在序列中篩選資料
1.假設有一個數字串列 data, 過濾串列中的負數
使用串列推導式:
result = [i for i in data if i >= 0]
使用 fliter 過濾函式:
result = fliter(lambda x: x>= 0, data)
2.學生的數學分數以字典形式儲存,篩選其中分數大於 80 分的同學
d = {x:randint(50, 100) for x in range(1, 21)}
{k: v for k, v in d.items() if v > 80}
二:對字典的鍵值對進行翻轉
使用 zip() 函式
zip() 函式用於將可迭代的物件作為引數,將物件中對應的元素打包成一個個元組,然後傳回由這些元組組成的串列。
>>> s1 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
>>> s1
{'b': 1, 'f': 4, 'g': 3, 'r': 1}
>>> d = {k:v for k, v in zip(s1.values(), s1.keys())}
>>> d
{1: 'r', 4: 'f', 3: 'g'}
三. 統計序列中元素出現的頻度
1.某隨機序列中,找到出現次數最高的3個元素,它們出現的次數是多少?
構造隨機序列如下:
data = [randint(0,20) for _ in range(20)]
方法1: 可以使用字典來統計,以串列中的資料為鍵,以出現的次數為值
from random import randint
def demo():
data = [randint(0, 20) for _ in range(30)]
# 串列中出現數字出現的次數
d = dict.fromkeys(data, 0)
for v in li:
d[v] += 1
return d
方法2:直接使用 collections 模組下麵的 Counter 物件
>>> data = [randint(0, 20) for _ in range(30)]
>>> data
[7, 8, 5, 16, 10, 16, 8, 17, 11, 18, 11, 17, 15, 7, 2, 19, 5, 16, 17, 17, 12, 19, 9, 10, 0, 20, 11, 2, 11, 10]
>>> c2 = Counter(data)
>>> c2
Counter({17: 4, 11: 4, 16: 3, 10: 3, 7: 2, 8: 2, 5: 2, 2: 2, 19: 2, 18: 1, 15: 1, 12: 1, 9: 1, 0: 1, 20: 1})
>>> c2[14]
4
>>> c2.most_common(3) # 統計頻度出現最高的3個數
[(17, 4), (11, 4), (16, 3)]
2. 對某英文文章單詞進行統計,找到出現次數最高的單詞以及出現的次數
透過上面的練習,我們知道可以用 Counter 來解決
import re
from collections import Counter
# 統計某個文章中英文單詞的詞頻
with open('test.txt', 'r', encoding='utf-8')as f:
d = f.read()
total = re.split('W+', d) # 所有的單詞串列
result = Counter(total)
print(result.most_common(10))
四.根據字典中值的大小,對字典中的項進行排序
比如班級中學生的數學成績以字典的形式儲存:
{"Lnad": 88, "Jim", 71...}
請按數學成績從高到底進行排序!
方法1: 利用 zip 將字典轉化為元組,再用 sorted 進行排序
>>> data = {x: randint(60, 100) for x in "xyzfafs"}
>>> data
{'x': 73, 'y': 69, 'z': 76, 'f': 61, 'a': 64, 's': 100}
>>> sorted(data)
['a', 'f', 's', 'x', 'y', 'z']
>>> data = sorted(zip(data.values(), data.keys()))
>>> data
[(61, 'f'), (64, 'a'), (69, 'y'), (73, 'x'), (76, 'z'), (100, 's')]
方法2: 利用 sorted 函式的 key 引數
>>> data.items()
>>> dict_items([('x', 64), ('y', 74), ('z', 66), ('f', 62), ('a', 80), ('s', 72)])
>>> sorted(data.items(), key=lambda x: x[1])
[('f', 62), ('x', 64), ('z', 66), ('s', 72), ('y', 74), ('a', 80)]
五. 在多個字典中找到公共鍵
實際場景:在足球聯賽中,統計每輪比賽都有進球的球員
第一輪:{“C羅”: 1, “蘇亞雷斯”:2, “託雷斯”: 1..}
第二輪:{“內馬爾”: 1, “梅西”:2, “姆巴佩”: 3..}
第三輪:{“姆巴佩”: 2, “C羅”:2, “內馬爾”: 1..}
模擬隨機的進球球員和進球數
>>> s1 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
>>> s1
{'d': 3, 'g': 2}
>>> s2 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
>>> s2
{'b': 4, 'g': 1, 'f': 1, 'r': 4, 'd': 3}
>>> s3 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
>>> s3
{'b': 4, 'r': 4, 'a': 2, 'g': 3, 'c': 4}
首先獲取字典的 keys,然後取每輪比賽 key 的交集。由於比賽輪次數是不定的,所以使用 map 來批次操作
map(dict.keys, [s1, s2, s3])
然後一直累積取其交集,使用 reduce 函式
reduce(lambda x,y: x & y, map(dict.keys, [s1, s2, s3]))
一行程式碼搞定!
朋友會在“發現-看一看”看到你“在看”的內容