歡迎光臨
每天分享高質量文章

張學友是“逃犯剋星”?貝葉斯公式告訴你真相

導讀:為什麼張學友的每場演唱會都有逃犯落網?是“熱心歌神張先生”真的有天生神力,還是有科學依據?

作者:老喻在加

來源:孤獨大腦(ID:lonelybrain)

音樂資源載入中…

01

為什麼張學友的每場演唱會都有逃犯落網?

先看看“學友·經典世界巡迴演唱會”的“顯赫戰功”:

  • 4月7日南昌站首個逃犯在現場落網。

  • 5月5日贛州演唱會開場安檢的過程中,警方透過人臉識別技術,成功抓獲一名網上逃犯。

  • 5月20日嘉興演唱會安檢時,發現逃犯一名,隨後被警方逮捕。

  • 6月9日金華演唱會,兩名逃犯落網。

  • 7月6日呼和浩特,警方抓獲冒雨前來觀看演唱會的全國在逃人員王某某。

  • 7月8日洛陽演唱會,早在5月份就期待滿滿的洛陽警方成功拿下“七殺”。

  • 9月21日遂寧演唱會,第一場就抓到了10餘名違法犯罪人員。

  • 9月28日石家莊演唱會,現場三名逃犯落網。

  • 9月30日鹹陽警方成功抓獲5名逃犯。

幾乎每場演唱會都會有逃犯落網,“歌神”張學友怎樣看待自己“逃犯剋星”的稱號呢?

連續九場,場場有逃犯被抓,真實的原因到底是什麼呢?

02

先讓我們跳開,來看一個影院中的貝葉斯推理。

(下麵案例的英文出處:Brandon Rohrer)

你前往影院排隊觀影,前面有個小夥伴,長髮披肩,衣著中性,如上圖,請問Ta是女士的機率有多大?

情況A

我在生命、宇宙以及任何事情的終極答案中介紹過類似的計算方法。

如上圖,是一種視覺化的貝葉斯計演演算法,在《統計學關我什麼事》一書中有詳細解釋。

請註意上面綠色和黃色兩個長方形:

  1. “面積”的概念在貝葉斯機率的計算中,起著重要的作用。

  2. 事件的可能性,由綠色和黃色兩種構成。二者各自的機率,體現為長方形的寬度。例如上圖中,是假設男女比例是1:1。

  3. 長方形的高度,是指“可能世界”的可能構成。例如上圖,綠色長方形指女性的可能世界,進而該可能世界,是由“一半長髮+一半短髮”的假設比例構成。

瞭解了面積法,開始計算,步驟如下:

  • 第一步:首先假定影院中男女各佔一半,100個人中,50個男人,50個女人。貝葉斯計算的特點,就是可以主觀預測,毛估估一下。

  • 第二步:假設女人中,一半為長髮,餘下的25人為短髮。而男人中,48位為短髮,兩位為長髮。這同樣是基於常識和主觀預測的毛估估。

  • 第三步:由此可以計算,有25個長髮女人和2位長髮男人。

  • 第四步:所以,Ta是女士的可能性為“25/(25+2)=92.6%”。

情況B

現在讓我們增加一個新的資訊,你現在排隊是在準備進入男士休息室。依靠這個額外的資訊,僅採用常識和背景知識即可完成判斷Ta更可能是男性,無需思考。

但是,貝葉斯推理則能以數學實現形式,做出更加精確的預測。

其意義在於,在某些你無法很簡單靠常識和直覺來做出量化判斷的時候,你就需要精確的演演算法了。所以讓我們繼續用貝葉斯來計算如下:

如上圖,還是採用面積計演演算法我們開始推理:

  • 第一步:100個人在男士休息室外排隊,我們主觀猜測毛估估一下,其中98名為男士,有2位陪同的女士。如上圖中的綠色長方形,因為女性極少,所以該長方形很“瘦”。

  • 第二步:假設女人中,一半為長髮,一半為短髮。而男人中每50人裡有兩位為長髮。和上面的情形一樣,這同樣是基於常識和主觀預測的毛估估。我們註意到,儘管男性長髮的比例很低,但是由於人群基數較大,所以下麵計算男性長髮人數的(深黃色那個)長方形很“胖”,有4個之多。

  • 第三步:按照以上的假設,短髮男士有94人,長髮為4人。而兩位女士則一個長髮一個短髮。即,長髮人士裡有4男1女。

  • 第四步:Ta是女士的可能性為20%。

這裡涉及了兩個個關於機率的概念:

1. 先驗機率。是指根據以往經驗和分析得到的機率,它往往作為”由因求果”問題中的”因”出現的機率。

例如上面長頭髮是男是女的案例裡,開始根據常識,假設人群整體性別比例為1:1。

2. 後驗機率。是指在得到“結果”的資訊後重新修正的機率,是“執果尋因”問題中的”果”。

由於知道了是在男士休息室前的排隊,根據此資訊,將人群男女比例調整為98:2。

該過程稱為“貝葉斯推理”。貝葉斯推理可以總結為:透過觀察行動(資訊),將先驗機率透過貝葉斯更新,轉換為後驗機率。

貝葉斯演演算法之所以在人工智慧時代大放異彩,是因為其具有學習功能。貝葉斯推理中,修改過的“各個類別的後驗機率”,已經使用了所有的資訊。也就是說我們可以將其看作“從資訊中學習到的結果”。貝葉斯推理正是具備了“收集資訊並自動變聰明”的功能。

03

張學友演唱會抓逃犯,和貝葉斯計算有什麼關係呢?

最近幾年,攝像頭、人臉識別、聯網技術大規模使用,是導致逃犯被抓的首因。

簡單來說,每個演唱會抓到逃犯的比例應該是比較接近的。張學友的演唱會有何不同呢?

不全面分析如下:

原因1:張學友的男性歌迷較多。

從抓捕照片看,基本為男性逃犯,好像只有一位女性。

因為男性人群的基數更大,所以張學友演唱會上出現逃犯的機率更大。

原因2:演唱會規模較大。

因為整體人數基數越大,男性歌迷人數更多,有逃犯的可能性越大。

原因3:年齡段分佈較廣。

原因4:階層分佈較廣。

原因5:演唱會基本都在二三四線城市。

以上原因3、4、5,可能令歌迷與逃犯的人群重合度更高。也就是說,因為年齡分佈、階層分佈、城市分佈的原因,即使是在同樣數量的男性歌迷中,出現逃犯的機率更大。

概括而言,因為:

  • 更大的人群基數

  • 更高的男性比例

  • 更高的逃犯比例

導致了張學友演唱會上出現逃犯的數量較多。

根據以上5點資訊,我們透過貝葉斯推理,會有類似上面“男士休息室”的資訊更新。

有興趣的話,可以透過“面積法”計算一下。

所以,在張學友的演唱會上,出現疑犯的“後驗機率”更高。

04

懸念在於,為什麼逃犯願意鋌而走險去看張學友的演唱會?

上面分析後驗機率,計算的其實是張學友歌迷中包括逃犯的比例。但是這個比例再高,如果逃犯不來現場,也沒用。

下麵我們用決策樹分析法,計算逃犯願意冒險主動來到現場的可能性。

我沒有更多別的演唱會是否有逃犯被抓的資料,簡單用決策樹分析如下。

在尋常情況下,逃犯決定是否去看演唱會,會進行下圖思考:

所以一般演唱會,逃犯冒險去看的機率為10%。

但是,張學友不是一般人啊,他人品正,沒緋聞,歌唱得盪氣迴腸,容易令英雄豪傑們產生共鳴。

作為靈魂型歌手,張學友令逃犯歌迷更願意冒險。

逃犯們每天東躲西藏,日子壓抑。又如《肖申克的救贖》裡所言,每個罪犯都覺得自己無罪。腦海裡浮現出張學友的歌曲,“有故事的人”不禁感慨萬千,非理性指數大幅上升。


於是,逃犯冒險去看張學友演唱會的機率為30%。

這樣,逃犯出現在張學友演唱會上的主動可能性,對比一般演唱會,一下變成了三倍。

加之前面提及的較高的逃犯比例之“後驗機率”,二者相乘,令逃犯出現在張學友演唱會上的數量較多。

在技術手段的幫助下(該類逃犯對科技進步估計不足,也拉低了理性的比例),張學友的演唱會變成了逃犯放飛自我的舞臺。

你陪了我多少年,花開花落,一路上起起跌跌。

那天晚上,亡命天涯的大哥,在最後的四大天王的歌聲中,勾起了年少往事,飛蛾撲火般慷慨赴約,哪怕最終身陷牢籠。

更多精彩


在公眾號後臺對話方塊輸入以下關鍵詞

檢視更多優質內容!


PPT | 報告 | 讀書 | 書單

Python | 機器學習 | 深度學習 | 神經網路

區塊鏈 | 揭秘 | 乾貨 | 數學

猜你想看

Q: 你想去看誰的演唱會

歡迎留言與大家分享

覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:baiyu@hzbook.com

更多精彩,請在後臺點選“歷史文章”檢視

贊(0)

分享創造快樂