在碎片化閱讀充斥眼球的時代,越來越少的人會去關註每篇論文背後的探索和思考。
在這個欄目裡,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。
點選本文底部的「閱讀原文」即刻加入社群,檢視更多最新論文推薦。
本期推薦的論文筆記來自 PaperWeekly 社群使用者 @xuehansheng。本文是斯坦福大學 Bo Wang 的又一篇大作,即將發表於 Nature Communications。
本文提出一種網路增強(Network Enhancement)方法,即一種用於改善無向加權網路的信噪比的方法。NE 使用雙隨機矩陣運算元來誘導稀疏性,並提供封閉形式的解決方案,增加輸入網路的頻譜本徵。因此,NE 可消除弱邊緣,增強實際連線,並帶來更好的下游效能。
如果你對本文工作感興趣,點選底部閱讀原文即可檢視原論文。
關於作者:薛寒生,澳大利亞國立大學博士生,研究方向為人工智慧與計算生物學。
■ 論文 | Network Enhancement: a general method to denoise weighted biological networks
■ 連結 | https://www.paperweekly.site/papers/2152
■ 作者 | Bo Wang / Armin Pourshafeie / Marinka Zitnik / Junjie Zhu / Carlos D. Bustamante / Serafim Batzoglou / Jure Leskovec
論文動機
這篇文章即將發表於《Nature Communications》,本文主要針對由於測量技術的侷限性和固有的自然變化所產生的網路噪聲,提出了一種網路增強方法 NE (Network Enhancement)。NE 使用雙隨機矩陣運算元來誘導稀疏性,並提供封閉形式的解決方案,增加輸入網路的頻譜本徵。因此,NE 可消除弱邊緣,增強實際連線。
模型介紹-NE
網路增強 Network Enhancement 是對加權生物網路進行去噪的通用方法。 該方法改善了無向加權網路的信噪比,從而提高了下游網路分析的效能。 NE 是一種原則性方法,具有收斂性和效能的理論保證。
NE 將嘈雜的,無向的加權網路作為輸入,併在同一組節點上輸出網路,但具有一組新的邊緣權重。NE 的主要關鍵是觀察到透過網路中的強(高邊緣權重)路徑連線的節點更可能透過高權重邊緣連結。NE 使用高階網路結構來增強給定的加權生物網路。
NE 中的擴散過程基於任何給定的兩個節點之間的互動流來修改網路中的邊緣權重,如圖所示。具體地說,對於任何兩個節點,NE 透過對連線這些節點的長度為 3 或更小的所有路徑建模來更新其邊緣的權重。
下圖說明瞭 NE 的迭代擴散過程。 NE 中的擴散過程生成網路,其中具有強相似性/相互作用的節點與高權重邊緣連線,而具有弱相似性/相互作用的節點與低權重邊緣連線。
我們用於對加權生物網路進行去噪的演演算法框架是: a)將加權網路作為輸入並形成其相關的鄰接矩陣(在下麵視覺化為熱圖)。 b)使用 NE 擴散過程迭代地更新網路。NE 中的擴散過程保證收斂。我們為下圖所示的會聚擴散過程提供封閉形式的解決方案。
在收斂時,增強網路具有雙隨機矩陣屬性。 在數學上,這意味著與輸入網路相關聯的特徵向量被保留,而特徵向量增加。
實驗結果
人體組織網路
我們將 NE 應用於來自不同人體組織的 22 個基因相互作用網路。 該網路捕獲特定於人組織和細胞譜系的基因相互作用,範圍從 B 淋巴細胞到骨骼肌和整個腦。鑒於增強的組織網路,我們檢查了相關組織特異性基因功能在網路中的連線程度。 期望功能相關基因傾向於在功能活躍的組織中比在其他非相關組織中更頻繁地相互作用。
在 NE 增強的血漿網路中,具有最高邊緣密度的功能是血液凝固,纖維蛋白凝塊形成和極低密度脂蛋白顆粒重塑的負調節,所有這些功能都特異於血漿(下圖,左)。 NE 增強腦網路中連線功能最強的是腦形態發生和前腦區域化,它們都是大腦特有的(下圖,右圖)。
我們評估了原始網路(RAW)和使用 MU,ND,DSD 和 NE 去噪的網路對組織特異性基因功能預測進行評價。
Hi-C互動網路
我們將 NE 應用於 Hi-C 互動網路。Hi-C 是一種基於 3C 的技術,可以測量細胞群內成對染色質的相互作用頻率。Hi-C 讀資料可以被認為是基因組區域是節點的網路,並且對映到兩個區間的標準化讀取計數是加權邊緣。
使用 NE 對 Hi-C 網路之前和之後的 Hi-C 接觸矩陣進行標的檢查,揭示了每個社群內邊緣的增強以及社群之間的邊界更加清晰(如下圖所示)。這種改進對於 5kb 解析度資料尤為明顯,在這些資料中,在使用 NE 進行去噪後,原始資料中視覺上無法檢測到的社群變得清晰。
蝴蝶種類相似性網路
我們將 NE 應用於利茲蝴蝶細粒物種影象資料集。 細粒度影象檢索旨在區分具有細微差別的類別(例如,君主蝴蝶與孔雀蝴蝶)。 我們分析了表示蝴蝶物種影象之間成對親和力的加權相似性網路。
目視檢查表明,NE 能夠極大地改善細粒度識別的整體相似性網路。 在 NE 之前,所有影象都拼湊在一起而沒有清晰的聚類(下圖,左圖)。 應用 NE 後得到的相似性網路清楚地顯示了代表不同蝴蝶種類的簇(下圖,右圖)。
總結
本文主要透過觀測到生物網路中強(高邊緣權重)路徑連線的節點更可能透過高權重邊緣連結。NE 使用高階網路結構來增強給定的加權生物網路併在擴散過程中根據任何給定的兩個節點之間的互動流來修改網路中的邊緣權重。並應用在人類組織網路等三個網路中取到了意想不到的結果。方法看似簡單卻很新穎有效,值得進一步研究。
本文由 AI 學術社群 PaperWeekly 精選推薦,社群目前已改寫自然語言處理、計算機視覺、人工智慧、機器學習、資料挖掘和資訊檢索等研究方向,點選「閱讀原文」即刻加入社群!
點選標題檢視更多論文解讀:
關於PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點選「交流群」,小助手將把你帶入 PaperWeekly 的交流群裡。
▽ 點選 | 閱讀原文 | 下載論文