城市如人,在形成的過程中也會顯現出獨特的性格。具有特殊文化品格和精神氣質的城市,無疑是最具吸引力而叫人難忘的。但你是否想過,如何用大資料深度探尋一個城市專屬的性格特色,瞭解城市心理?近日,城市象限的地產業務總監張希煜,透過挖掘分析歌詞、豆瓣、點評等多維資料,對城市性格特徵進行輪廓側寫,有趣生動地為我們講述瞭如何用大資料解密城市性格。
作者:資料俠 張希煜
來源:DT資料俠
何謂城市性格?
今天我分享的主題是城市性格,也許大家會覺得城市性格是一個複雜且充滿神秘的話題。首先,我將從人的性格研究開始講。因為這是所有科學研究當中最為通俗化的內容,任何一個人有可能不知道某個專業領域的研究,但他一定知道關於人的性格科學或偽科學的研究,比如大家接觸到最多的星座、血型、八字的研究。
我把人的性格研究劃分成了成因研究和表現研究兩個部分。
從成因研究上來看,這三個型別對城市性格研究有較大的借鑒意義,可以借鑒到分析城市性格的型別化研究中去。
一是星座、血型、八字類的迷幻研究,它的一大特點是會充分摺疊一切可以觀測的現象,能在摺疊中尋找出凸顯話題性的方式,從而訊速博取大家的關註,形成共鳴。這可以對應到文人作家是如何描述城市特點的,他們會提取一些非常抽象的內容,以一種比較具有感染力但不全面的方式去表達,從而形成對一個城市的簡單感性的描述。
二是神經生理觀能類的降維研究,人的性格和腦功能、生理結構、神經系統有很大的關係,這類研究是把高度複雜、多維的結構還原到較單純的物理基礎內容,從而去探究它的成因和表現的過程。對應到城市研究,就像是透過城市空間有形可見的物理功能性元素,去探究城市性格的表現。
三是生活史社會影響類的溯源研究,主要針對如何挖掘過去的事情,包括環境變化是如何影響性格形成的。這可以對應到我們對城市文化溯源、發展歷程的研究中。
個體間的區別促生個性,對城市來講也是這樣——由於氣候、歷史、建築、習俗、方言、食性等等諸多不同,城市才會有血肉有靈魂,謂之“城市性格”。研究一個城市的城市性格,不可避免地要去做一個全面的分解。
我們認為城市性格是從物理到心理的。
其中城市空間是我們所在城市性格展示的空間載體,包括了建築元素和交通元素;城市場景由我們的互動過程、認知、情感、行為建構;另一方面,我們也是城市個體化的成員,集聚成群體化的方式去呈現城市性格,我個人認為城市成員是城市性格最為核心的內容。
所以綜上所述,城市性格是一種城市特性的集合,是在城市空間和城市場景的影響之下,城市成員所表現出來的特點和特徵。
城市性格與大資料間的碰撞融合
類比人的性格,我們透過行為情感和認知反映關註城市性格特質,而大資料是作為城市性格的素材。
這個素材主要是三個層面:
一是社交網路類的資訊網站上提供的廣泛文字資訊,它和我們一般接觸到的純資料最大的區別是,文字資訊是一種資訊量大且摺疊程度高的資訊,其中的分析內容有很大的空間可以去主觀操作、創作。
二是社交網路類網站提供的對某一個資訊傳播方式及傳播範圍的指向性資料,這為我們提供了觀測每一個貢獻資訊的人之間關係的方式。我們可以透過這些使用者是否對同一件事情發表評論、是否參與同一個活動、是否分享了類似的內容等途徑去構建使用者之間的關係。
三是物件關係,主要是透過挖掘使用者與使用者之間、參與者與參與者之間的內在聯絡,比如透過豆瓣同城,可以將關註同一類或同一個活動的使用者建立成一個群組,這樣他們就有了一個維度上聯絡。
在基於種種途徑去挖掘城市性格時,實際上是在建立一個更為豐滿的城市感知。
透過和其他傳統城市感知方式來對比,當我們去試圖建立城市性格時,實際上是在挖掘一個城市發展的內部動機。那麼它的源頭是什麼?這是一個很好的視角,因為如果去對比一些傳統的研究方式,大家很容易發現如果僅僅是以建立因果聯絡就去做發展預判,會導致對城市的預測是扁平的。
焦灼的北京 VS 頹廢的上海
談到各個城市的性格,很多人會第一時間想到上海與北京。它們是近代以來中國的兩個最大的都市,一南一北,互為“他者”,無論是城市形態、社會分層,還是城市景觀、文化風格,都呈現出鮮明的對比。
對北京和上海的比較,永遠是大家樂此不疲的話題。那麼對生活在這兩個城市的人來說,他們所懷的城市情感是怎樣的呢?
為了找到答案,我們團隊在去年5月做了一個研究:透過挖掘北京和上海歌詞文字資訊探測其城市情感,我從中節選了一些研究結果展示。
我們提取了“離開”和“留下”兩個對立性的詞語作為指向詞,用以評估兩座城市,大家透過詞頻可以明顯看到,相比於上海,北京是一座在離開和留下之間非常糾結掙扎的城市。
這張圖是類比語言學研究方式後建立的詞庫:
我們透過詞庫來對比兩座城市詞性的相似和異同,最後建立了一個形容詞串列。從中我們發現北京會有更多積極的詞語,描述感情更為激烈,色彩更為明確;而上海會更多地使用一些私人化的詞彙,表現更多的是朦朧的情感。
另外關於歌詞,我們建立了一個詞與詞之間聯絡的主成員分析圖表,具體如下圖:
我們團隊也在試圖去建立一個基於文化地圖之上的城市詞頻地圖,希望能夠挖掘到更為廣泛的語料資訊,透過詞與詞之間的關聯,挖掘城市背後的故事,目前還在起步階段。
選餐廳:北京追網紅,上海覓小眾
俗話說“民以食為天”,飲食也是構成城市性格必不可少的一部分。我們透過分析大眾點評的資料做了關於兩座城市推薦餐廳的研究,其中資料主要是從大眾點評上的社群推薦上爬取了大家推薦的不同商鋪資訊和傳播情況。
透過對比北京和上海的推薦資料,我們發現在北京大家更傾向於去推薦人氣餐廳、網紅餐廳、爆款餐廳,而在上海大家更喜歡推薦小眾、有特色的餐廳,且推薦的接受度比北京要高一些。
當然這隻是我們巨大研究鏈條當中小小的一環,但從這個小細節上可以看到兩座城市的性格差異。北京更傾向於追求人氣、熱鬧的消費氛圍,但上海相對於北京而言,更看重小眾、獨立、私人化的消費氛圍。
比文化:北京愛歷史,上海重商業
文化是時間的沉澱,更是城市永恆的追求,一個具有特殊文化品格和精神氣質的城市,無疑是最具吸引力而叫人難忘的。那麼北京和上海在城市文化上相比又如何呢?
我們爬取了豆瓣同城上的資料,這些資料內容包括在城市範圍內發生的文化活動的名稱和性質、參與者的發生時間、消費門檻、文字描述等資訊。
我們利用這些資料做了關於活動特性、活動參與者、活動發生地點等分析。以下兩張地圖是根據北京和上海豆瓣同城上的活動資料(活動距離商圈、文明古跡、老城區等的距離)進行的分析。
透過這兩張地圖可以明顯發現,北京的文化活動距離歷史街區、文化遺產更近一些,而上海的文化活動更靠近一些商業機構和商圈。基於這一結果可以猜測,北京的文化活力、文化內容更為明顯地受到了其歷史文化的影響;而上海更為核心的發展動力是其商業文化或是商業動機。
下麵這一張圖是關於活動型別的對比:
我們依據活動內容的描述將其劃分成兩個類別,第一類是傳統文化類的活動,包括京劇表演、手藝表演、城市文化資源分享等;另外一類是創業類的活動,主要是工作坊、演講培訓、遊戲等。
那麼從比例上,大家可以發現北京的傳統文化活動明顯高於創業類文化活動,而在上海這個數值上則很接近。這更明顯的反映,商業文化對於文化活動在上海的滲透,也從側面表現出上海的城市性格更傾向於追求一種價值的分享,而北京更多的是關於文化體驗、傳承的分享。
小區名:北京喜復古,上海崇洋氣
除了情感、飲食和文化,北京和上海在小區命名上也存在著很大的差異。
我們對比了不同城市住宅小區的命名,透過把小區名稱、小區位置、小區型別、房價規模等資料提取出來進行一系列研究。從中我們發現了一些很有意思的成果,下麵節選了北京和上海的兩個小片段。
北京(尤其是在2005年以後)的小區,在命名上喜歡田園風或是中國風,而上海則更偏愛國際經典情,下圖串列上有幾個例子:
大家可以看到像耕天下、禮士閣以及江南山水、揚州水鄉這種“CP感”明確的小區名字越來越多;而在上海則會看到更多舶來詞,如城市經典高迪、莫奈莊園、矽谷商墅等。
這些名字也反映出了所在城市居民的價值取向,我們研究了兩種型別名字在整個城市小區中的佔比情況,可以看到相對來說北京用田園復古風的命名會更多一點,上海則用國際風的命名會稍多一點。
第二張圖是關於兩種風格房價的對比,由於涉及到房價資料,資料比較敏感,所以很難橫向對比,我們是透過對比這一型別房子均價大概是全市均價的多少倍數得到的。很容易發現在北京,以復古風命名的小區明顯會賣得更貴一些,而上海則是相反。
以上只是城市象限研究的一部分,但我們的研究不止這些,目前我們還有一個腦洞是關於如何透過城市地名的命名方式去挖掘城市的性格,觀察衚衕街道名稱、橋梁道路名稱、水系名稱等資料,從中發現城市的價值取捨、希望寄託、外來文化、紅色文化等對城市的影響。
舉例來說,透過看全國有多少紅旗街、紅旗路以及分佈在全國的哪些地區;又或者透過對比北京衚衕和上海弄堂的命名,從而發現當中寄託了城市什麼樣的願景;還有歷史傳流下來的文化圖騰的命名方式……這些都能讓我們發現各個城市的性格特點。
關於我的分享就到這裡,希望能給大家帶來啟發。
本文所有圖片均來自作者PPT,請關註大資料(ID:hzdashuju),併在後臺回覆“城市性格”獲取完整版。
註:以上內容根據張希煜在資料俠線上實驗室的演講實錄整理,有刪減及部分調整,已經本人審閱。本文僅為作者觀點,不代表大資料立場。
精彩活動
推薦閱讀
2017年資料視覺化的七大趨勢!
全球100款大資料工具彙總(前50款)
Q: 你住在哪個城市?
你覺得你的城市性格是什麼?
歡迎留言與大家分享
請把這篇文章分享給你的朋友
轉載 / 投稿請聯絡:hzzy@hzbook.com
更多精彩文章,請在公眾號後臺點選“歷史文章”檢視