歡迎光臨
每天分享高質量文章

“史上最強春節檔”來襲!資料告訴你這幾部影片最值得看

導讀:隨著春節腳步的臨近,想必各位讀者都已經開始規劃幸福的春節長假該如何度過。闔家團聚,探親訪友,與好久沒見的好基友一起談天說地,懟天懟地,想想都是讓人感到幸福。 

除此之外,每年的春節檔電影都會如約而至與大家見面,春節檔誕生了許多的經典電影,2019的春節檔電影也是佳片雲集,被稱作“史上最強春節檔”,今天我們就帶大家一起用資料去解讀其中最值得看的影片。

 

作者:徐麟

來源:資料森麟(ID:shujusenlin)

 

01 資料獲取

本次我們的資料主要來源於貓眼,一部分是貓眼的實時預售票房資料:

這部分資料可以透過selenium去獲取,程式碼如下:

driver = webdriver.Chrome()
driver.maximize_window()    
driver.close() 
driver.switch_to_window(driver.window_handles[0])  
url = 'https://piaofang.maoyan.com/dashboard?date=2019-02-05'
js='window.open("'+url+'")'
driver.execute_script(js)
driver.close() 
driver.switch_to_window(driver.window_handles[0])

另一部分資料則來源於貓眼的觀眾評論,由於電影目前都還沒有上映,觀眾評論給出的分數,表示了其對電影的期待值。需要註意的是,有許多觀眾在評論中並沒有給出評分,會直接顯示為0,在後續計算時需要排除,資料如下:

這部分資料的獲取方法可以參照之前4天破10億!上萬條評論解讀《西虹市首富》是否值得一看,我們就直接省略爬取程式碼。

 

02 預售票房

衡量一個電影關註度的重要方法就是去看首日的預售情況,我們此次選取八部春節檔最主要的影片進行對比,程式碼如下:

p<-ggplot(data[order(data$sale,decreasing = T),][1:8,],
         aes(x=reorder(name,sale),y=sale,fill=name))+
 geom_bar(stat='identity',width = 0.5)+
 geom_image(aes(x=name,y=0,image=image),size=0.08)+
 geom_text(aes(x=name,y=2500,label=label_sale),size = 7,col='black',fontface='bold')+
 ggtitle('春節檔電影預售票房排名(萬)') + theme_economist()+ scale_fill_tableau()+                 
 theme(axis.text.x = element_blank(),
       axis.text.y = element_blank(),
       plot.title = element_text(hjust=0.5,size=30),
       panel.grid = element_blank(),
       legend.position = 'none',
       panel.background = element_blank(),
       axis.title  = element_blank(),
       axis.line = element_blank(),
       axis.ticks = element_blank()
 )+coord_flip()+ylim(0,6500)
ggsave("春節檔上映前預售排名.png", pwidth = 10, height = 16)

看一下最終的結果:

目前預售排名前三位的都是喜劇題材,看來在春節的時候大家還是更加希望能夠放鬆自己,看一下輕鬆題材的影評。但是預售票房並不能完全覺得最終的票房走勢,可以參考之前上映後口碑崩塌的《地球最後的夜晚》和《愛情公寓》。

排名前兩位的影片都有沈騰的參與看來目前沈騰的票房認可度還是不錯的,希望兩部影片最終都會取得不錯的結果。

從預售票房上看,《廉政風雲》和《神探蒲松齡》都有比較大的撲街危險,考慮到港片近期略顯低迷的表現,希望這兩部影片能夠帶來一些驚喜。

 

03 上映前口碑

另外我們也看一下上映之前,觀眾對於影片的整體評價情況,這也會在一定程度上體現觀眾的期待值

程式碼如下:

 

p<-ggplot(data[order(data$score,decreasing = T),][1:8,],
         aes(x=reorder(name,score),y=score,fill=name))+
 geom_bar(stat='identity',width = 0.5)+
 geom_image(aes(x=name,y=0,image=image),size=0.08)+
 geom_text(aes(x=name,y=2,label=label_score),size = 7,col='black',fontface='bold')+
 ggtitle('春節檔電影上映前評價') + theme_wsj()+ scale_fill_tableau()+                 
 theme(axis.text.x = element_blank(),
       axis.text.y = element_blank(),
       plot.title = element_text(hjust=0.5,size=30),
       panel.grid = element_blank(),
       legend.position = 'none',
       panel.background = element_blank(),
       axis.title  = element_blank(),
       axis.line = element_blank(),
       axis.ticks = element_blank()
 )+coord_flip()+ylim(0,5)
ggsave("春節檔上映前評分排名.png", pwidth = 8, height = 12)

 

看一下最終的結果:

《熊出沒》出人意料的在評分中排在首位,這也一定程度上提高了作者對這部影片的期待值,雖然以作者的年齡,應該是不適合去看這部影片《小豬佩奇》憑藉此前的超強營銷,成功引起了大家的主要,然而最終表現如何,還是需要上映後接受觀眾的檢驗。

 同時我們看到成龍大哥領銜的《神探蒲松齡》在評分上要落後於其他影片,看來大家對於這類題材的影片持保留意見比較多一些,我們也期待上映後口碑是否能夠實現翻盤。

 

04 影片看點

我們最後透過評論去挖掘上映前大家比較關註的點,主要採用jieba分詞,需要註意的是,我們需要在分詞前增加一些自定義詞典,比如“黃景瑜”,如果不加這個自定義詞典,就會被分為“黃景”,之後我們會根據詞語出現頻率篩選出重要的關鍵詞:

def key_words(df):
   comment_str =  ' '.join(df)
   words_list = []
   jieba.load_userdict('spring_film_dict.txt')
   word_generator = jieba.cut(comment_str)  # 傳回的是一個迭代        f.close()  # stopwords文字中詞的格式是'一詞一行'
   for word in word_generator:
       words_list.append(word)
   words_list = Counter([k for k in words_list if len(k)>1])
   return list(dict(words_list.most_common(30)).keys())

最後我們在每個影片中選取了五個能夠體現其看點的詞語,併進行視覺化:

我們選取一些比較有趣的看點組合,進行一下深刻(suixing)解讀

《神探蒲松齡》:大家都在期待成龍大哥的表演,雖然有很多人提前給其打上了“爛片”的標簽,但是依然期待影片口碑的翻盤。同時大家也會認真關註影片特效,不知是否會致敬此前5毛錢“duang”的特效。

《飛馳人生》《瘋狂的外星人》感覺沈騰大有承包今年春節檔的態勢預售排名前兩位影片中,觀眾最關註的看點都是沈騰,期待沈騰春節霸屏同時也能收穫不錯的口碑。沈騰又是和外星人打交道,又是要體驗飛馳的人生,喜歡沈騰的觀眾在春節檔可以大飽眼福了。

《小豬佩奇過大年》一部適合孩子觀看的影片,也是一部宣傳片獲得極大討論度的影片,希望不要步此前《地球最後的夜晚》上映後口碑崩盤的後塵。

《新喜劇之王》:顯然大部分觀眾對這部影片的期待來自於星爺,有了此前經典版的《喜劇之王》珠玉在前,《新喜劇之王》不可避免地會被哪來與原作對比,我們期待能夠簡直有一部經典的影片出現。

最後提前祝願大家新年愉快,體會與家人團聚的幸福同時也能看到精彩的影片!同時大家也可以在留言區與我們互動,分享自己春節檔會選擇去觀看的影片。後臺回覆“春節檔”可以獲取本文程式碼。

 

關於作者:徐麟,目前就職於網際網路公司資料部,哥大統計資料狗,從事資料挖掘&分析工作,喜歡用R&Python;玩一些不一樣的資料。個人公眾號:資料森麟(ID:shujusenlin),知乎同名專欄作者。

 

我們正在繪製一份大資料粉絲畫像——

2019大資料粉絲有獎調查問捲上線了

歡迎長按二維碼填寫

我們每週一將從參與者中

隨機抽取3名幸運小夥伴

每位將獲贈近期出版的技術類圖書1本

猜你想看

Q: 你最期待哪部電影?

歡迎留言與大家分享

覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:baiyu@hzbook.com

更多精彩,請在後臺點選“歷史文章”檢視

    贊(0)

    分享創造快樂