首周票房如預期突破 12 億人民幣( 12.69 億)後,目前在中國有不少專家以及院線經理認為「復仇者聯盟 3 」無疑會成為 30 億量級的超級英雄大片。相較於這些專家和經理的高歌,對此筆者抱持著不同的看法,從大數據分析的角度上來看, 25 億就已經夠嗆了,老實說沒想過能突破 30 億人民幣。

我是廣告 請繼續往下閱讀
由於預售火爆加上在前期粉絲的加持的關係,「貓眼」票房分析丟資料餵給機器做學習的時候,參數值比實際情況來得高,對預測的成果就會有誤判和高估的情形,結果也如筆者所言,從首日( 5 月 11 日)預測的 27.14 億下修到目前( 5 月 16 日)預測的 21.14 億,上映不到一周下修票房就多達6億!從此可得知,對於貓眼預測來說,它計算最終票房離30億的目標是越來越遠,也和筆者過去文章的預測一致。

雖然目前貓眼在首日票房的預測上準度有待加強,但首周過後的預測呢? 在倒傳遞類神經網路( Back-Propagation Neural Network )等預測演算法重新調整完權重後,預測會更加接近最終的實際票房,未來在蒐集足夠正確的歷史資料後只會越來越準。基本上,擁有數據分析能力的人能夠看得更遠,對於票房數據的敏銳度也會異於常人,以筆者觀點來看,資料科學家之間預測出來的 range 通常不會有太大落差。

這些專家及院線經理認為無疑會突破 30 億,是以什麼樣的準則來預測就不得而知了,憑經驗嗎? 或是另類的宣傳方式?  Whatever ,至少新聞中的「專家」指的應該是資深電影人士,不一定擁有大數據和資料分析的相關背景,因為預測出來的票房實在差太多了,退個一萬步來說,最終票房也是2字頭並不會到3字頭,連預測高估的貓眼電影大數據也「僅」27 億,離 30 億還有一段距離。

如果本篇文章能看到現在,那麼恭喜你!已經 follow 上筆者的觀點(也被洗腦到一半了 XD ),畢竟談論大數據分析的閱讀門檻自然會比較高;上半部文章內容若看不懂也沒關係,提供給大家一定能看懂的逐日票房資料。把近期比較呼聲最高的「玩命關頭 8 」資料(首日預測 28 億,最終 26.71 億)撈出來和「復仇者聯盟 3 」(首日預測  億)進行票房趨勢比較。兩部都是市場原本就看好票房爆發的強片,上映檔期也幾乎沒對手,票房走勢相近做為參考對象再適合不過了。

由於前期宣傳已經鋪天蓋地了,所以票房首周後 peak 屬於正常現象,並不會呈現口碑片的走勢。然而與「玩命關頭 8 」同期的票房相較下,兩部的差距卻已經有逐漸拉開的趨勢,實際上連超越玩命關頭的難度都很高了,在中國突破 30 億人民幣更是場美夢(除非有保底協議這個大招)。並不會說大數據預測分析就一定會比較準,但比起新聞中的專家和院線經理不明依據的高歌,筆者選擇擁抱大數據,而時間將證明一切。

在票房預測中,你是選擇相信自己的直覺,還是選擇擁抱大數據?這是個奢侈又令人羨慕的討論,在大數據時代的來臨下,我們沒有類似貓眼電影大數據這樣公開即時又透明化的票房資訊系統,至今連公開的全台每日票房都沒有,僅有逐漸失準的台北票房資料能參考,雖然現在各行各業口口聲聲吵著要大數據大數據,可惜沒有相應公開的 Raw Data 也增加分析的困難度,何時能有透明化的全台每日票房? 希望有生之年能夠見到。

●作者:帥猴子/票房分析專家&非專業影評

●本文為作者評論意見,不代表《NOWnews今日新聞》立場

●《今日觀點》開拓不同的視野

●《今日廣場》歡迎來稿或參與討論,請附真實姓名及聯絡電話,文章歡迎寄至public@nownews.com