Predictive Analysis 與六四集會人數推算模型

Predictive Analysis 與六四集會人數推算模型
Predictive Analysis 與六四集會人數推算模型

每年的6月4日,香港都會有一個好特別嘅集會。今年的集會人數,根據官方公布(不是警方數字),更是歷來之高,人數與2012年和2014年相約,大概是18萬左右。

那麼,如果我們有大數據的話,有沒有可能推測到出來集會的人數呢?大家都知如果對社會不滿人們就會上街示威,這個似乎是一個很阿媽是女人的命題。但是,現實又有冇實質嘅數據,或者比較科學的方法去證實他們之間的關係呢?

組合數據 Collapsed data,我們使用的是「唔滿意」
組合數據 Collapsed data,我們使用的是「唔滿意」

我在網上找了一下,在香港大學民意網站找到了一些關於香港人對社會或者統治者不滿的數據。數據在這裏。他們的數字很詳盡,基本上從1992年起,便每年都會有起碼大約五至六次的調查。我將這些數字以每年為單位平均化,從而得出每一年的一個平均數值。這個數值代表了那一年人們對政府的支持度。

之後,我又再在維基百科找到了歷年來六四集會的人數。雖然我覺得可能七一集會的遊行人數,比六四的更有關係。但是由於七一還未來臨,所以便以六四為基礎,做了這個分析。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *