Predictive Analysis 與六四集會人數推算模型

「你對香港而家既政治狀況有幾不滿的平均值」 與「大會公佈人數」折線圖
「你對香港而家既政治狀況有幾不滿的平均值」 與「大會公佈人數」折線圖

橙色線是大會公佈的集會人數,藍色線是對政府不滿的年平均數,比如在2016年,全年平均便是71.8%。

我們用肉眼都已經看到對政府不滿的數字,與集會人數是息息相關的。但是我們要又有冇客觀的方法去證實這一點呢?今次我用了簡單的 Linear Regression 去證實這一點。

六四集會人數推算模型

首先我們看一下集會人數,與不滿百分比的Pearson Correlation Coefficient,數值是0.8189,  很高,即是他們是相當之有關係。

之後我們便用這些數據做了一個Linear Regression Model。

「你對香港而家既政治狀況有幾不滿的平均值」 與「大會公佈人數」關係圖
「你對香港而家既政治狀況有幾不滿的平均值」 與「大會公佈人數」關係圖

P-value 細過0.05,很好,證明今次的這個Model 是Significant。SSE 跟MSE 很細,是一個很好的數值。R-Square 是0.67, 即是說有大概七成嘅機會,我們可以用這個方法去推算下一次的六四集會人數。能做到大概七成,已經很不錯了!因為這個Model十分之簡單。

這個Model告訴我們,如果香港人對於政府的不滿百分比上升1%,六四的集會人數,有95%信心,會上升最少1969 人,至最多的 3421 人。

很有趣吧!所以假如政府看到這篇文章的話,如果不想下一年的六四集會又再那麼多人,便要小心一下,要注意你的民望了!

2 thoughts on “Predictive Analysis 與六四集會人數推算模型

  1. Tracy Funderburg says:

    Hello there. I discovered your website by the use of Google even as looking for a similar subject, your web site came up. It seems to be great. I have bookmarked it in my google bookmarks to come back then.

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *