基於政治信仰的統計修辭

BillyPan 寫了一篇用 830 遊行當天部落格訪問數推估遊行人數的文章,在這篇文章在 funP 張貼一小時後,馬上被同人揭穿用推論統計在這篇文章所發現的問題。我指出他用來預估全台綠營上網人數母體樣本,其樣本大小 n=1,因此所預估出來的 830 遊行當天上網人數下降的比例將會有極大的偏誤。

無獨有偶,後來 Zulu 也提出了其它星期六部落格來訪數字比 830 遊行當天還要少的事實,來突顯 BillyPan 的觀點疏漏。他提到照 BillyPan 的邏輯,8 月 9 日不同 IP 的訪客數更少,人數下降比例 Y 值是 11%,所以 8 月 9 日遊行的人數應該有將近46萬人。

BillyPan 對我和 Zulu 的質疑提出他的辯解。他認為只要儘量找一個流量夠大的部落格的到達率變化量,就可以逼近真正母群,他說他的 n 值大概超過 3000 左右,用來推估真正母體 N=389 萬的變化。

另外他也認為 Zulu 的算法也不行,因為因為部落格讀者會累積,拿後面的數字來算,覺得前面的數字減少,很可能是因為讀者越來越多,而不是因為遊行的關係。

BillyPan 的回答讓同人覺得很有趣,雖然他笑我對統計外行,弄錯 n 值的意思,但從他的回應中可以發現他對統計觀念的模糊。同人不敢說自己是統計專家,但統計學對我而言,除了在課堂上及書本上所獲得的知識以外,加上完成碩士學位論文的親手操作,還不至於不能分辨樣本空間基本事件,BillyPan 的回應,反而讓我懷疑他是否真的懂統計學?

BillyPan 用收視率或民意調查來反駁說他的樣本 n 值為 1 的說法,但同人還是第一次聽說 n 值要用這種不確定的數值。不管研究者用那一種抽樣方法,n 值應該是明確而非約略大概的值。否則在不知母體標準差的情形下,n 值不知道要如何求得標準誤來推論母體參數信賴區間?這樣看來,BillyPan 似乎並不了解樣本的 n 值是取決於對不同基本事件的觀測,而對這些觀測的集合便形成了所謂的樣本空間。

就像一般的收視率或問卷調查有 n 組觀測值,因此它們的樣本數為 n,用這 n 個觀測值的統計量來推論元素數目為 N 的母體參數。因此如果我們想要了解 830 遊行當天全台政治傾向偏綠的部落格點閱人數降低的比例,只用 BillyPan 部落格單一的觀測值是不夠的,而是要觀測 25 個相同政治傾向的部落格才能統計推論出我們想要知道的答案。顯然 BillyPan 並不了解抽樣方法與樣本空間大小是兩回事呀。

其實要如 BillyPan 所言要用他的部落格來代表政治傾向偏綠的部落格網友的行為,也是可以的;此時我們所觀測的事件就應該找出連續 25 週末上網人數以統計出平均上網人數與其差異性,而不是如 BillyPan 只根據單一月份來推論當天上網人數的降低數字。

如果以單一網站不同時間人數的變化來看,Zulu 的質疑突顯了一個事實:830 遊行當天人數並未如 BillyPan 所假設的當天部落格來訪人數有顯著差異,因為 8/9 的數來訪人數比 830 遊行當天的人數要更少。

我們可以用 BillyPan 提出網站來訪人數的數字來分析,八月份的前四個周末的平均來訪人數為 3193(同人不知為何會與 BillyPan 算的 3170 不同,但差距不大其分析結果會是一樣的),樣本標準差為 331.58。由此可以發現遊行當天部落格來訪人數的減少還小於樣本的標準差,顯見當天人數在 95% 的信心水準之下,並未達到顯著差異的標準。

這個分析結果其實己經打破了 BillyPan 的假設,沒有證據證明綠營支持者因為 830 遊行而減少上網,但他卻還在人們提出質疑用沒有被證實的理由來忽略它。這正如 Zulu 所說的

在科學社群中之所以要有同行互審的規矩,就是避免有人用有問題的理論來騙不懂的人。但比利潘的 blog 就是個政治 blog,裡面的統計學、數學式、GIS 目的並不是呈現真實而是為了政治宣傳服務,換句話說,統計學在他那裡只是一種修辭法。

比利潘質疑我的推論說「部落格讀者會累積,拿後面的數字來算,覺得前面的數字減少,很可能是因為讀者越來越多,而不是因為遊行的關係。」如果讀者數會隨時間變化,那他自己憑什麼用830的值和平均值的差代表上街人數?畢竟他那套的推估也是建立在整組資料對時間的相對穩定性上面。無論如何,我簡單地算了一下,微弱的增加趨勢也許存在,但8月9日的殘差還是遠遠高過8月30日。意思說,我原來的主張還是有道理的。如果比利潘那個推估法成立的話,8月9日的遊行人數應該遠遠多過830才對

同人看到 BillyPan 那篇文章在 funP 的推薦數字,覺得還真是令人不禁感慨呀。知識份子運用科學方法來進行政治宣傳的修辭,但願是基於無知;否則拿別有用心的方式來誤導不懂的人,實在是比無知更可怕萬分。子曰:爾愛其羊,我愛其禮。參加遊行的人數或許是個見人見智的問題,但扯出刻意扭曲的科學方法,只會令我輩等知識份子所不齒的呀。

Please follow and like us:
分類: 學習, 新聞, 生活感觸。這篇內容的永久連結

在〈基於政治信仰的統計修辭〉中有 10 則留言

  1. 自動引用通知: 同人的生活派對 » 統計推論的生活化觀念

  2. 自動引用通知: 選舉文宣的道德 « 同人的生活派對

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *