三百公斤的豬

如果當你聽到了「三百公斤的豬,是不是一頭肥豬?」,隨即出現莞爾一笑時,我會猜測你多半聽過楊維寧老師教授過的統計學課程。這句話實在太經典了,先不管統計學得好不好,這句話讓人印象深刻,並領悟到統計學與生活可以如此貼近。事實上,只我們在生活中願意去思考,統計學的應用並沒有想像中的難,重點在於思考,而非繁複的理論與計算,這也是一種「百姓日用而不知」[ref]《易經.繫辭上》:仁者見之謂仁,智者見之謂之智,百姓日用而不知。[/ref]。

「三百公斤的豬,是不是一頭肥豬?」,答案並不重要,重要的是解答這問題的過程。要解答這個問題,我們必須要對所有豬的群體有所理解,所以我們有興趣的是豬的母體,如果我們知道所有豬的群體的重量機率分配,也就是掌握了豬的重量在統計學上的平均值標準差,那麼我們自然會知道任何一頭豬是肥豬或是瘦豬。

不過,在真實世界中,我們不大可能找到所有的豬,然後去量測牠們的重量並算出平均值與標準差。因為人力與成本的限制,我們無法知道母體的實際狀況,取而代之的是以抽樣的方式來解決我們的困境,以樣本來推論母體,我們隨機抽樣找了足以滿足中央極限定理的豬群來當樣本,以樣本的平均統計量來推論母體的平均值,以樣本的標準誤統計量來推論母體的標準差。

所以,那頭三百公斤的豬是肥豬或瘦豬呢?運用假設檢定,如果我們能夠拒絕三百公斤的豬不是肥豬的虛無假設,也就是假設三百公斤並未顯著地小於等於樣本的平均值統計量,那麼這頭豬就是肥豬,否則牠就不是肥豬。

利用豬的重量去理解假設檢定的概念其實並不困難,但要深入思考才能理解精髓所在,而不是靠背公式或憑一己印象或好惡判斷來解決問題。人們習慣於憑直覺或第一印象來看事情,但肉眼不能看見事物的精髓,唯有用心才能分辨事物的價值[ref]宋碧雲譯(1992),《小王子》,志文出版。[/ref]。一如在〈從高鐵談大型公共建設軟體開發專案(下)〉的讀者回應中,同人發現大家的談論焦點己背離文章所要表達的主題,情緒波動已使大家流於沒有意義的爭論之中,實在是相當可惜。

高鐵售票系統出問題只是一個實際發生的事件,對同人而言,這單一事件的意義不在於批判對錯及追究責任,就如同三百公斤的豬是不是一頭肥豬,其重點不在答案本身,真正令我感興趣的地方是從高鐵售票系統的問題,是否能讓我們從單一事件中有效推論出不徧差的大型公共建設軟體開發專案的實際情形,到底是只有高鐵售票系統那麼誇張,還是每個大型公共建設軟體開發專案都是一樣,只是出包的地方不一樣?如果是後者,其實欠缺思考的批評也只是「龜笑鱉沒有尾巴」的展現而已。

如同要知道肥豬與瘦豬之前,我們必須先知道豬的群體的特性一樣,分析高鐵售票系統的問題也要先知道大型公共建設軟體開發專案到底是怎麼一回事呀。藉由別人的失敗來突顯自己很懂某些領域,其實看在專業的開發者眼裡,只是突顯了批評者的黔驢技窮而己,那並不是真正的技術呀,這種行為背後的態度,更不是有專業的問題解決者該有的態度。

同人不想當診斷高鐵售票系統問題的醫生,也不想為高鐵售票系統的開發者辯駁什麼,我和許多人一樣都只是觀察此一事件的旁觀者。旁觀者當然可以發表他的觀點,在此,我選擇用謹慎的態度來看這事件,將高鐵售票系統事件比對過去參與過的其它大型公共建設軟體開發專案的經驗,而希望形成對高風險的複雜大型軟體專案有創造性的觀點。然而,這是個多元化的世界,你可以不認同我的看法,大家可以討論,但尊重是必要的,所以對於涉及人身攻擊的看法,我會不予置評,因為在我眼裡,你只會個會叫的鑼和鈸而已[ref]保羅(公元51年),《哥林多前書》[/ref]。

Please follow and like us:
分類: CNet/ZDNet, 問題解決, 專案管理, 管理, 軟體開發, 閱讀。這篇內容的永久連結

在〈三百公斤的豬〉中有 4 則留言

  1. Tom表示:

    可以問問題嗎 ?

    “如果我們能夠拒絕三百公斤的豬不是肥豬的虛無假設,也就是假設三百公斤並未顯著地小於等於樣本的平均值統計量,那麼這頭豬就是肥豬,否則牠就不是肥豬。” 為什麼不是假設”能夠接受三百公斤或超過的豬是肥豬的虛無假設” ? 我一直搞不懂”無罪推論”或”法官, 檢察官” 對虛無假設 vs 對立假設的例子.

  2. jim yeh表示:

    這和犯錯的風險有關,如果假設三百公斤的豬不是肥豬,除非找到足夠的證據證明它是肥豬,但這樣的推論過程仍然有可能出錯。因此一般而言,我們會用較低風險的假設當成虛無假設,也就是說錯把肥豬當成不是肥豬的風險比把不是肥豬的當成肥豬的風險還低。同樣的道理,無罪推論是不希望因為一個無辜的人因為法官犯錯而受害,雖然有可能錯放罪犯,但比較起來,在講求人權的社會裡,前者的衝擊比後者大很多。

  3. Tom表示:

    謝謝, 所以

    “三百公斤的豬不是肥豬” 或是
    “三百公斤小於等於樣本的平均值統計量”

    是虛無假設, 對嗎 ?

  4. jim yeh表示:

    應該把「三百公斤小於等於樣本的平均值統計量」改成「樣本的抽樣誤差(平均統計量減去三百公斤再取絕對值)不大於 0 的機率達到顯著水準」,這樣才是「三百公斤的豬不是肥豬」的虛無假設之統計學語言。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *