見微知著
統計學專欄
“Inductive inference is the only process known to us by which essentially new knowledge comes into the world.”
— Sir Ronald A. Fisher
讀統計學原為情非得已
假設檢定、p 值、t 檢定、卡方檢定、ANOVA 等等,本專欄旨在集中探討在讀期刊論文(俗稱 “paper”)時總會遇到的這些統計學工具的基本原理。
身為非統計學系亦非數學系的我,雖然大學必選修有生物統計學,但該課程授課教授僅具有透過電腦操作這些統計工具的計算的能力,對根本原理的認識可說是一問三不知,於是從那時起我只好自行研讀統計學課本,到處尋找可靠的相關文獻來研究、思考、理解,並將研習心得撰寫於此。
主要使用書籍
- Principles of Biostatistics (3/e)
Marcello Pagano, Kimberlee Gauvreau, Heather Mattie|2022|Chapman & Hall / CRC - Mathematical Statistics and Data Analysis (3/e)
John A. Rice|2009|Cengage Learning - The Art of Statistics: Learning from Data
David Spiegelhalter|2019|Pelican
已於 2021 年由經濟新潮社出版中譯本《統計的藝術:如何從數據中了解事實,掌握世界》。
統計思維無處不在!
不過,統計學不只是讀論文必備的技能,它的底層邏輯可以說是潛藏在生活中的各種面向。比方說,當我們無法單靠因果鏈釐清事物間的關係時,要如何理解自己和他人的經驗落差?
樣本之間的衝突
很多時候,你或許會因自身的經驗讓你對某件事打定了主意,或許加上又恰巧聽到他人有類似的遭遇,於是原本可能還保有的懷疑逐漸轉變為堅信,在這之後若是聽到截然不同的說法時,第一反應往往是質疑他人理解錯誤,而忘了自身所見所聞或許依然是小樣本,將自己和同溫層的經驗當成普遍真理——於是,偏見在不知不覺中形成。
結果輕則無法溝通,僅能禮貌性的表達「尊重但不理解」,重則演變為激烈的對立與衝突。
如果打從一開始就能對事情具備統計視角,你會發現在這種情況其實本就不必糾結孰是孰非,這時你的思考也理應轉向分析不同經驗的形成來源,而非因認知偏誤而堅持著特定觀點,讓經驗交流淪為如此的雞同鴨講⋯⋯?
沒被證實不代表證偽
再舉個更具體的例子:在科學當道的現代,許多人會質疑科學是否能對客觀事實具有唯一的話語權,那些被概稱為「玄學」等無法被證實的民俗理論是否因此全數被否決?其中又有不少人會將科學的謹慎態度視為打壓,誤以為科學蠻橫的宣稱一旦未證明某事,便等同於否定其存在。事實上這著實是對科學方法誤會大了,因為當科學無法證實某事物的時候(在這裡當然是說用統計學工具分析時),科學並沒有聲稱它是錯誤的,而是真相懸而未決。
這其實就是「假設檢定(hypothesis testing)」的概念!
當結果如果不顯著,那只意味著還無法宣稱「對立假設(alternative hypothesis)」成立,同時「虛無假設(null hypothesis)」亦沒有被肯定。講白了就是還沒有結論:沒被證實的東西,科學暫且無法證明你是對的,但也沒有說你一定是錯的。
假設檢定和刑事判決是幾乎一樣的邏輯,在證據不夠確鑿的情況下,那只意味著還無法宣稱被告有罪,同時也並沒有確認被告無罪,不過差別在於法律終究是需要給結論的,所以必須要在這時強制進行「無罪推定」來當作判決結果(但也請別在懷疑被告不一定無罪的同時,用有罪推定的思路去尋找證據、羅織罪名),科學研究則沒有這種迫切需求,我們可以繼續持保留態度,判決結果幾十年幾百年後再給出都無所謂。
而許多人誤解了這層意義,於是以為好像發現了科學的「弱點」一樣,用某些局部樣本實證有效的東西來批判成科學的侷限。有趣的是這甚至和某些群體對科學的情緒非常契合,受到了不少人的支持;相反地,也有另一群強烈擁護科學的激進份子會因此極度排斥所有沒被證實為真的事物。而當這兩類人相遇後,場面可想而知會有多麼火藥味十足。
我想⋯⋯這也是人的思考慣性吧?對事情總是需要有個答案,常保懷疑態度太耗心神。(免得大腦的 RAM / working memory 不堪負荷)
我當然也不是在說統計學可以為這些問題提供通解或是萬用的策略,統計學課本所傳授的內容大多只是一些單純的計算工具罷了,但是在理解這些工具的過程中所訓練出的那種思考方式,我認為對於這類歸納邏輯的建立、對偏誤的辨識,有相當大的助益。