數字和圖片絕對會騙人,如何保護自己,辨識假象?

編按:高度量化時代,數字絕對更會騙人,有圖有照片不一定有真相。數據的假象》兩位作者在華盛頓大學開設同名課程,受到極高的討論和迴響,他們運用統計與生物學領域的專精知識和經驗,以生動幽默的方式,拆解取樣偏誤與數據資料數位化混淆視聽的案例,檢視我們的生活多麼容易受到各類數據假象的影響。只要善用本書的思考方式,人人都能拆穿假象。


什麼是事實?政治人物沒在怕;什麼是科學?且看媒體怎麼報。

要根除鬼扯的存在,需得知道究竟何為鬼扯,但這就是事情棘手的地方了。

 

許多人認為自己很擅長看出哪些是鬼扯。當我們遇到以修辭技巧或華麗詞藻取勝的鬼扯時,或許真是如此,稱之為「老派鬼扯」。且看以下例子:

 

◎我們的共同任務是發揮雙邊解決方案的功能,使未獲充分利用之人力資源的機會得到運用(換句話說,我們是一家人力派遣公司)。

 

◎如同先賢列祖,我們望向那廣袤無邊的偉大國土,帶著堅定心智與滿腔熱血,要重燃吾民那同舟一命卻暫熄的火花(饒了我們吧?說說你到底打算如何讓就業機會重回這一區?)

 

雖然還不到老派鬼扯退出江湖的時候,但遇上我們稱之為「新派鬼扯」的後起之秀,可要把它給比下去了。新派鬼扯所用的語言是數學、科學與統計,藉此予人嚴謹精確的印象。那些不太站得住腳的說法,透過數字、圖表、統計數據、資料圖的妝點,就披上了一層合理的外衣。新派鬼扯可能看起來像這樣:

 

◎經匯率調整後,敝公司績效最佳的全球型基金在過去九年中有七年優於大盤(收益表現的調整方法究竟是什麼?這家公司有幾檔基金表現不如大盤?差多少?而且,九年中有七年表現優於大盤的是同一檔基金嗎?或者好幾檔不同基金在那七年中各有一年獲得優於大盤的表現呢?)。

 

◎儘管在統計上未達顯著(p=0.13),本研究結果凸顯此標靶質子治療具臨床重要之效果量(五年相對存活機率 = 1.3),挑戰了現行的治療典範作法(一個具臨床重要性卻未達統計顯著的研究結果,代表什麼?就此癌症而言,五年存活率這個衡量標準是否適切,抑或大多數的患者皆於三年內死亡?真有理由設想此結果有任何地方「挑戰了現行的治療典範作法」嗎?)。

 

◎經由我們系統性篩選顯示,有搗亂行為問題的二年級生當中,34%承認過去一年內曾吸聞麥克筆至少一次(此事為何重要?若真的重要,吸聞麥克筆是學生搗亂行為的原因或結果?沒有搗亂行為問題的學生中,承認曾吸聞麥克筆的比例是多少?說不定更高!)。

 

新派鬼扯可以很有說服力,因為大多數人看到以數字呈現的資訊,都覺得自己不夠資格去質疑,新派鬼扯人士正是仰賴這一點。若要予以反擊,就必須學會在何時、用何種方法對這類說法提出質疑。

 

我們兩位作者雙雙致力於教導學生在面對數據資料時,如何以邏輯與數量來思考。你不必非得是專業統計學家、計量經濟學者、數據科學家才能對量化論點採取批判性思考,也不需要用上龐大的資料集與好幾個星期的功夫才能看透鬼扯真相。往往只要用基本的邏輯推論去看待問題就已足夠,若有必要,再輔以搜尋引擎就能找到的資訊便可。

 

發佈日期:2022/06/01

瀏覽次數:113

卡爾‧伯格斯特姆

演化生物學家,華盛頓大學生物系教授。 研究領域:研究流行病的傳播方式,以及資訊如何在各大規模生物與社會系統中流動、生物如何相互交流,以及社交媒體如何改變社會。

數據的假象:數據識讀是深度偽造時代最重要的思辨素養,聰明決策不被操弄

★經匯率調整,敝公司績效最佳的全球型基金在過去九年中有七年優於大盤。 ★儘管在統計上未達顯著,本研究結果凸顯此標靶質子治療具臨床重要之效果量,挑戰了現行的治療典範。 類似上面的敘述,你可能也看過,是不是躍躍欲試? 別興奮得太早。你發現了嗎,上面的敘述完全沒說收益表現的調整方法究竟是什麼?有幾檔基金表現不如大盤?差多少?九年中有七年表現優於大盤的是同一檔基金嗎?另外,具臨床重要性卻未達統計顯著的研究結果,到底代表什麼?

購買這本好書