而隨著我們做判斷的參考資訊越多(這裡還牽涉到另一個問題:如何判斷資訊是可參考的?意即你得分辨出是訊號?還是雜音?),可能會修正我們對於機率的判斷,也就是貝氏機率的概念。
貝氏機率,其實就是一種「條件機率」
簡單來說,就是對於一個事件發生的機率,再加入相關的資訊之後,會改變我們對於這個事件發生的機率判斷;藉此,我們可以做出風險更低的判斷,換句話說:勝算更高。(但機率這回事是這樣,即便發生率只有1%,但發生了就是發生了,不會因為機率低就不會發生。)
貝氏機率最有名的例子,就是「蒙提.霍爾問題 (Monty Hall problem)」源自一個電視遊戲節目。
「有三扇門,每扇門後各有一份獎品,山羊或者汽車,而且僅有一扇門後藏有大獎汽車。當參賽者從三扇門中選定一門還未開啟時,知道門後情形的主持人會打開剩下兩道門後藏有山羊的一扇門,露出山羊頭,然後問參賽者:要不要換?」。
直覺上來想,剩下的兩扇門不管換不換,中大獎的機率不都是二分之一嗎?換了有什麼優勢?
過程的討論在此不再詳加贅述,有興趣的朋友可以上網查查,或是詢問身邊念數學的朋友。簡單來說,在一開始選中汽車的機率是三分之一,而當公布有一扇門是山羊時,選擇「換」這時贏得汽車的機率會是三分之二,所以換了勝算會比較大,這就是運用貝氏定理將那扇公開是山羊門的資訊納入後重新計算的結果。
舉個例子,我望了望陰陰的天空…
「我覺得等一下要下雨了」我說。
「我認為有65%的可能性會下雨」身為統計人,我應該調整為這樣的說法。
拿起手機,滑了一下氣象局的降雨預報……
「我認為有90%的可能性會下雨」這是納入貝氏機率後重新修正的說法。
貝氏機率指的是基於某個附加條件機率B下,重新判斷事件A的發生機率;更白話點說,就是
「越多的有用資訊加入,可能會改變我們對於原本一件事件發生的機率判斷;這個機率可能會下修、也可能上調,但肯定會更精確。」
生活上的例子,比如說最近一次颱風假,柯文哲到晚上十點才宣布照常上班上課,就有引用貝氏機率,因為越接近決策時間點,所獲得的數據佐證對於決策的風險越低,不論屆時數據告訴他是該放假?或是該上班。
颱風登陸前三天,與前一天的路徑機率也是貝氏機率的運用,離生成點越遠,可作為評估的資料越多,離本島越近,可獲得的地形影響條件越充足,就會使得最後判斷颱風的登陸路徑的誤判風險機率降至最低。
另一個生活化的例子,就是當我們要辦一個講座時,假設一百人中會來的機率是50%或其他數字;但是當我們納入一個訊息「辦在平日上午的時間」這時這個機率就可能被修正為20%或更低的數字,而納入另一個訊息「辦在平日晚上」可能會使得這個機率修正為55%或更高;因此,我們在做決策上會傾向於不選擇「辦在平日上午的時間」,這就是貝氏機率的應用,我們平時做決策或多或少會用到,只是自己在無意識的情況下使用,如果能刻意的「收集有用資料」做為決策依據,就能提升決策的品質。
擁抱機率與不確定性,是科學決策的基本。
思維二:改變接收訊息到做判斷的路徑