2009年7月21日 星期二

辛普森悖論

當人們嘗試探究兩種變數是否具有相關性的時候,比如新生錄取率與性別,報酬與性別等,會分別對之進行分組研究。辛普森悖論是在這種研究中,在某些前提下有時會產生的一種現象。即在分組比較中都佔優勢的一方,會在總評中反而是失勢的一方。該現象於20世紀初就有人討論,但一直到1951年E.H.辛普森在他發表的論文中,該現象才算正式被描述解釋。後來就以他的名字命名該悖論

請看下面的例子

一所美國高校的兩個學院,分別是法學院和商學院,新學期招生。人們懷疑這兩個學院有性別歧視。現作如下統計:

法學院

性別 錄取 拒收 總數 錄取比例
男生 8 45 53 15.1%
女生 51 101 152 33.6%
合計 59 146 205


商學院

性別 錄取 拒收 總數 錄取比例
男生 201 50 251 80.1%
女生 92 9 101 91.1%
合計 293 59 352

根據上面兩個表格來看,女生在兩個學院都被優先錄取。即女生的錄取比率較。現在將兩學院的數據匯總:

性別 錄取 拒收 總數 錄取比例
男生 209 95 304 68.8%
女生 143 110 253 56.5%
合計 352 205 557

在總評中,女生的錄取比率反而比男生

0 意見:

張貼留言