當人們嘗試探究兩種變數是否具有相關性的時候,比如新生錄取率與性別,報酬與性別等,會分別對之進行分組研究。辛普森悖論是在這種研究中,在某些前提下有時會產生的一種現象。即在分組比較中都佔優勢的一方,會在總評中反而是失勢的一方。該現象於20世紀初就有人討論,但一直到1951年E.H.辛普森在他發表的論文中,該現象才算正式被描述解釋。後來就以他的名字命名該悖論。
請看下面的例子
一所美國高校的兩個學院,分別是法學院和商學院,新學期招生。人們懷疑這兩個學院有性別歧視。現作如下統計:
法學院
性別 | 錄取 | 拒收 | 總數 | 錄取比例 |
---|---|---|---|---|
男生 | 8 | 45 | 53 | 15.1% |
女生 | 51 | 101 | 152 | 33.6% |
合計 | 59 | 146 | 205 |
商學院
性別 | 錄取 | 拒收 | 總數 | 錄取比例 |
---|---|---|---|---|
男生 | 201 | 50 | 251 | 80.1% |
女生 | 92 | 9 | 101 | 91.1% |
合計 | 293 | 59 | 352 |
根據上面兩個表格來看,女生在兩個學院都被優先錄取。即女生的錄取比率較高。現在將兩學院的數據匯總:
性別 | 錄取 | 拒收 | 總數 | 錄取比例 |
---|---|---|---|---|
男生 | 209 | 95 | 304 | 68.8% |
女生 | 143 | 110 | 253 | 56.5% |
合計 | 352 | 205 | 557 |
在總評中,女生的錄取比率反而比男生低。
0 意見:
張貼留言