登入使用能幫助您收藏更多喜歡的好書,
希望大家都能多多登入,管理員在此感激不盡啦!
《數學屋》第78章辛普森悖論
  說起悖論,可謂大名鼎鼎。那麽,大家知道辛普森悖論嗎?具體就是說兩場活動的勝率並不能完全反映總的勝率。怎麽說呢?就是第一場的勝率和第一場的勝率甲都比乙高,然而總的勝率卻是甲沒有乙高。請問,這是什麽原因呢?核桃說。

  很簡單勝率的本質是比例,比例的本質是分數。而我們知道分數其實是很複雜的。兩個分勝率看似和總勝率有關,事實上卻是風馬牛不相及的兩個比例。我認為兩個比例就是不能真實反映總的比例的。舉個例子,有人說中國的網速沒有阿富汗的快。為什麽會這麽說呢?原來我國雖然有300萬個基站,但是我國人口很多。還有就是很多基站都建在偏遠地區,而阿富汗的基站全部都建在繁華地區。我們知道基站越多,網速越快。所以,就有個上述的結論。這說明什麽?比例並不能完全反映真實情況,甚至可能導致錯誤。

  埃斯皮諾薩,你錯了。比例是可以反映真實情況的。只不過要求有點高。如果甲乙參與了兩場同樣的活動,那麽兩場活動兩個人參與的次數相同。舉個例子,甲和乙都是編輯。第一周,甲受到了5件稿子,而他改了一篇。因此,修改率就是20/100。乙還是受到了5件稿子,而他改了2篇。修改率就是40/100。第二周,甲和乙都受到了5件稿子。甲修改了3篇,修改率是60/100。乙修改了4篇,修改率是80/100。最後,甲的總修改率是40/100,而乙的是60/100。你們看,第一周和第二周甲的修改率都低於乙的。而最後甲的總修改率還是低於乙的。這就說明所有樣本的數量必須相等,結論才有意義。嚴格來說,這不是悖論。它只是說明不同比例並不是一定就可以統計的。

  小尼,其實只要甲和乙在第一場的樣本和第二場的樣本都相等就可以了。舉個例子,甲乙還是編輯。甲和乙在第一周都受到了5件稿子。甲修改了一篇,修改率是20/100。乙修改了3篇,修改率是60/100。他們在第二周都收到了20件稿子。甲修改了4篇,修改率是20/100。乙修改了5篇,修改率是25/100。最後,甲的修改率是20/100。而乙的是32/100。你們看,這不就避免了辛普森悖論嗎!其實,當所有樣本都不相同時,也有一種情況是可以避免辛普森悖論的。那麽,大家知道這種情況嗎?

  好了,我來說一下。其實這就是一個求不等式的過程。甲乙在第一周分別收到了a、b件稿子。甲修改了m篇,修改率是m/a。乙修改了n篇,修改率是n/b。令m/a
鍵盤左右鍵 ← → 可以切換章節
章節問題回報:
翻譯有問題
章節內容不符
章節內容空白
章節內容殘缺
上下章節連動錯誤
小說很久沒更新了
章節顯示『本章節內容更新中』
其他訊息