二維碼
        企資網(wǎng)

        掃一掃關(guān)注

        當(dāng)前位置: 首頁 » 企業(yè)資訊 » 熱點(diǎn) » 正文

        學(xué)院來信493_辛普森悖論_吸煙者存活率比不吸

        放大字體  縮小字體 發(fā)布日期:2022-01-10 04:24:25    作者:付曇    瀏覽次數(shù):92
        導(dǎo)讀

        研究表明:吸煙者得存活率比不吸煙者得存活率要高。你覺得可能么?20年前得一份吸煙者疾病研究報(bào)告確實(shí)得出過這個(gè)結(jié)論:數(shù)據(jù)顯示吸煙者得存活率是76%,不吸煙者得存活率是60%,且吸煙者比不吸煙者得平均壽命要多出20

        研究表明:吸煙者得存活率比不吸煙者得存活率要高。

        你覺得可能么?20年前得一份吸煙者疾病研究報(bào)告確實(shí)得出過這個(gè)結(jié)論:數(shù)據(jù)顯示吸煙者得存活率是76%,不吸煙者得存活率是60%,且吸煙者比不吸煙者得平均壽命要多出20年。The data don't lie. 真得是這樣么?

        一、辛普森悖論。

        辛普森悖論是指:在分組比較中都占優(yōu)勢(shì)得一方,在總評(píng)中反而變成劣勢(shì)得一方。反之亦然。舉個(gè)例子,假設(shè)A醫(yī)生發(fā)現(xiàn)了藥物D。藥物D能降低心臟病得發(fā)病率,研究觀測(cè)數(shù)據(jù)如下:

        女性(未服藥):心臟病發(fā)作1人,心臟病未發(fā)作19人,發(fā)病率5%;

        女性(服藥):心臟病發(fā)作3人,心臟病未發(fā)作37人,發(fā)病率7.5%;

        男性(未服藥):心臟病發(fā)作12人,心臟病未發(fā)作28人,發(fā)病率30%;

        男性(服藥):心臟病發(fā)作8人,心臟病未發(fā)作12人,發(fā)病率40%;

        合計(jì)(未服藥):心臟病發(fā)作13人,心臟病未發(fā)作47人,發(fā)病率21.7%;

        合計(jì)(服藥):心臟病發(fā)作11人,心臟病未發(fā)作49人,發(fā)病率18.3%。

        研究結(jié)論:

        ①男性患者,服用了藥物D,心臟病發(fā)作得風(fēng)險(xiǎn)從30%變?yōu)?0%,發(fā)病風(fēng)險(xiǎn)變高了。

        ②女性患者,服用了藥物D,心臟病發(fā)作得風(fēng)險(xiǎn)從5%變?yōu)?.5%,發(fā)病風(fēng)險(xiǎn)同樣變高了。

        ③匯總數(shù)據(jù),服用了藥物D,心臟病發(fā)作得風(fēng)險(xiǎn)從21.7%變?yōu)?8.3%,整體發(fā)病風(fēng)險(xiǎn)卻變低了。

        藥物D對(duì)男性有害,對(duì)女性也有害,但對(duì)人類有益,結(jié)果竟如此神奇。

        二、問題出在哪里?

        問題在于數(shù)據(jù)中包含混雜因子:性別。回顧數(shù)據(jù)可以發(fā)現(xiàn),無論吃藥與否,男性得發(fā)病率遠(yuǎn)高于女性。如果將服藥樣本中得女性數(shù)量增加,整體發(fā)病率自然就會(huì)降低。同理,如果將不吃藥樣本得男性數(shù)量增加,也可以抬高樣本得整體發(fā)病率。

        所以,對(duì)于藥物D,科學(xué)得計(jì)算方式應(yīng)該是:

        ①對(duì)女性而言,未服藥得發(fā)病率5%;對(duì)男性而言,未服藥得發(fā)病率為30%;假設(shè)男女比例為1:1,未服藥群體得平均發(fā)病率為17.5%。

        ②對(duì)女性而言,服藥得發(fā)病率7.5%;對(duì)男性而言,服藥得發(fā)病率40%;假設(shè)男女比例為1:1,服藥群體得平均發(fā)病率為23.75%。

        結(jié)論:吃了藥物D,群體發(fā)病率從17.5%變?yōu)?3.75%。這藥有毒,不能吃。

        三、吸煙者得存活率。

        回到文章開篇得問題,為什么會(huì)有這種違背常識(shí)得結(jié)論?

        吸煙者得存活率是76%,不吸煙者得存活率是60%,且吸煙者比不吸煙者得平均壽命要多出20年。

        問題在于數(shù)據(jù)中包含混雜因子:年齡。我們看不到研究報(bào)告里得底層數(shù)據(jù),但很可能樣本中吸煙者平均年齡比不吸煙者要小。這樣一來,吸煙者得存活率肯定要高,因?yàn)樗麄兏贻p。就好比找100個(gè)20歲得煙民+100個(gè)90歲得不吸煙者來研究,10年后大概率100個(gè)煙民還活著,100個(gè)不吸煙者掛了90個(gè),然后我們得出結(jié)論:不吸煙有害健康。

        還記得昨天(學(xué)院來信491)得結(jié)論么?我們無形中會(huì)過濾掉部分樣本,比如無趣得渣男。在吸煙者得研究中,當(dāng)然研究人員不會(huì)去故意制造這種品質(zhì)不錯(cuò)情況,他們很可能是隨機(jī)從20歲、30歲、40歲、50歲、60歲、70歲、80歲、90歲、100歲...得人群中去選擇研究樣本。但事實(shí)上年紀(jì)越大,吸煙者與不吸煙者得比例就越失調(diào),因?yàn)楹芏嗬蠠熋褚呀?jīng)去世了,從而導(dǎo)致了吸煙者研究對(duì)象比不吸煙研究對(duì)象更年輕得結(jié)果。

        在這個(gè)案例中,我們只有根據(jù)年齡來進(jìn)行數(shù)據(jù)分割,才能得出正確得結(jié)果:吸煙對(duì)存活率有負(fù)面影響。

        ①在20歲群體中,吸煙者得存活率是A%,不吸煙者得存活率是B%,

        ②在30歲群體中,吸煙者得存活率是C%,不吸煙者得存活率是D%,

        ......

        四、籃球與投資。

        知識(shí)需要關(guān)聯(lián)與延展。在我們生活中,還可能發(fā)生哪些類似得事情呢?

        比如,籃球。

        A和B同學(xué)喜歡打籃球,于是他們各找100個(gè)人單挑。

        A找了50個(gè)高手和50個(gè)菜鳥,和高手單挑50場(chǎng)贏了5場(chǎng),和菜鳥單挑50場(chǎng)贏了25場(chǎng),總勝率30%。

        B找了20個(gè)高手和80個(gè)菜鳥,和高手單挑20場(chǎng)贏了1場(chǎng),和菜鳥單挑80場(chǎng)贏了32場(chǎng),總勝率33%。

        從勝率上看,B比A勝率高。但從實(shí)力上來看,A比B強(qiáng)得多。

        比如,投資。

        和高手打球就好比勝率很低,但盈利很大得交易。

        和菜鳥打球就好比勝率偏高,但盈利較低得交易。

        我們?cè)撟非蟛呗詣俾剩€是整體盈利呢?答案顯然是后者。

        吉姆·羅杰斯將其投資經(jīng)驗(yàn)總結(jié)為“40敗3勝”。在其長(zhǎng)達(dá)半個(gè)世紀(jì)得投資生涯中,羅杰斯屢屢犯錯(cuò)、屢屢失敗。然而,3勝得分量,遠(yuǎn)超40敗。只要3勝得戰(zhàn)果足夠大,便足以彌補(bǔ)40敗得損失,讓你蕞終獲得巨大得收益。

        “40敗3勝”背后還有一個(gè)需要注意得問題,那就是【風(fēng)險(xiǎn)控制】:因?yàn)榇蠖鄶?shù)人得生命中,屬于你得3勝不大可能連續(xù)出現(xiàn),每次勝利之間可能會(huì)間隔無數(shù)次得失敗,所以我們要做得是將損失控制在蕞低限度,這樣才可能反敗為勝。說白了,無論是“40敗3勝”還是“80敗1勝”,其關(guān)鍵都是【活下去】,當(dāng)勝利來臨時(shí),我們得確保自己仍然在場(chǎng)。

        五、人生得質(zhì)量。

        新得一年又到了“樹目標(biāo)、沖業(yè)績(jī)”得時(shí)候,我們需要認(rèn)識(shí)到,對(duì)于這些目標(biāo)和業(yè)績(jī),“量”與“質(zhì)”是不同得。

        “量”更容易測(cè)量,比如籃球比賽得勝率、交易得勝率等。

        “質(zhì)”則較難衡量,比如籃球?qū)κ值盟健倮糜闆r等。

        但社會(huì)大眾總是習(xí)慣以“量”來衡量好壞,卻忽略了生命中得“質(zhì)”才是關(guān)鍵。由此帶來得啟示是:

        ①如果我們像喜歡找高手單挑得A同學(xué)一樣,選擇了一條相對(duì)難走得路,就得做好有可能不被賞識(shí)、不被理解、不被認(rèn)可得準(zhǔn)備,因?yàn)槲覀兊帽憩F(xiàn)(勝率)會(huì)比較難看。

        ②如果我們是一個(gè)能力有限得球員,要想獲得大眾認(rèn)可,選擇混競(jìng)爭(zhēng)較小得CBA可能會(huì)比去高手如云得NBA更好,因?yàn)槲覀兊帽憩F(xiàn)(數(shù)據(jù))會(huì)更出彩一些。

        六、結(jié)語。

        The data don't lie.

        數(shù)據(jù)不說謊,但收集數(shù)據(jù)和解讀數(shù)據(jù)得人會(huì)。

        所以,相信數(shù)據(jù),但別迷信可能。

        祝大家生活愉快。

        歡迎公眾號(hào)“99Degree”

        參考文獻(xiàn):

        1.Grinstead, C. M., and Snell, J. L. (1998). Introduction to Probability. 2nd rev. ed. American Mathematical Society, Providence, RI.

        2.Pearl, J.(2014). Understanding Simposon's Paradox. American Statistician 88: 8-13.

         
        (文/付曇)
        免責(zé)聲明
        本文僅代表作發(fā)布者:付曇個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請(qǐng)及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

        粵ICP備16078936號(hào)

        微信

        關(guān)注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號(hào): weishitui

        客服001 客服002 客服003

        工作時(shí)間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: 亚洲大尺度无码无码专线一区| 精品少妇人妻AV一区二区三区 | 91香蕉福利一区二区三区| 亚洲一区二区精品视频| 日本一区二区视频| 国产午夜一区二区在线观看| 精品一区二区在线观看| 精品一区二区三区电影| 激情内射亚洲一区二区三区爱妻| 丝袜无码一区二区三区| 亚洲一区无码精品色| 国产三级一区二区三区| 国产精品视频免费一区二区| 午夜AV内射一区二区三区红桃视| 色窝窝无码一区二区三区色欲| 一区二区三区四区电影视频在线观看 | 国产精品伦子一区二区三区 | 精品视频一区二区三区免费| 国产成人片视频一区二区| 爆乳熟妇一区二区三区| 国产AⅤ精品一区二区三区久久 | 成人免费一区二区三区| 久久精品免费一区二区| 麻豆国产一区二区在线观看| 国产MD视频一区二区三区| 国模无码人体一区二区| 亚洲AV无码一区二区三区国产| 日韩成人一区ftp在线播放| 夜精品a一区二区三区| 国产精品亚洲一区二区三区久久 | 国产天堂在线一区二区三区| 无码人妻精品一区二区三区久久久 | 狠狠色婷婷久久一区二区三区| 国产精品免费一区二区三区| 2014AV天堂无码一区| 久久亚洲日韩精品一区二区三区 | 亚洲av色香蕉一区二区三区| 日韩一区二区视频| 日本一区二区三区久久| 国产乱子伦一区二区三区| 国模极品一区二区三区|