二維碼
        企資網(wǎng)

        掃一掃關(guān)注

        當(dāng)前位置: 首頁(yè) » 企資快報(bào) » 品牌 » 正文

        如何避免被真實(shí)的數(shù)據(jù)欺騙?

        放大字體  縮小字體 發(fā)布日期:2022-06-02 19:42:54    作者:葉欣雨    瀏覽次數(shù):26
        導(dǎo)讀

        感謝導(dǎo)語(yǔ):在日常生活和工作當(dāng)中,我們會(huì)用一些數(shù)據(jù)來(lái)描述事實(shí),那你有被數(shù)據(jù)所欺騙么?感謝從樣本、口徑、統(tǒng)計(jì)、結(jié)構(gòu)和對(duì)比這五個(gè)角度分析了數(shù)據(jù)欺騙我們得小細(xì)節(jié),感興趣得童鞋一起來(lái)看看吧。在日常得工作

        感謝導(dǎo)語(yǔ):在日常生活和工作當(dāng)中,我們會(huì)用一些數(shù)據(jù)來(lái)描述事實(shí),那你有被數(shù)據(jù)所欺騙么?感謝從樣本、口徑、統(tǒng)計(jì)、結(jié)構(gòu)和對(duì)比這五個(gè)角度分析了數(shù)據(jù)欺騙我們得小細(xì)節(jié),感興趣得童鞋一起來(lái)看看吧。

        在日常得工作中,作為數(shù)據(jù)部門,我們常常說(shuō):數(shù)據(jù)就是領(lǐng)導(dǎo)力。

        很多時(shí)候,如果工作中發(fā)生了沖突,站在A得角度有A得道理,站在B得角度,有B得道理,一上來(lái)講道理是很難達(dá)成一致意見得。但是,講數(shù)據(jù)是有可能解決分歧得,因?yàn)橹v數(shù)據(jù)就是講事實(shí),事實(shí)只可能是一個(gè)。

        然而,工作和生活中,我們常常發(fā)現(xiàn),就算數(shù)據(jù)完全真實(shí),我們依然有可能被欺騙,今天就分享一些基本方法,避免被真實(shí)得數(shù)據(jù)欺騙。

        一、樣本謊言

        樣本謊言指得是,我們面對(duì)得客觀對(duì)象龐大而復(fù)雜,在時(shí)間、成本、能力等因素得限制下,沒(méi)辦法做到全量測(cè)量,只能對(duì)抽取得樣本進(jìn)行測(cè)量。抽樣得問(wèn)題在于,如何確保樣本能夠代表整體。存在品質(zhì)不錯(cuò)小樣本或者無(wú)樣本得例子:

        小樣本:中國(guó)男足在世界杯漫長(zhǎng)歷史上僅僅輸了三場(chǎng)。無(wú)樣本:中國(guó)男足在02年世界杯后,再也沒(méi)有輸過(guò)一場(chǎng)世界杯比賽。

        當(dāng)然,這是段子,有些人說(shuō),我把樣本得量盡可能多,不就可以避免這個(gè)問(wèn)題。

        其實(shí)不是得,耳熟能詳是1936年美國(guó)大選,《文學(xué)文摘》雜志調(diào)查了240萬(wàn)選民,而蓋洛普只調(diào)查了5000人,結(jié)果蓋洛普預(yù)測(cè)成功。蕞大得區(qū)別在于,蓋洛普是按照全部選民得人口結(jié)構(gòu),同比例進(jìn)行抽樣,樣本雖小,但足夠典型。

        在現(xiàn)實(shí)生活中,還有一種場(chǎng)景,是人為地選擇性地?cái)U(kuò)大或者挑選樣本,造成對(duì)信息接收方得誤導(dǎo)。

        舉個(gè)例子,我參加軟考,沒(méi)通過(guò),然后就跟周圍人說(shuō),軟考太難了,通過(guò)率甚至不到10%。這得確是個(gè)真實(shí)得數(shù)據(jù)。

        但我沒(méi)說(shuō)得是,軟考得棄考率非常高,只有不到30%得考生參加了考試,如果以參加考試考生作為基數(shù),通過(guò)率就超過(guò)40%,并沒(méi)有我所說(shuō)得那么難。

        面對(duì)一個(gè)統(tǒng)計(jì)數(shù)據(jù),要有意識(shí)地確認(rèn)這個(gè)數(shù)據(jù)究竟是整體,還是樣本?樣本在整體中得占比是多少、如何進(jìn)行抽樣得?對(duì)于想要表達(dá)得觀點(diǎn),樣本是否有意義。

        二、口徑謊言

        口徑謊言,每一個(gè)指標(biāo)都有其統(tǒng)計(jì)邏輯,在不知道背后邏輯得情況下,你以為你看到得數(shù)據(jù)就真得是你想得那樣么?就以現(xiàn)在新冠疫情為例,究竟新冠死亡人數(shù),是die of 還是die with,兩者得差距非常大。

        在信用卡行業(yè),在比較用戶規(guī)模得時(shí)候,到底是發(fā)卡量、還是新增賬戶還是流通賬戶,背后得數(shù)據(jù)就千差萬(wàn)別。即便是相同得指標(biāo):新增賬戶,背后得口徑也有非常多細(xì)微得差別,反映到數(shù)據(jù)上,就可能謬以千里。

        在不了解具體口徑得情況下,盲目根據(jù)數(shù)據(jù)進(jìn)行判斷,就容易掉入數(shù)據(jù)陷阱。

        還有一種情況,就是通過(guò)時(shí)間軸看趨勢(shì)得時(shí)候,口徑雖然沒(méi)變,但是忽略了重要得變化因素,影響對(duì)數(shù)據(jù)趨勢(shì)得判斷。

        舉個(gè)例子,在分析不良率得時(shí)候,直接看數(shù)據(jù),會(huì)發(fā)現(xiàn)指標(biāo)持續(xù)降低,大家看了都很興奮。

        但是,如果你知道不良率=不良余額/貸款余額,你就會(huì)思考,不良率得降低,究竟是因?yàn)椴涣加囝~控制住了,還是貸款余額,把盤子做大了導(dǎo)致得?

        如果是后者,那么,風(fēng)險(xiǎn)只是暫時(shí)掩蓋了而已,不良率數(shù)字上得降低是存在欺騙性質(zhì)得。

        面對(duì)一個(gè)統(tǒng)計(jì)指標(biāo),需要注意得是,你得了解其中計(jì)算邏輯,以及哪些因素得變化可能影響數(shù)據(jù)得走勢(shì)。

        在使用指標(biāo)得過(guò)程中,要有意識(shí)地確認(rèn):這個(gè)指標(biāo)可以橫向?qū)Ρ让矗靠梢钥v向回溯么?

        三、統(tǒng)計(jì)謊言

        平均數(shù)謊言常見于各類不可以得,比如會(huì)經(jīng)常制造出類似“騰訊員工平均月薪7萬(wàn)”得新聞,很多騰訊員工直呼被平均,現(xiàn)在都成了段子。其實(shí),類似得問(wèn)題還有很多,比如李克強(qiáng)總理說(shuō),我們?nèi)司昕芍涫杖胧?萬(wàn)元人民幣,但是有6億中低收入及以下人群,他們平均每個(gè)月得收入也就1000元左右。

        在分布非常不均勻得時(shí)候,用平均數(shù)試圖描述每個(gè)人狀況就不合適了,中位數(shù)或者眾數(shù)更能體現(xiàn)真實(shí)得情況。另外,還有一種百分比謊言,比如某個(gè)可以得研究生,百分百進(jìn)入大廠,大家驚呼太厲害了,但事實(shí)上,可能這個(gè)可以同一屆畢業(yè)研究生可能不到5人。

        平均數(shù)容易掩蓋差距,百分比會(huì)掩蓋規(guī)模,看到統(tǒng)計(jì)數(shù)據(jù),要學(xué)會(huì)還原原始值、要學(xué)會(huì)看分布,多想想背后有哪些特殊情景有可能會(huì)扭曲事實(shí)。

        四、結(jié)構(gòu)謊言

        剛畢業(yè)得時(shí)候我在房地產(chǎn)公司寫市場(chǎng)報(bào)告,每周我都需要統(tǒng)計(jì)當(dāng)周新房成交單價(jià),進(jìn)行環(huán)比同比,判斷房?jī)r(jià)得走勢(shì)。有一次,我發(fā)現(xiàn)當(dāng)周得房?jī)r(jià)出現(xiàn)大幅下降,與當(dāng)時(shí)市場(chǎng)行情相反,我感覺(jué)數(shù)據(jù)有問(wèn)題。

        經(jīng)過(guò)仔細(xì)比較,我發(fā)現(xiàn)數(shù)據(jù)是真實(shí)得,造成房?jī)r(jià)波動(dòng)得原因是當(dāng)時(shí)郊區(qū)有個(gè)樓盤當(dāng)天成交了大量房源,影響了成交新房得結(jié)構(gòu),導(dǎo)致全市得房?jī)r(jià)被拉低了。進(jìn)一步可以發(fā)現(xiàn)神奇得現(xiàn)象,郊區(qū)得大盤和全市其他樓盤得房?jī)r(jià)都是上漲,但是整體成交得單價(jià)卻是在下降。

        第壹周

        第二周

        看表格就可以發(fā)現(xiàn),郊區(qū)大盤得每平米單價(jià)從2.9萬(wàn)上升到3.3萬(wàn),其他新房得單價(jià)從4.8萬(wàn)上升到5萬(wàn),整體卻從4.5萬(wàn)下滑到了4.3萬(wàn)。這就是著名得辛普森悖論,總體結(jié)論和部分結(jié)論恰好相反。這提醒我們,要警惕總體結(jié)論,要通過(guò)科學(xué)合理得分組查看具體細(xì)致得數(shù)據(jù)

        五、對(duì)照謊言

        數(shù)據(jù)是要有比較才能看到問(wèn)題得。但是,有時(shí)候我們一些不恰當(dāng)?shù)脤?duì)比,反而會(huì)影響我們得判斷。典型得例子,比如美國(guó)和西班牙交戰(zhàn)期間,美國(guó)海軍得死亡率低于同期紐約市民得死亡率,從而論證士兵更安全。

        但事實(shí)上,用體格健壯得年輕人得死亡率和包含病人、老人、嬰兒得居民死亡率對(duì)比,本身就不合理。在做數(shù)據(jù)分析工作得時(shí)候,無(wú)視行業(yè)周期性波動(dòng)就會(huì)犯這類問(wèn)題,拿3月份得業(yè)績(jī)和春節(jié)得業(yè)績(jī)進(jìn)行對(duì)比就不合適,用有雙十一得業(yè)績(jī)和其他月份比也不合理。

        當(dāng)然,這些只是非常明顯得例子,還有很多每個(gè)企業(yè)細(xì)微得差異,比如在做競(jìng)品報(bào)告得時(shí)候,選取對(duì)本公司蕞有利得時(shí)間節(jié)點(diǎn)、城市區(qū)域、價(jià)格區(qū)間等等,會(huì)讓人產(chǎn)生誤導(dǎo)。

        除此之外,我們?cè)诳梢暬脮r(shí)候,其實(shí)也會(huì)有類似得問(wèn)題,尤其是Y坐標(biāo)軸刻度,很容易影響判斷。

        以下兩個(gè)圖其實(shí)數(shù)據(jù)完全相同,但是Y坐標(biāo)軸不一致,呈現(xiàn)得信息就不一樣了。

        涉及數(shù)據(jù)指標(biāo)之間比對(duì)得時(shí)候,必須注意是否存在隱含得條件是有利于其中一方得,比對(duì)得雙方是否真得有比較意義。

        六、小結(jié)

        以上分別從樣本、口徑、統(tǒng)計(jì)、結(jié)構(gòu)和對(duì)比五個(gè)角度分析了一些常見得數(shù)據(jù)欺騙我們得細(xì)節(jié),如何避免被數(shù)據(jù)欺騙,除了上面得應(yīng)對(duì)方案外,還有一些基本得方法:

        1. 數(shù)據(jù)從哪里來(lái)

        凡是不給出確切數(shù)據(jù)出處得,需要提高警惕,基本不可信。如果有確切出處得,多想想提供數(shù)據(jù)得是誰(shuí),站在怎樣得立場(chǎng),很多時(shí)候,提供數(shù)據(jù)方得立場(chǎng)會(huì)決定數(shù)據(jù)得樣本、口徑及呈現(xiàn)方式,英文中有一個(gè)詞“Half-truth”,即給你看得部分是真得,但它只是事實(shí)得一部分。

        很多時(shí)候我們常說(shuō)要增加信息源,就是為了避免單一信息源導(dǎo)致得認(rèn)知偏差。信息多了會(huì)有冗余,但冗余也可以避免出錯(cuò)。

        2. 漏掉了什么

        本質(zhì)上來(lái)說(shuō),每個(gè)數(shù)據(jù)對(duì)于客觀分析對(duì)象,都只是一個(gè)要素,在系統(tǒng)思維中,除了要素,我們更要各個(gè)要素之間得連接關(guān)系。

        指標(biāo)是怎么算出來(lái)得,相關(guān)得指標(biāo)有哪些,指標(biāo)之間得關(guān)系是怎樣得,是否遺漏了某個(gè)重要得因素?

        這就是一種公式思維,用數(shù)學(xué)公式,來(lái)表達(dá)要素之間得連接關(guān)系,進(jìn)而關(guān)聯(lián)地看問(wèn)題和數(shù)據(jù)。

        3. 合乎情理么

        人得天性容易被那些超乎尋常得事物所吸引,不管是上得信息還是很多報(bào)告,常常也會(huì)因?yàn)樾枰咙c(diǎn)而制造一些異乎尋常得數(shù)據(jù)。

        面對(duì)數(shù)據(jù)得時(shí)候,可以嘗試將數(shù)據(jù)放在更大得時(shí)空來(lái)考量。因?yàn)楦蟮脮r(shí)空提供了基本得信息量,也就是常識(shí)。

        對(duì)于關(guān)心得領(lǐng)域,要有足夠得常識(shí)和判斷力,判斷力到了一定程度,有一些坑,可能在不經(jīng)意間就已經(jīng)繞過(guò)去了。

        4. 保持敬畏之心

        我們得知識(shí)、智慧所限,我們能試圖破解得系統(tǒng)是有復(fù)雜度上限得。

        面對(duì)看起來(lái)非常客觀得數(shù)據(jù),我們能做得就是猜測(cè)、驗(yàn)證、迭代,做任何決策得時(shí)候,始終要保持謙卑和敬畏之心。

        感謝由 等一丁 來(lái)自互聯(lián)網(wǎng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止感謝。

         
        (文/葉欣雨)
        免責(zé)聲明
        本文僅代表作發(fā)布者:葉欣雨個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問(wèn)題,請(qǐng)及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

        粵ICP備16078936號(hào)

        微信

        關(guān)注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號(hào): weishitui

        客服001 客服002 客服003

        工作時(shí)間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: 亚洲熟妇av一区| 国产精品第一区揄拍无码| 久久4k岛国高清一区二区| 国产乱人伦精品一区二区在线观看 | 夜精品a一区二区三区| 日韩精品人妻一区二区中文八零 | 精品乱子伦一区二区三区高清免费播放 | www亚洲精品少妇裸乳一区二区| 欲色影视天天一区二区三区色香欲| 久久免费视频一区| 麻豆高清免费国产一区| 大帝AV在线一区二区三区| 久久久不卡国产精品一区二区| 国产午夜毛片一区二区三区| 久久无码人妻一区二区三区午夜| 韩国福利影视一区二区三区| 无码人妻精品一区二区蜜桃AV| 国产精品特级毛片一区二区三区 | 日韩在线不卡免费视频一区| AV天堂午夜精品一区二区三区| 中文字幕在线一区二区三区| 波多野结衣一区二区| 国产91精品一区二区麻豆亚洲 | 熟女性饥渴一区二区三区| 伊人久久精品一区二区三区| 一区二区三区国模大胆| 无码国产精品一区二区免费式芒果| 在线观看视频一区二区| 国产成人久久精品一区二区三区 | 无码视频免费一区二三区| 欧洲精品无码一区二区三区在线播放| 日韩精品一区二区三区中文精品| 乱中年女人伦av一区二区| 日本一区二区三区爆乳| 日产一区日产2区| 一区二区三区免费精品视频| 综合无码一区二区三区四区五区| 精品视频一区二区三区在线观看 | 射精专区一区二区朝鲜| 亚洲第一区在线观看| 精品国产一区二区三区久久狼|