你知道均值卻不知道什么是平均數(shù)
你知道均值卻不知道什么是平均數(shù)
那么你會(huì)用平均數(shù)嗎?平均、均值、平均數(shù)、平均值,average,mean等這些都是我們zui常用到的統(tǒng)計(jì)量,但是真正要會(huì)用平均,并且知道它的適用情景是非常重要的,甚至有時(shí)候是一種常識(shí)。
你知道均值,或許不知道什么是算術(shù)平均,幾何平均,其實(shí)還有調(diào)和平均,還有中位數(shù)Median和眾數(shù)Mode。
什么是平均?簡(jiǎn)單思考的平均的意義的話,這是一種常識(shí),似乎人人都在用平均。在數(shù)據(jù)分析的時(shí)候更是經(jīng)常用到平均,平均數(shù)。實(shí)際上平均具有多種含義的,其適用情景也依賴你研究的對(duì)象意義,且采用計(jì)算的方式和方法。
所以,平均就是一個(gè)數(shù)值,它應(yīng)該能夠取代你所有數(shù)據(jù)中的每一個(gè)數(shù)據(jù)值,會(huì)得到同樣的結(jié)果;如果我把某個(gè)數(shù)值用平均值代替,是否是一個(gè)有“代表”的樣本,能夠得到同樣的意義解讀!
情景1:如果我講課有40個(gè)同學(xué)給老師講課滿意度進(jìn)行評(píng)價(jià),50%的人喜歡得1分,50%人不喜歡得-1分,平均值=0,什么意思?
情景2:我國(guó)房地產(chǎn)全國(guó)市場(chǎng),上半年房?jī)r(jià)下降41%,而下半年上漲了44%,全年平均增長(zhǎng)了1.5%嗎?
情景3:如果你開(kāi)車上班,去時(shí)你以每小時(shí)30公里到單位,下班回程你以每小時(shí)60公里到家,那么你平均開(kāi)車每小時(shí)45公里嗎?能說(shuō)明你到單位的距離嗎?
看來(lái)是要仔細(xì)斟酌一下“平均”了!
算術(shù)平均:Arithmetic Mean
優(yōu)點(diǎn):算術(shù)平均計(jì)算用到了所有數(shù)據(jù),計(jì)算相對(duì)簡(jiǎn)單只需要加法和除法,平均結(jié)果直觀,zui能表達(dá)一種把取值大的和取值小的都拉到了平均的中間值,有回歸的意義;這也是我們?cè)诮y(tǒng)計(jì)分析中zui常用的統(tǒng)計(jì)量;
缺點(diǎn):算術(shù)平均容易受到異常值的影響,沒(méi)有了差異;太中庸了,強(qiáng)調(diào)了一般性、普遍性;
例如:在電梯里,你的體重是150斤,有個(gè)小孩體重是100斤,還有一個(gè)箱子是350斤,平均重量是[(150+100+350)/3]=200斤,大概沒(méi)有人會(huì)算出三個(gè)人的平均體重是200斤,只能說(shuō)明電梯負(fù)重了多少,平均沒(méi)有任何意義,所有只能是同類數(shù)據(jù)可以算術(shù)平均;如果你把驢和馬的體重加在一起算平均,只能算出肉的意義;或許*的數(shù)據(jù)就是把別墅豪宅和保障性住房給加一起平均了;
當(dāng)然,算術(shù)平均在80%的場(chǎng)合都適用,但偏偏就有20%的情景往往用算術(shù)平均不合適!因?yàn)椋?/8原則提示20%的人占據(jù)著80%的社會(huì)財(cái)富!
比如收入,即使你的樣本量再大,只要比爾·蓋茨入樣,Average立刻發(fā)生改變!但對(duì)于體重和身高,即使有人需要用卡車?yán)鰜?lái),有人比姚明還高兩倍,只要樣本足夠大,Average也不發(fā)生改變!
中位數(shù) Median
中位數(shù)表述中間的意思,也就是通過(guò)計(jì)算中間值代表平均;例如一組排好序列的數(shù)據(jù):1,2 ,3 ,4其中位數(shù)=2.5,當(dāng)然算術(shù)平均也是2.5;但是當(dāng)數(shù)據(jù)呈現(xiàn)為:1,2,3,4,100時(shí),平均值=22,但中位數(shù)=3(中間的值);顯然用中位數(shù)合理!
優(yōu)點(diǎn):中位數(shù)對(duì)異常值不敏感,所以對(duì)于能夠成為分組數(shù)據(jù)的比較適用,因?yàn)橹形粩?shù)就將數(shù)據(jù)分成了兩個(gè)組;
缺點(diǎn):中位數(shù)需要對(duì)數(shù)據(jù)進(jìn)行排序,但大部分人在說(shuō)中間數(shù)據(jù)時(shí),別人會(huì)理解為平均;
例如:當(dāng)我們說(shuō)有一半的人生活水平在平均線以下,這個(gè)平均應(yīng)該指的是中位數(shù),而不是平均值;所以房?jī)r(jià)、收入等價(jià)格問(wèn)題不要用算術(shù)平均,中位數(shù)比較合適,否則我們都有了“被平均”的感覺(jué)!
眾數(shù) Mode
眾數(shù)就是zui多的、zui流行的意思;贏者勝出的度量,在大多數(shù)需要投票決定的情況下,選擇眾數(shù)比較理想;
優(yōu)點(diǎn):容易計(jì)算,容易理解,zui多的數(shù)就是;經(jīng)常用在選擇和投票行為中,這種情況沒(méi)有人愿意選擇平均;
缺點(diǎn):有時(shí)候沒(méi)有眾數(shù),有時(shí)候不止一個(gè);眾數(shù)更像投票,舉手表決,而不是計(jì)算;有些情況下需要唱票,方式會(huì)復(fù)雜;當(dāng)然贏者通吃情況下,沒(méi)有妥協(xié)和中間路線,多一票也是他了!
例如:大家生活工作中經(jīng)常碰到的少數(shù)服從多數(shù),就是眾數(shù)的理解;當(dāng)我們要測(cè)量人們對(duì)那部電影的偏好或評(píng)選*演員時(shí),眾數(shù)也是*選擇;你在選擇當(dāng)今流行顏色的時(shí)候,顯然平均顏色沒(méi)有任何意義;
當(dāng)然,如果北京市機(jī)動(dòng)車限行日,如果一周7天,讓大家選擇一天限行(不考慮汽車尾號(hào)),應(yīng)該選擇人們“投票”zui多的哪一天,而平均是沒(méi)有意義的。
到這里,留一個(gè)問(wèn)題給大家:
1-北京市住房新政下,90平米是貸款利率的分界點(diǎn),你認(rèn)為如果進(jìn)行調(diào)查,應(yīng)該用哪個(gè)“平均”;
幾何平均 Geometric Mean
對(duì)于平均來(lái)講,大部分人,或者說(shuō)大多數(shù)情況下,我們只要把數(shù)據(jù)加總求和,計(jì)算平均;但是當(dāng)我們談?wù)撆c投資、面積或體積、回報(bào)率、利潤(rùn)率等要素的時(shí)候,往往采用把它們乘起來(lái)求平均的方法,這就是幾何平均。
比如有兩只基金投資組合,投資了四只股票,盈虧率情況如下:
組合方案A:+10%,-10%,10%,-10%
組合方案B:+30%,-30%,30%,-30%
如果讓你選擇一個(gè)基金,你認(rèn)為那只基金盈虧比較平衡呢?顯然,如果我們采用算術(shù)平均,那么兩個(gè)組合盈虧都是0,甚至你會(huì)認(rèn)為方案B更好些呢!符合掙得到,賠得多的風(fēng)險(xiǎn)投資理念。
但如果我們采用幾何平均進(jìn)行計(jì)算:
組合方案A:1.10*0.90*1.10*0.90=0.98,開(kāi)四次方,平均約有2%的虧損,平攤到每只股票是0.5%的虧損
組合方案B:1.30*0.70*1.30*0.70=0.83,開(kāi)四次方,平均約有17%的虧損,平攤到每只股票是4.6%的虧損
現(xiàn)在大家可以看出來(lái)了,兩只基金投資組合都是虧損,但如果必須選一只基金的話,平均來(lái)講還是組合A比較穩(wěn)妥!
優(yōu)點(diǎn):乘法原則,一損俱損(加法原則是取長(zhǎng)補(bǔ)短);在綜合評(píng)價(jià)中,構(gòu)成一組指標(biāo)體系的子指標(biāo)集的數(shù)據(jù),往往采用乘法;主要用在率,面積和體積,容量等
缺點(diǎn):計(jì)算稍微復(fù)雜。
例如:
情景一:收視率分析,電視收視率,為了得到在同一起跑線上對(duì)收視率進(jìn)行比較,需要用頻道、時(shí)段和類型進(jìn)行收視率修正,就可以采用幾何平均;
情景二:通貨膨脹率計(jì)算,如果我們得到三年的通貨膨脹率是1%,2%和10%,那么平均通貨膨脹率=(1.01*1.02*1.10)^(1/3)=4.3%;
情景三:優(yōu)惠券,假如你得到三種折扣優(yōu)惠券,分別折扣是50%,25%,35%的off,那么當(dāng)你全部用上購(gòu)物的時(shí)候,你的平均折扣是多少?(0.50*0.75*0.65)^(1/3)=37.5%;
情景四:平均面積,如果你房子的客廳,面積是長(zhǎng)15米,寬4米,那么平均長(zhǎng)或?qū)捠嵌嗌伲?15*4)^(1/2)=7.75米
情景五:如果你有一個(gè)12*24*48公分的箱子,那么對(duì)應(yīng)一個(gè)標(biāo)準(zhǔn)的立方體的平均是多少?(12*24*48)^(1/3)=24公分。
從上面我們可以看出,幾何平均適用于需要乘法計(jì)算的情況下,求平均的含義!
調(diào)和平均 Harmonic Mean調(diào)和平均大家可能用得比較少了,實(shí)際上調(diào)和平均zui重要的一點(diǎn)就是在完成一個(gè)任務(wù)時(shí),也就是當(dāng)我們要分成不同的步驟完成同一個(gè)目標(biāo)時(shí),如何計(jì)算平均率的含義!
前面我們?cè)谟?jì)算上班開(kāi)車往返平均速度時(shí),去程每小時(shí)30公里,回程每小時(shí)60公里,那么采用調(diào)和平均應(yīng)該等于2/(1/30+1/60)=40公里/每小時(shí)。也就是說(shuō)調(diào)和平均是計(jì)算平均率,等于=總產(chǎn)出/總投入!
優(yōu)點(diǎn):調(diào)和平均適用于為得到同一個(gè)目標(biāo),對(duì)平均數(shù)起同等作用條件下應(yīng)用,來(lái)計(jì)算平均率;有時(shí)候在不知道分子的情況下,采用調(diào)和平均計(jì)算;
缺點(diǎn):計(jì)算復(fù)雜,取值不能有0值,也容易受異常值和值影響!
例如:如果你準(zhǔn)備攢錢分期購(gòu)買股票,但必須分三個(gè)月買股票,支付價(jià)格分別是:1月25元/股,2月30元/股,3月35元/股,那么你購(gòu)買股票的平均價(jià)格是多少呢?調(diào)和平均=3/(1/25+1/30+1/35)=29.43元/股;
現(xiàn)在你如果手頭有1萬(wàn)元或3萬(wàn)元,你就可以計(jì)算平均來(lái)講能夠買多少股了。
當(dāng)然,除了前面我們敘述的各種平均數(shù)計(jì)算方法,其實(shí)還有別的所謂平均,什么加權(quán)平均、預(yù)測(cè)值、回歸等都具有平均的意味!有時(shí)候,比較哪種平均方法誰(shuí)好誰(shuí)壞,是沒(méi)有意義的,關(guān)鍵看你掌握的數(shù)據(jù)和適用的條件。
記?。何覀?cè)谡務(wù)撈骄臅r(shí)候,其實(shí)一直不要忘了,前面有兩個(gè)前提:這就是分類和差異!離開(kāi)了分類問(wèn)題,差異問(wèn)題談平均是沒(méi)有意義的,當(dāng)然沒(méi)有平均我們就沒(méi)有辦法聊天了!
還有,談?wù)撈骄际羌僭O(shè)我們討論的事物應(yīng)該服從所謂正態(tài)分布,95%的情況;但是自然界中很多現(xiàn)象不一定服從正態(tài)分布,談?wù)撈骄蜎](méi)有意義了,例如:冪律分布。
你知道均值卻不知道什么是平均數(shù)
免責(zé)聲明
- 凡本網(wǎng)注明“來(lái)源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來(lái)源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來(lái)源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來(lái)源,并自負(fù)版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。