FRM考試作為金融類的考試,里面涉及到數(shù)學(xué)的一些基礎(chǔ)知識(shí)。其中主要就是概率與統(tǒng)計(jì)的內(nèi)容,在本篇文章中,小編就請(qǐng)來(lái)咱們的FRM老師為大家講解FRM數(shù)學(xué)基礎(chǔ)中的有關(guān)統(tǒng)計(jì)學(xué)的知識(shí)。

樣本變異量是基本統(tǒng)計(jì)學(xué)一個(gè)很難懂也很難教的概念。初學(xué)統(tǒng)計(jì)學(xué)的學(xué)生一開始就遇到這個(gè)概念,如果沒學(xué)懂,很可能就對(duì)統(tǒng)計(jì)學(xué)喪失了信心或興趣。這個(gè)概念難懂之處并不只在于它的意義或用處,更在于它的公式:

變異量的概念

首先,我們假設(shè)給有一組n個(gè)數(shù)目的數(shù)據(jù):X1,X2,X3.......Xn, 他們的樣本平均數(shù)是X。

變異量所要測(cè)量的是這一組數(shù)據(jù)彼此間差異的程度,它告訴我們數(shù)據(jù)的同構(gòu)型或一致性。我們可以先想象這組數(shù)據(jù)全部相同的情況:數(shù)據(jù)彼此之間完全沒有差異,也就是同構(gòu)型高到不能再高了,一致性也大到不能再大了,此時(shí)變異量為0。如果數(shù)據(jù)彼此間差異*大,也就是同構(gòu)型或一致性*低,此時(shí)變異量*大。

然則為何變異量要用上面的公式計(jì)算?要算數(shù)據(jù)彼此間差異的程度,不是算出數(shù)目?jī)蓛芍g差異的總和或其平均值就好了嗎?這樣說雖然不無(wú)道理,但實(shí)際上大有問題。

設(shè)想我們把數(shù)據(jù)中所有數(shù)目依其大小標(biāo)在一直在線,一共有n個(gè)點(diǎn),則這些點(diǎn)兩兩之間一共會(huì)有C(n,2)=n!/(n-2)!2!個(gè)距離,例如n=3會(huì)有3個(gè)距離,n=4會(huì)有6個(gè)距離,n=5會(huì)有10個(gè)距離,等等。但這些距離并不是相互獨(dú)立的,因?yàn)槌讼噜弮牲c(diǎn)之間的距離外,其它的距離都可以算出來(lái)。舉例來(lái)說,若n=3而三點(diǎn)為x1<x2<x3,則共有|x1-x2|、| x2-x3|、|x1- x3|三個(gè)距離,但|x1-x2|+| x2-x3|=|x1- x3|,也就是3個(gè)距離中只有2個(gè)是獨(dú)立的,第三個(gè)可以由這兩個(gè)獨(dú)立的距離算出來(lái)。推而廣之,直線上n個(gè)點(diǎn)x1<x2<…<xn,雖然可有C(n,2)個(gè)距離,只有|x1-x2|、| x2-x3|、|x3- x4|、…、|xn-1- xn|這n-1個(gè)相鄰兩點(diǎn)之間的距離是獨(dú)立的;這n-1個(gè)距離知道之后,其它的距離也就知道了。這n-1個(gè)相鄰兩點(diǎn)的「獨(dú)立」距離,包含了樣本變異量所有的信息,因此我們不妨?xí)呵野裯-1喚作「自由度」。換句話說,「自由度」就是樣本變異量所含獨(dú)立信息的數(shù)目。

如果我們把總變異量定義為數(shù)據(jù)中這些獨(dú)立信息的總和,則當(dāng)我們把總變異量除以自由度n-1,我們就得到這些獨(dú)立信息的平均變異量了。但這樣的定義有一個(gè)問題,我們看下式就明白了:

這就等于我們小學(xué)時(shí)學(xué)過的植樹問題:「一條路有90公尺,沿路每邊種了10棵樹,兩端都種,請(qǐng)問每邊樹與樹間的平均距離多少?」這樣來(lái)算變異量,除了用到數(shù)據(jù)*數(shù)和*小數(shù)之間的「范圍」(range) 外,完全忽略了中間n-2個(gè)相對(duì)點(diǎn)位置所含的信息,因此它不是一個(gè)適當(dāng)?shù)姆椒ā?/p>

此外,因?yàn)閮蓴?shù)相減可能得到負(fù)數(shù),但距離必須是正的,所以我們常用*值來(lái)算距離。但*值函數(shù)y=|x|在x=0的地方有個(gè)尖銳轉(zhuǎn)折,不是一個(gè)平滑函數(shù),數(shù)學(xué)上不好處理。比較好的消去負(fù)號(hào)的方法是平方:負(fù)負(fù)得正。

因此統(tǒng)計(jì)學(xué)不用數(shù)據(jù)點(diǎn)兩兩之間距離*值的和來(lái)算總變異量,而是用每個(gè)數(shù)據(jù)點(diǎn)與平均數(shù)距離平方的總和,也就是前面所說的「差方和」。差方和的好處是它用到了數(shù)據(jù)中每一點(diǎn)的位置,但它同時(shí)也必須用到樣本平均數(shù)。用了樣本平均數(shù)之后,數(shù)據(jù)中的n個(gè)點(diǎn)與平均數(shù)的距離就有一個(gè)限制了。

因此它們只包含了n-1個(gè)獨(dú)立的信息。我們把n-1喚作「自由度」,也就是獨(dú)立信息的數(shù)目。把差方和除以「自由度」就得到變異量;它可以詮釋為每個(gè)獨(dú)立信息對(duì)數(shù)據(jù)所含總信息——差方和——的平均貢獻(xiàn)。變異量因?yàn)橛昧司嚯x的平方,必須開根號(hào)才能回到原來(lái)的距離單位。于是我們把變異量開根號(hào),得到的結(jié)果,就是所謂「標(biāo)準(zhǔn)偏差」(standard deviation):

這里講解的FRM數(shù)學(xué)基礎(chǔ)知識(shí)主要是回答一個(gè)問題,即統(tǒng)計(jì)學(xué)中自由度修正為啥n-1?融躍FRM老師針對(duì)這個(gè)問題做了詳細(xì)解答,如果有什么疑惑,歡迎留言咨詢?cè)蹅兊睦蠋煛?/p>