方法:因子分析法.doc
《方法:因子分析法.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《方法:因子分析法.doc(6頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
因子分析基礎(chǔ)理論知識(shí)1 概念因子分析(Factor analysis):就是用少數(shù)幾個(gè)因子來(lái)描述許多指標(biāo)或因素之間的聯(lián)系,以較少幾個(gè)因子來(lái)反映原資料的大部分信息的統(tǒng)計(jì)學(xué)分析方法。從數(shù)學(xué)角度來(lái)看,主成分分析是一種化繁為簡(jiǎn)的降維處理技術(shù)。 主成分分析(Principal component analysis):是因子分析的一個(gè)特例,是使用最多的因子提取方法。它通過(guò)坐標(biāo)變換手段,將原有的多個(gè)相關(guān)變量,做線性變化,轉(zhuǎn)換為另外一組不相關(guān)的變量。選取前面幾個(gè)方差最大的主成分,這樣達(dá)到了因子分析較少變量個(gè)數(shù)的目的,同時(shí)又能與較少的變量反映原有變量的絕大部分的信息。兩者關(guān)系:主成分分析(PCA)和因子分析(FA)是兩種把變量維數(shù)降低以便于描述、理解和分析的方法,而實(shí)際上主成分分析可以說(shuō)是因子分析的一個(gè)特例。2 特點(diǎn)(1)因子變量的數(shù)量遠(yuǎn)少于原有的指標(biāo)變量的數(shù)量,因而對(duì)因子變量的分析能夠減少分析中的工作量。(2)因子變量不是對(duì)原始變量的取舍,而是根據(jù)原始變量的信息進(jìn)行重新組構(gòu),它能夠反映原有變量大部分的信息。(3)因子變量之間不存在顯著的線性相關(guān)關(guān)系,對(duì)變量的分析比較方便,但原始部分變量之間多存在較顯著的相關(guān)關(guān)系。(4)因子變量具有命名解釋性,即該變量是對(duì)某些原始變量信息的綜合和反映。在保證數(shù)據(jù)信息丟失最少的原則下,對(duì)高維變量空間進(jìn)行降維處理(即通過(guò)因子分析或主成分分析)。顯然,在一個(gè)低維空間解釋系統(tǒng)要比在高維系統(tǒng)容易的多。3 類型根據(jù)研究對(duì)象的不同,把因子分析分為R型和Q型兩種。當(dāng)研究對(duì)象是變量時(shí),屬于R型因子分析;當(dāng)研究對(duì)象是樣品時(shí),屬于Q型因子分析。但有的因子分析方法兼有R型和Q型因子分析的一些特點(diǎn),如因子分析中的對(duì)應(yīng)分析方法,有的學(xué)者稱之為雙重型因子分析,以示與其他兩類的區(qū)別。4分析原理假定:有n個(gè)地理樣本,每個(gè)樣本共有p個(gè)變量,構(gòu)成一個(gè)np階的地理數(shù)據(jù)矩陣 : 當(dāng)p較大時(shí),在p維空間中考察問(wèn)題比較麻煩。這就需要進(jìn)行降維處理,即用較少幾個(gè)綜合指標(biāo)代替原來(lái)指標(biāo),而且使這些綜合指標(biāo)既能盡量多地反映原來(lái)指標(biāo)所反映的信息,同時(shí)它們之間又是彼此獨(dú)立的。線性組合:記x1,x2,xp為原變量指標(biāo),z1,z2,zm(mp)為新變量指標(biāo)(主成分),則其線性組合為: Lij是原變量在各主成分上的載荷 無(wú)論是哪一種因子分析方法,其相應(yīng)的因子解都不是唯一的,主因子解僅僅是無(wú)數(shù)因子解中之一。 zi與zj相互無(wú)關(guān); z1是x1,x2,xp的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1,x2,的所有線性組合中方差最大者。則,新變量指標(biāo)z1,z2,分別稱為原變量指標(biāo)的第一,第二,主成分。Z為因子變量或公共因子,可以理解為在高維空間中互相垂直的m個(gè)坐標(biāo)軸。主成分分析實(shí)質(zhì)就是確定原來(lái)變量xj(j=1,2 ,p)在各主成分zi(i=1,2,m)上的荷載 lij。從數(shù)學(xué)上容易知道,從數(shù)學(xué)上也可以證明,它們分別是相關(guān)矩陣的m個(gè)較大的特征值所對(duì)應(yīng)的特征向量。5分析步驟5.1 確定待分析的原有若干變量是否適合進(jìn)行因子分析(第一步)因子分析是從眾多的原始變量中重構(gòu)少數(shù)幾個(gè)具有代表意義的因子變量的過(guò)程。其潛在的要求:原有變量之間要具有比較強(qiáng)的相關(guān)性。因此,因子分析需要先進(jìn)行相關(guān)分析,計(jì)算原始變量之間的相關(guān)系數(shù)矩陣。如果相關(guān)系數(shù)矩陣在進(jìn)行統(tǒng)計(jì)檢驗(yàn)時(shí),大部分相關(guān)系數(shù)均小于0.3且未通過(guò)檢驗(yàn),則這些原始變量就不太適合進(jìn)行因子分析。進(jìn)行原始變量的相關(guān)分析之前,需要對(duì)輸入的原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化計(jì)算(一般采用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化方法,標(biāo)準(zhǔn)化后的數(shù)據(jù)均值為0,方差為1)。SPSS在因子分析中還提供了幾種判定是否適合因子分析的檢驗(yàn)方法。主要有以下3種:巴特利特球形檢驗(yàn)(Bartlett Test of Sphericity)反映象相關(guān)矩陣檢驗(yàn)(Anti-image correlation matrix)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)(1)巴特利特球形檢驗(yàn)該檢驗(yàn)以變量的相關(guān)系數(shù)矩陣作為出發(fā)點(diǎn),它的零假設(shè)H0為相關(guān)系數(shù)矩陣是一個(gè)單位陣,即相關(guān)系數(shù)矩陣對(duì)角線上的所有元素都為1,而所有非對(duì)角線上的元素都為0,也即原始變量?jī)蓛芍g不相關(guān)。巴特利特球形檢驗(yàn)的統(tǒng)計(jì)量是根據(jù)相關(guān)系數(shù)矩陣的行列式得到。如果該值較大,且其對(duì)應(yīng)的相伴概率值小于用戶指定的顯著性水平,那么就應(yīng)拒絕零假設(shè)H0,認(rèn)為相關(guān)系數(shù)不可能是單位陣,也即原始變量間存在相關(guān)性。(2)反映象相關(guān)矩陣檢驗(yàn)該檢驗(yàn)以變量的偏相關(guān)系數(shù)矩陣作為出發(fā)點(diǎn),將偏相關(guān)系數(shù)矩陣的每個(gè)元素取反,得到反映象相關(guān)矩陣。偏相關(guān)系數(shù)是在控制了其他變量影響的條件下計(jì)算出來(lái)的相關(guān)系數(shù),如果變量之間存在較多的重疊影響,那么偏相關(guān)系數(shù)就會(huì)較小,這些變量越適合進(jìn)行因子分析。(3)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)該檢驗(yàn)的統(tǒng)計(jì)量用于比較變量之間的簡(jiǎn)單相關(guān)和偏相關(guān)系數(shù)。KMO值介于0-1,越接近1,表明所有變量之間簡(jiǎn)單相關(guān)系數(shù)平方和遠(yuǎn)大于偏相關(guān)系數(shù)平方和,越適合因子分析。其中,Kaiser給出一個(gè)KMO檢驗(yàn)標(biāo)準(zhǔn):KMO0.9,非常適合;0.8KMO0.9,適合;0.7KMO0.8,一般;0.6KMO0.7,不太適合;KMO0)和相應(yīng)的標(biāo)準(zhǔn)正交的特征向量li;根據(jù)相關(guān)系數(shù)矩陣的特征根,即公共因子Zj的方差貢獻(xiàn)(等于因子載荷矩陣L中第j列各元素的平方和),計(jì)算公共因子Zj的方差貢獻(xiàn)率與累積貢獻(xiàn)率。主成分分析是在一個(gè)多維坐標(biāo)軸中,將原始變量組成的坐標(biāo)系進(jìn)行平移變換,使得新的坐標(biāo)原點(diǎn)和數(shù)據(jù)群點(diǎn)的重心重合。新坐標(biāo)第一軸與數(shù)據(jù)變化最大方向?qū)?yīng)。通過(guò)計(jì)算特征根(方差貢獻(xiàn))和方差貢獻(xiàn)率與累積方差貢獻(xiàn)率等指標(biāo),來(lái)判斷選取公共因子的數(shù)量和公共因子(主成分)所能代表的原始變量信息。公共因子個(gè)數(shù)的確定準(zhǔn)則:1)根據(jù)特征值的大小來(lái)確定,一般取大于1的特征值對(duì)應(yīng)的幾個(gè)公共因子/主成分。2)根據(jù)因子的累積方差貢獻(xiàn)率來(lái)確定,一般取累計(jì)貢獻(xiàn)率達(dá)85-95%的特征值所對(duì)應(yīng)的第一、第二、第m(mp)個(gè)主成分。也有學(xué)者認(rèn)為累積方差貢獻(xiàn)率應(yīng)在80以上。5.3 因子變量的命名解釋因子變量的命名解釋是因子分析的另一個(gè)核心問(wèn)題。經(jīng)過(guò)主成分分析得到的公共因子Z1,Z2,Zm是對(duì)原有變量的綜合。在實(shí)際的應(yīng)用分析中,主要通過(guò)對(duì)載荷矩陣進(jìn)行分析,得到因子變量和原有變量之間的關(guān)系,從而對(duì)新的因子變量進(jìn)行命名。利用因子旋轉(zhuǎn)方法能使因子變量更具有可解釋性。計(jì)算主成分載荷,構(gòu)建載荷矩陣A。載荷矩陣A中某一行表示原有變量 Xi與公共因子的相關(guān)關(guān)系。載荷矩陣A中某一列表示某一個(gè)公共因子能夠解釋的原有變量 Xi的信息量。有時(shí)因子載荷矩陣的解釋性不太好,通常需要進(jìn)行因子旋轉(zhuǎn),使原有因子變量更具有可解釋性。因子旋轉(zhuǎn)的主要方法:正交旋轉(zhuǎn)、斜交旋轉(zhuǎn)。正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)是因子旋轉(zhuǎn)的兩類方法。前者由于保持了坐標(biāo)軸的正交性,因此使用最多。正交旋轉(zhuǎn)的方法很多,其中以方差最大化法最為常用。方差最大正交旋轉(zhuǎn)(varimax orthogonal rotation)基本思想:使公共因子的相對(duì)負(fù)荷的方差之和最大,且保持原公共因子的正交性和公共方差總和不變。可使每個(gè)因子上的具有最大載荷的變量數(shù)最小,因此可以簡(jiǎn)化對(duì)因子的解釋。斜交旋轉(zhuǎn)(oblique rotation)因子斜交旋轉(zhuǎn)后,各因子負(fù)荷發(fā)生了變化,出現(xiàn)了兩極分化。各因子間不再相互獨(dú)立,而是彼此相關(guān)。各因子對(duì)各變量的貢獻(xiàn)的總和也發(fā)生了改變。因子旋轉(zhuǎn)的目的是使因子負(fù)荷兩極分化,要么接近于0,要么接近于1。從而使原有因子變量更具有可解釋性。5.4 計(jì)算因子變量得分因子變量確定以后,對(duì)于每一個(gè)樣本數(shù)據(jù),我們希望得到它們?cè)诓煌蜃由系木唧w數(shù)據(jù)值,即因子得分。估計(jì)因子得分的方法主要有:回歸法、Bartlette法等。計(jì)算因子得分應(yīng)首先將因子變量表示為原始變量的線性組合。即:回歸法得分是由貝葉斯思想導(dǎo)出的,得到的因子得分是有偏的,但計(jì)算結(jié)果誤差較小。貝葉斯判別思想是根據(jù)先驗(yàn)概率求出后驗(yàn)概率,并依據(jù)后驗(yàn)概率分布作出統(tǒng)計(jì)推斷。Bartlett法:Bartlett因子得分是極大似然估計(jì),得到的因子得分是無(wú)偏的,但計(jì)算結(jié)果誤差較大。5.5 結(jié)果的分析解釋此部分詳細(xì)見操作演示- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 方法 因子分析
鏈接地址:http://m.appdesigncorp.com/p-6651309.html